国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Chatgpt論文筆記——MiNiGPT4解讀

2年前作者：只會git clone的程序員分類：Toy博客閱讀(31)違法舉報

這篇具有很好參考價值的文章主要介紹了Chatgpt論文筆記——MiNiGPT4解讀。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

前言

代碼地址：https://github.com/Vision-CAIR/MiniGPT-4

摘要

Chatgpt論文筆記——MiNiGPT4解讀,ChatGPT系列論文解讀,chatgpt,論文閱讀,人工智能
摘要寫的就很簡單了，標(biāo)黃的是重點，可以看到這個方法很簡單，就是拿了一個視覺的encoder（Blip-2）以及拿了一個文本的encoder（Vicuna），最后外加上一個projection層就構(gòu)成了MiniGPT4，并且在訓(xùn)練的時候視覺和文本的encoder都是凍結(jié)參數(shù)的，所以相當(dāng)于只是拿視覺和文本的編碼器來用，訓(xùn)練只訓(xùn)外加的projection層。

方法

Chatgpt論文筆記——MiNiGPT4解讀,ChatGPT系列論文解讀,chatgpt,論文閱讀,人工智能
方法就是說了視覺編碼器用的Blip-2，他是由vit+q-former構(gòu)成的。文本用的是vicuna，基于LLaMA設(shè)計的。就當(dāng)作文本和圖像的backbone就好了，具體細(xì)節(jié)可以不看，基本就是transformer的結(jié)構(gòu)。
然后就介紹了訓(xùn)練的細(xì)節(jié)，訓(xùn)練分了兩個階段，第一階段預(yù)訓(xùn)練用的是500w的圖文對訓(xùn)模型，并且視覺和文本的encoder都是凍結(jié)參數(shù)的，第二階段用精修的數(shù)據(jù)集3500條圖文對精調(diào)模型參數(shù)。

第一階段預(yù)訓(xùn)練

Chatgpt論文筆記——MiNiGPT4解讀,ChatGPT系列論文解讀,chatgpt,論文閱讀,人工智能
沒啥可說的，介紹了下訓(xùn)練的參數(shù)，用了4張A100訓(xùn)500w圖文對的數(shù)據(jù)，訓(xùn)了10個小時。第一階段訓(xùn)練完作者測試模型發(fā)現(xiàn)模型生成的文本有很多重復(fù)的，不完整的，沒有邏輯的句子，對人類來說閱讀是十分不友好的，所以有了第二階段的精調(diào)。

第二階段訓(xùn)練

數(shù)據(jù)構(gòu)建

第二階段的主要目的是用高質(zhì)量的圖文對數(shù)據(jù)來消除視覺和語言的領(lǐng)域差異，通俗點說就是讓模型說的話更加的人類可讀。
構(gòu)建精修數(shù)據(jù)集的具體做法如下：

一：從Conceptual Caption dataset隨機選擇了5000個數(shù)據(jù)
二：用一階段訓(xùn)練的模型對這些數(shù)據(jù)做提問生成答案。
- 提問的prompt：###Human: Describe this image in detail. Give as many details as possible. Say everything you see. ###Assistant:
- 如果回答的內(nèi)容少于80個單詞（論文寫的token感覺應(yīng)該差不多意思），就追問，追問的prompt是：###Human: Continue ###Assistant:
- 然后拼接得到最后的回答，這個回答是詳細(xì)的圖像的描述。
三：這樣生成的描述還是存在噪聲以及錯誤的回答（重復(fù)的回答，不連貫的回答），接下來用chatgpt來修正這些回答：
- 輸入給chatgpt的提示詞為：Fix the error in the given paragraph. Remove any repeating sentences, meaningless characters, not English sentences, and so on. Remove unnecessary repetition. Rewrite any incomplete sentences. Return directly the results without explanation. Return directly the input paragraph if it is already correct without explanation.
四：人工驗證圖像描述的正確性并且有些chatgpt無法檢測的冗余句子也人工修正。最后從5000里面精挑了3500條。

fintune

Chatgpt論文筆記——MiNiGPT4解讀,ChatGPT系列論文解讀,chatgpt,論文閱讀,人工智能
finetune就比較簡單了，拿3500條精修的數(shù)據(jù)直接finetune就好了，輸入的模版是###Human: ###Assistant:
訓(xùn)練的機器是一張A100，batch size12，跑了400個step。

最后

MiNiGPT4安裝記錄：MiNiGPT4安裝記錄文章來源地址http://www.zghlxwxcb.cn/news/detail-653967.html

到了這里，關(guān)于Chatgpt論文筆記——MiNiGPT4解讀的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

[論文筆記] chatgpt系列 2.1 DeepSpeed-chat 簡介
DeepSpeedExamples/applications/DeepSpeed-Chat at master · microsoft/DeepSpeedExamples · GitHub ?? DeepSpeed-Chat:簡單，快速和負(fù)擔(dān)得起的RLHF訓(xùn)練的類chatgpt模型 ?? 一個快速、經(jīng)濟、可擴展和開放的系統(tǒng)框架，用于實現(xiàn)端到端的強化學(xué)習(xí)人類反饋(RLHF)訓(xùn)練體驗，以在所有尺度上生成高質(zhì)量的類chat
2024年02月09日
瀏覽(16)
MiniGPT4，開源了
MiniGPT-4 旨在將來自預(yù)訓(xùn)練視覺編碼器的視覺信息與先進的大型語言模型 (LLM) 對齊。具體來說，在文本方面，作者利用 Vicuna 作為語言解碼器，在視覺感知方面，使用了與BLIP-2相同的視覺編碼器，并且語言和視覺模型都是開源的。本文的主要目標(biāo)就是使用線性映射層來彌合視
2023年04月23日
瀏覽(23)
MiniGPT4，開源了。
大家好，我是 Jack。 ? 一個月前，我發(fā)布過一篇文章，講解了 GPT4 的發(fā)布會。 ChatGPT 的對話能力，想必大家也早已體驗過了，無論是文本生成能力，還是寫代碼的能力，甚至是上下文的關(guān)聯(lián)對話能力，無不一次又一次地震撼著我們。你還記不記得發(fā)布會上，GPT4 的多模態(tài)能力
2023年04月26日
瀏覽(32)
[論文筆記] chatgpt系列 1.1 PPO算法(Proximal Policy Optimization)
Proximal Policy Optimization (PPO) ????????避免較多的策略更新。根據(jù)經(jīng)驗，訓(xùn)練期間較小的策略更新更有可能收斂到最優(yōu)解決方案。在策略更新中，太大的一步可能會導(dǎo)致“掉下懸崖”(得到一個糟糕的策略)，并且有很長時間甚至沒有可能恢復(fù)。 ????????所以在PPO中，我們
2024年02月03日
瀏覽(22)
minigpt4搭建過程記錄，簡單體驗圖文識別樂趣
從3月開始，aigc進入了瘋狂的開端，正如4月12日無界 AI直播在《探索 AIGC 與人類合作的無限可能》中關(guān)于梳理的時間線一樣，aigc的各種產(chǎn)品如雨后春筍般進入了不可逆的態(tài)勢，里面有句話很形象，人間一日，AIGC十年。這產(chǎn)變革像是有計劃性的滄海桑田，讓每個參與者亦或者
2024年02月05日
瀏覽(25)
MiniGPT4 在RTX-3090 Ubuntu服務(wù)器部署步驟詳解
MiniGPT4系列之一部署篇：在RTX-3090 Ubuntu服務(wù)器部署步驟詳解_seaside2003的博客-CSDN博客 MiniGPT4系列之二推理篇命令行方式：在RTX-3090 Ubuntu服務(wù)器推理詳解_seaside2003的博客-CSDN博客 MiniGPT4系列之三模型推理 (Web UI)：在RTX-3090 Ubuntu服務(wù)器推理_seaside2003的博客-CSDN博客主要參考知乎帖子
2024年02月15日
瀏覽(44)
讓chatgpt解讀自己--(GPT1/2/3/4)論文解讀
用chatgpt解釋chagpt自己的實現(xiàn)原理和機制，是一種什么體驗？這篇文章的Abstract部分主要介紹了Generative Pre-Training方法的研究背景、目標(biāo)和貢獻。具體來說，Abstract部分包括以下幾個方面：研究背景：首先，Abstract部分介紹了自然語言理解領(lǐng)域中的一個重要問題，即如何在缺乏
2024年02月01日
瀏覽(19)
ChatGPT2論文解讀《Language Models are Unsupervised Multitask Learners》（2019）
以下是我閱讀完整篇論文做的個人總結(jié)，包含了ChatGPT-2文章的主要內(nèi)容，可以僅看【論文總結(jié)】章節(jié)。數(shù)據(jù)集自制了一個網(wǎng)頁爬蟲，被抓取的網(wǎng)頁部分來自于社交平臺，這些網(wǎng)頁由人工進行過濾。最終生成 WebText數(shù)據(jù)集，包含45000000個鏈接。另一部分來自于新聞網(wǎng)站，數(shù)據(jù)截
2024年02月08日
瀏覽(28)
手搓GPT系列之 - chatgpt + langchain 實現(xiàn)一個書本解讀機器人
ChatGPT已經(jīng)威名遠(yuǎn)播，關(guān)于如何使用大模型來構(gòu)建應(yīng)用還處于十分前期的探索階段。各種基于大模型的應(yīng)用技術(shù)也層出不窮。本文將給大家介紹一款基于大模型的應(yīng)用框架：langchain。langchain集成了做一個基于大模型應(yīng)用所需的一切。熟悉java web應(yīng)用的同學(xué)們應(yīng)該十分熟悉spring
2024年02月05日
瀏覽(18)
【YOLO系列】YOLOv3論文超詳細(xì)解讀（翻譯＋學(xué)習(xí)筆記）
YOLOv3（《Yolov3:An incremental improvement》）是Joseph Redmon大佬關(guān)于YOLO系列的最后一篇，由于他反對將YOLO用于軍事和隱私窺探，2020年2月宣布停止更新YOLO。 ?YOLOv3在YOLOv2的基礎(chǔ)上改良了網(wǎng)絡(luò)的主干，利用多尺度特征圖進行檢測，改進了多個獨立的Logistic regression分類器來取代softmax來
2024年02月07日
瀏覽(32)