国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

MiniGPT-4開源了:看圖聊天、教學(xué)、創(chuàng)作、搭網(wǎng)站

這篇具有很好參考價(jià)值的文章主要介紹了MiniGPT-4開源了:看圖聊天、教學(xué)、創(chuàng)作、搭網(wǎng)站。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

服務(wù)器系列



前言

一個(gè)月前,OpenAI 總裁 Greg Brockman 向世人展示了 GPT-4 令人驚訝的多模態(tài)能力,如從手寫文本直接生成網(wǎng)站和識(shí)別圖像中的幽默元素等。

盡管目前 OpenAI 暫未對(duì) GPT-4 用戶開放這一能力,但具有多模態(tài)能力的視覺語(yǔ)言模型令人充滿了想象力。

近日,來(lái)自阿卜杜拉國(guó)王科技大學(xué)的研究團(tuán)隊(duì),便提出了一個(gè)具有類似 GPT-4 圖像理解與對(duì)話能力的 AI 大模型——MiniGPT-4,并將其開源。

據(jù)介紹,MiniGPT-4 具有出色的多模態(tài)能力,如從手寫草稿創(chuàng)建網(wǎng)站、生成詳細(xì)的圖像描述、根據(jù)圖像創(chuàng)作故事和詩(shī)歌、為圖像中描述的問題提供解決方案,以及根據(jù)食物照片教對(duì)話對(duì)象如何烹飪一道美味的菜品等。

MiniGPT4

MiniGPT4 是來(lái)自阿布杜拉國(guó)王科技大學(xué)的幾位博士做的,它能夠提供類似于GPT4的圖像理解,以及對(duì)話的能力,搶先一步感受圖像對(duì)話的強(qiáng)大之處。那我們先來(lái)看一下它的演示視頻,這個(gè)項(xiàng)目有幾個(gè)特點(diǎn):

第一就是多模態(tài) 也就是能夠讀懂圖片 在這個(gè)示例中呢 它可以回答圖片是關(guān)于什么內(nèi)容的 有多少種顏色甚至能夠說(shuō)明這個(gè)圖片是屬于什么風(fēng)格的。GPT-4 先進(jìn)的多模態(tài)生成能力的主要原因在于使用了更先進(jìn)的大型語(yǔ)言模型 (LLM)。MiniGPT-4,它僅使用一個(gè)投影層將凍結(jié)的視覺編碼器與凍結(jié)的 LLM Vicuna 對(duì)齊。我們的研究結(jié)果表明,MiniGPT-4 擁有許多類似于 GPT-4 所展示的功能,例如詳細(xì)的圖像描述生成和從手寫草稿創(chuàng)建網(wǎng)站。此外,我們還觀察到 MiniGPT-4 中的其他新興功能,包括根據(jù)給定的圖像寫故事和詩(shī)歌,為圖像中顯示的問題提供解決方案,教用戶如何根據(jù)食物照片做飯等。

第二點(diǎn) 高級(jí)大型語(yǔ)言模型,增強(qiáng)視覺語(yǔ)言理解。

第三點(diǎn) 低成本,僅僅用了4塊的A100GPU, 訓(xùn)練了僅僅10個(gè)小時(shí),絕對(duì)稱得上是迷你。

第四點(diǎn)就是整個(gè)項(xiàng)目是開源的。
MiniGPT-4開源了:看圖聊天、教學(xué)、創(chuàng)作、搭網(wǎng)站
它使用了更先進(jìn)的大模型語(yǔ)言,也就是說(shuō)未來(lái)在圖像聲音視頻等等領(lǐng)域呢,基于這些大模型所制造出來(lái)的應(yīng)用 ,實(shí)際的效果呢應(yīng)該都不會(huì)太差。 這個(gè)項(xiàng)目也證實(shí)了 ,大語(yǔ)言模型在圖像領(lǐng)域的可行性。 接下來(lái)呢相信應(yīng)該會(huì)有不少的開發(fā)者跑步入場(chǎng) ,將GPT4的能力進(jìn)一步的往音頻視頻等等領(lǐng)域延伸, 讓我們可以看到更多有趣令人驚艷的AI應(yīng)用程序。

試用地址:https://3228d8146e5c39b4be.gradio.live/

效果展示

MiniGPT-4開源了:看圖聊天、教學(xué)、創(chuàng)作、搭網(wǎng)站
MiniGPT-4開源了:看圖聊天、教學(xué)、創(chuàng)作、搭網(wǎng)站
MiniGPT-4開源了:看圖聊天、教學(xué)、創(chuàng)作、搭網(wǎng)站
MiniGPT-4開源了:看圖聊天、教學(xué)、創(chuàng)作、搭網(wǎng)站
在技術(shù)層面上,MiniGPT-4 由一個(gè)帶有預(yù)訓(xùn)練的 ViT 和 Q-Former 的視覺編碼器、一個(gè)單一的線性投影層和一個(gè) Vicuna 大語(yǔ)言模型組成。而且,MiniGPT-4 只需要訓(xùn)練線性層,使視覺特征與 Vicuna 保持一致。

有 Y Combinator 用戶這樣評(píng)價(jià) MiniGPT-4,“在技術(shù)層面上,他們正在做一些非常簡(jiǎn)單的事情…但結(jié)果非常驚人。最重要的是,它在 OpenAI 的 GPT-4 圖像模態(tài)之前出現(xiàn)。(這是)開源 AI 的真正勝利。”

也有用戶表示,“我認(rèn)為他們?yōu)橐粋€(gè)不相關(guān)的項(xiàng)目使用 GPT-4 名稱是一種糟糕的形式。畢竟,底層的 Vicuna 只是一個(gè)微調(diào)的 LLaMA。另外,他們使用了較小的 13B 版本。然而,結(jié)果看起來(lái)很有趣。”

項(xiàng)目地址:
https://minigpt-4.github.io/

GitHub地址:
https://github.com/Vision-CAIR/MiniGPT-4文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-429077.html

到了這里,關(guān)于MiniGPT-4開源了:看圖聊天、教學(xué)、創(chuàng)作、搭網(wǎng)站的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • MiniGPT4,開源了。

    MiniGPT4,開源了。

    大家好,我是 Jack。 ? 一個(gè)月前,我發(fā)布過一篇文章,講解了 GPT4 的發(fā)布會(huì)。 ChatGPT 的對(duì)話能力,想必大家也早已體驗(yàn)過了,無(wú)論是文本生成能力,還是寫代碼的能力,甚至是上下文的關(guān)聯(lián)對(duì)話能力,無(wú)不一次又一次地震撼著我們。 你還記不記得發(fā)布會(huì)上,GPT4 的多模態(tài)能力

    2023年04月26日
    瀏覽(32)
  • MiniGPT-4,開源了!

    MiniGPT-4,開源了!

    上個(gè)月GPT-4發(fā)布時(shí),我曾寫過一篇文章分享過有關(guān)GPT-4的幾個(gè)關(guān)鍵信息。 當(dāng)時(shí)的分享就提到了GPT-4的一個(gè)重要特性,那就是 多模態(tài)能力 。 比如發(fā)布會(huì)上演示的,輸入一幅圖(手套掉下去會(huì)怎么樣?)。 GPT-4可以理解并輸出給到:它會(huì)掉到木板上,并且球會(huì)被彈飛。 再比如給

    2024年02月01日
    瀏覽(18)
  • MiniGPT4,開源了

    MiniGPT4,開源了

    MiniGPT-4 旨在將來(lái)自預(yù)訓(xùn)練視覺編碼器的視覺信息與先進(jìn)的大型語(yǔ)言模型 (LLM) 對(duì)齊。 具體來(lái)說(shuō),在文本方面,作者利用 Vicuna 作為語(yǔ)言解碼器,在視覺感知方面,使用了與BLIP-2相同的視覺編碼器,并且語(yǔ)言和視覺模型都是開源的。本文的主要目標(biāo)就是使用線性映射層來(lái)彌合視

    2023年04月23日
    瀏覽(24)
  • GPT-4平替版:MiniGPT-4,支持圖像理解和對(duì)話,現(xiàn)已開源

    GPT-4平替版:MiniGPT-4,支持圖像理解和對(duì)話,現(xiàn)已開源

    項(xiàng)目地址 :https://minigpt-4.github.io/? 論文鏈接 :https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf 代碼 :https://github.com/Vision-CAIR/MiniGPT-4 視頻 :https://youtu.be/__tftoxpBAw 數(shù)據(jù)集 :https://drive.google.com/file/d/1nJXhoEcy3KTExr17I7BXqY5Y9Lx_-n-9/view Demo地址 :https://6b89c70eb5e14dca33.gradio.live/ Demo備

    2024年02月06日
    瀏覽(25)
  • Chat GPT 使用教學(xué),文字創(chuàng)作、學(xué)習(xí)

    私 信 我,獲 取 c h a t g p t 賬 號(hào),并 手 把 手 帶 你 提 升 工 作 學(xué) 習(xí) 效 率。 大綱、目錄、標(biāo)題、內(nèi)容 寫出10個(gè)即將被AI取代的工作的文章標(biāo)題

    2024年02月09日
    瀏覽(20)
  • GPT-4開源平替miniGPT-4來(lái)了,僅需23G顯存單機(jī)可run,附論文、項(xiàng)目代碼地址

    GPT-4開源平替miniGPT-4來(lái)了,僅需23G顯存單機(jī)可run,附論文、項(xiàng)目代碼地址

    來(lái)源?|?新智元? 微信號(hào):AI-era 先是ChatGPT的發(fā)布給世界帶來(lái)了一點(diǎn)小小的NLP震撼,隨后發(fā)布的GPT-4更是破圈計(jì)算機(jī)視覺,展現(xiàn)了非凡的多模態(tài)能力。 不光能讀懂人類的梗,給個(gè)手繪草圖甚至可以直接寫出網(wǎng)站的代碼,徹底顛覆了對(duì)語(yǔ)言模型、視覺模型能力邊界的認(rèn)知。 GPT-

    2024年02月01日
    瀏覽(24)
  • MiniGPT-4開源了,史無(wú)前例的AI圖片內(nèi)容分析,甚至能用于邏輯驗(yàn)證碼推理識(shí)別

    MiniGPT-4開源了,史無(wú)前例的AI圖片內(nèi)容分析,甚至能用于邏輯驗(yàn)證碼推理識(shí)別

    https://github.com/Vision-CAIR/MiniGPT-4 https://minigpt-4.github.io/ 出結(jié)果較慢,建議圖片小一點(diǎn),并且提示文字盡可能簡(jiǎn)短 The man in the image is wearing a white tank top and shorts. He is standing on a rocky cliff overlooking a body of water with mountains in the background. The man is holding a cell phone in his hand and appears to

    2024年02月08日
    瀏覽(23)
  • 自適應(yīng)AI chatgpt智能聊天創(chuàng)作官網(wǎng)html源碼

    自適應(yīng)AI chatgpt智能聊天創(chuàng)作官網(wǎng)html源碼

    我們致力于開發(fā)先進(jìn)的自適應(yīng)AI智能聊天技術(shù),旨在為用戶提供前所未有的聊天體驗(yàn)。通過融合自然語(yǔ)言處理、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域的頂尖技術(shù),我們的智能聊天系統(tǒng)能夠準(zhǔn)確理解用戶的需求并給出相應(yīng)的回應(yīng)。 我們的自適應(yīng)AI智能聊天系統(tǒng)具備以下核心特點(diǎn): 智能理

    2024年02月12日
    瀏覽(17)
  • 基于TCP協(xié)議的聊天室詳細(xì)教學(xué)(C++)

    基于TCP協(xié)議的聊天室詳細(xì)教學(xué)(C++)

    服務(wù)器只轉(zhuǎn)發(fā)消息不參到信息交流中 客戶端輸入用戶名后默認(rèn)進(jìn)入群聊模式,輸入“獲取用戶列表”可以獲取在線用戶用戶名列表,如果需要私聊某一個(gè)用戶需要輸入“私聊+用戶名”可進(jìn)入私聊模式,輸入“退出私聊”可退出私聊重新進(jìn)入群聊模式。 基本群聊展示 獲取用戶

    2024年02月08日
    瀏覽(23)
  • 《MidJourney零基礎(chǔ)教學(xué):在線提示詞查詢字典》:為你的創(chuàng)作之路增添更多的驚喜和樂趣

    《MidJourney零基礎(chǔ)教學(xué):在線提示詞查詢字典》:為你的創(chuàng)作之路增添更多的驚喜和樂趣

    作為一個(gè)創(chuàng)作者,我們時(shí)常會(huì)遇到靈感枯竭的情況。在這種時(shí)候,《MidJourney零基礎(chǔ)教學(xué):在線提示詞查詢字典》就像一個(gè)魔法寶盒,可以給我們帶來(lái)更多的驚喜和樂趣!無(wú)論你是小白還是老手,在創(chuàng)作中使用《MidJourney零基礎(chǔ)教學(xué):在線提示詞查詢字典》都能快速提升你的表

    2024年02月17日
    瀏覽(28)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包