国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

ChatGPT-4 Vision 催生萬億產(chǎn)業(yè)

這篇具有很好參考價(jià)值的文章主要介紹了ChatGPT-4 Vision 催生萬億產(chǎn)業(yè)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

?

(做了多年視覺分析,謹(jǐn)以忐忑的心情寫下本文)

2023年9月25日,微軟發(fā)布ChatGPT-Vision的研究報(bào)告(文章末尾有下載地址),同日openai發(fā)布重要更新:聽,說,看。

2023年10月3日,openai發(fā)布Dall-E3.0。距離ChatGPT獲得全部人類技能,還差觸覺,嗅覺和味覺。

聽,說基于文本,Dall-E有Midjounery大家已經(jīng)熟悉了。今天重點(diǎn)說下Vision,視覺。大家可能低估了這個(gè)更新帶來的颶風(fēng)。

vision是識(shí)別圖片,將圖片化為數(shù)據(jù)(1和0)?;诖竽P停梢岳斫鈭D片中的內(nèi)容,再結(jié)合ChatGPT自身的數(shù)據(jù)集(所有互聯(lián)網(wǎng)上的人類知識(shí))。能完成人類做得到和做不到的事??梢暂敵鑫谋荆Z音和修改后的圖(Dall-E)。

這段時(shí)間,國外網(wǎng)友腦洞大開,嘗試了無數(shù)場景,結(jié)合微軟的報(bào)告。給大家舉例,看看我是不是標(biāo)題黨。

1、教學(xué)

網(wǎng)友Peteryang 使用ChatGPT Vison給學(xué)生演示人體結(jié)構(gòu),從大腦到心臟都逐一講解。只需要一句話提問:“我現(xiàn)在一年級(jí)。給我解釋一下?!?

?

2、停車

在國外停車牌,有時(shí)候異常復(fù)雜。需要停下來看清楚,才知道自己停去哪里。同樣是Peteryang,拿出手機(jī)拍照,一句話解決「請(qǐng)一句話告訴我:現(xiàn)在周三下午4點(diǎn), 我能在這停車嗎?」

?

3、飲食健康

網(wǎng)友Mckay Wrigley拍照,要求分析食物中的熱量,蛋白,脂肪等等。再結(jié)合食譜建議,就可以管理起來自己的健康。Mckay Wrigley還要求輸出Json數(shù)據(jù),可以用來編程。

?

4、故事腳本分析

網(wǎng)友Mckay Wrigley,還讓Vison分析《盜夢空間》的設(shè)計(jì)圖標(biāo),ChatGPT對(duì)圖表的結(jié)構(gòu)和流程,有深入的理解,可以連貫的拼湊在一起。

?

5、圖片對(duì)照

網(wǎng)友Andrew Morgan,用Vision做圖片對(duì)比,也就是【找不同】的玩法。

?

6、學(xué)術(shù)研究

教授Ethon Mollick 讓Vision識(shí)別手稿,識(shí)別率 很高,并且還進(jìn)行了文本推理。

?

7、室內(nèi)設(shè)計(jì)

網(wǎng)友Pietro Schirano拍照,要求Vision 給出設(shè)計(jì)上的建議。發(fā)現(xiàn)其從顏色到觸感都非常出色。

?

8、攝影建議

還是Pietro,要求Vision對(duì)一張照片,給出建議?;貜?fù)看來很專業(yè),還給出參數(shù)建議。

?

9、看照片說位置

將測試照片的GPS信息去掉,讓VIsion憑一張照片找出位置。

?

?

?

?

10、醫(yī)療-看X片

?

?

?

?

還有很多其他的案例。充分的展示了ChatGPT Vision的能力。我們回答上面的問題,Vision能價(jià)值萬億嗎?隨意展開2個(gè)例子吧。

1、監(jiān)控

所有裝有監(jiān)控的地方,都有識(shí)別的需求。傳統(tǒng)的方式是,先訓(xùn)練,再識(shí)別。標(biāo)注了的能識(shí)別,未標(biāo)注的識(shí)別不了?,F(xiàn)在完全不同了。人類能識(shí)別的,都能識(shí)別。還能推理。

比如,公安系統(tǒng)。小偷進(jìn)去時(shí)候空手,出來多了個(gè)包。在人群里找出來,就是一句話的事情了。

或者一張照片找出嫌犯的位置,就可以不用麻煩水哥了。

交通系統(tǒng),更具現(xiàn)有人流,車流預(yù)測堵車。識(shí)別安全頭盔等等。做過相關(guān)項(xiàng)目的公司,就明白這里面帶來的沖擊。

2、醫(yī)療

人眼有時(shí)候,受視力和光線的影響,看不清微小的細(xì)節(jié)。同時(shí),知識(shí)儲(chǔ)備無法和AI相比。用vision看x片,給出所有的細(xì)節(jié)和建議??赡苁俏磥硭嗅t(yī)生每天都要做的事。

另外,會(huì)診,醫(yī)療事故判定,醫(yī)學(xué)科研,藥物研究,都是不可或缺的。

其他的比如,設(shè)計(jì),教學(xué),編程,導(dǎo)游。無法想象它到底可以顛覆多少行業(yè)。

本質(zhì)上,ChatGPT Vision和這么多年來的視覺分析有本質(zhì)的不同。他不需要預(yù)先標(biāo)注訓(xùn)練。其次,他有海量的知識(shí)背景。這讓他無比強(qiáng)大。仿佛上帝視角。

我們拭目以待把。技術(shù)背后的價(jià)值,投資人應(yīng)該更加清楚,萬億是夸張,但誰也無法否定。因?yàn)椴豢晒懒俊?/p>

目前ChatGPT Vision只有北美地區(qū)開放。國內(nèi)想試用ChatGPT的話,給大家推薦我在用的這個(gè)吧。http://www.ppword.cn

手機(jī)上使用,搜索ppword,也可以點(diǎn)擊下方公眾號(hào)。(有個(gè)細(xì)小的行業(yè),能馬上被顛覆,有興趣的加ppword網(wǎng)站上的群)

微軟測評(píng)報(bào)告下載地址:https://arxiv.org/pdf/2309.17421.pdf?文章來源地址http://www.zghlxwxcb.cn/news/detail-711367.html

到了這里,關(guān)于ChatGPT-4 Vision 催生萬億產(chǎn)業(yè)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 【計(jì)算機(jī)視覺】Vision Transformer (ViT)詳細(xì)解析

    【計(jì)算機(jī)視覺】Vision Transformer (ViT)詳細(xì)解析

    論文地址:An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale code地址:github.com/google-research/vision_transformer Transformer 最早提出是針對(duì)NLP領(lǐng)域的,并且在NLP領(lǐng)域引起了強(qiáng)烈的轟動(dòng)。 提出ViT模型的這篇文章題名為 《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》

    2024年02月04日
    瀏覽(25)
  • 我?guī)е?chatGPT 做了 2800 道算法題

    我?guī)е?chatGPT 做了 2800 道算法題

    學(xué)算法認(rèn)準(zhǔn)? labuladong 后臺(tái)回復(fù)課程 查看精品課 點(diǎn)擊卡片可搜索文章?? 在線學(xué)習(xí)網(wǎng)站: https://labuladong.github.io/algo/ 老讀者都知道,以前我的算法教程主要使用 Java 語言。但是現(xiàn)在有了 chatGPT 的幫助,《labuladong 的刷題全家桶》已經(jīng)全面支持了 Java/C++/Python/Golang/JavaScript 等所有

    2023年04月26日
    瀏覽(31)
  • 使用Google Vision API進(jìn)行計(jì)算機(jī)視覺圖像創(chuàng)意分析

    使用Google Vision API進(jìn)行計(jì)算機(jī)視覺圖像創(chuàng)意分析

    介紹 計(jì)算機(jī)視覺可以用來從圖像、視頻和音頻中提取有用的信息。它允許計(jì)算機(jī)看到并理解從視覺輸入中可以收集到什么信息。在接收到視覺輸入后,它可以在圖像中收集有價(jià)值的信息,并確定必須采取的下一步。 Google Vision API是一種Google云服務(wù),它允許使用計(jì)算機(jī)視覺從圖

    2024年02月06日
    瀏覽(24)
  • 【ChatGPT實(shí)戰(zhàn)】9.使用ChatGPT-+-Midjourney-幫忙做了個(gè)App

    【ChatGPT實(shí)戰(zhàn)】9.使用ChatGPT-+-Midjourney-幫忙做了個(gè)App

    在當(dāng)今數(shù)字化的時(shí)代,手機(jī)App已經(jīng)成為人們生活的重要組成部分。開發(fā)一個(gè)優(yōu)秀的手機(jī)App需要付出大量的時(shí)間和精力,特別是在設(shè)計(jì)和開發(fā)階段。但是現(xiàn)在我們可以借助工具和技術(shù)來協(xié)助自己簡化這個(gè)過程。 在這篇教程中,我將介紹如何使用ChatGPT和Midjourney來幫助我們開發(fā)一

    2024年02月09日
    瀏覽(22)
  • 我做了一個(gè) VSCode 插件版的 ChatGPT

    我做了一個(gè) VSCode 插件版的 ChatGPT

    大家好,我是風(fēng)箏 其實(shí)很早之前就想學(xué)學(xué) VSCode 插件開發(fā)了,但是又不知道做什么,加上我這半吊子前端水平,遲遲沒有動(dòng)手。 最近 ChatGPT 火的一塌糊涂,我也一直在用,真的非常好用,有些問題之前需要 Google 搜索,現(xiàn)在用 ChatGPT 基本上都能直接解決,效率提升了不少。

    2024年02月03日
    瀏覽(25)
  • 【Computer Vision Foundation】全球計(jì)算機(jī)視覺基金會(huì)論文網(wǎng)

    【Computer Vision Foundation】全球計(jì)算機(jī)視覺基金會(huì)論文網(wǎng)

    計(jì)算機(jī)視覺基金會(huì)(Computer Vision Foundation,簡稱CVF)是一個(gè)致力于推動(dòng)計(jì)算機(jī)視覺領(lǐng)域研究和發(fā)展的組織。以下是關(guān)于計(jì)算機(jī)視覺基金會(huì)的一些基本信息: 成立目的: CVF成立的目的是促進(jìn)計(jì)算機(jī)視覺領(lǐng)域的學(xué)術(shù)研究、技術(shù)發(fā)展和知識(shí)交流。該基金會(huì)的工作旨在推動(dòng)計(jì)算機(jī)視覺

    2024年02月03日
    瀏覽(22)
  • 【多模態(tài)】13、Vision-Language 模型在視覺任務(wù)中的調(diào)研

    【多模態(tài)】13、Vision-Language 模型在視覺任務(wù)中的調(diào)研

    近來,一種新的學(xué)習(xí)范式 pre-training → Finetuning → Prediction 取得了很大的進(jìn)步,并且在視覺識(shí)別任務(wù)中取得了很好的效果。 使用 pretrained 模型來學(xué)習(xí)豐富的知識(shí),可以加速模型對(duì)下游任務(wù)的收斂速度并且提高效果 但是,這種學(xué)習(xí)范式在下游任務(wù)仍然需要很多帶標(biāo)注的數(shù)據(jù),如

    2024年02月17日
    瀏覽(27)
  • 將Apple Vision Pro和visionOS與計(jì)算機(jī)視覺結(jié)合使用

    將Apple Vision Pro和visionOS與計(jì)算機(jī)視覺結(jié)合使用

    在2023年6月5日的WWDC大會(huì)上,蘋果宣布推出多年來最大規(guī)模的硬件和軟件組合產(chǎn)品。今年的“One more thing”(“還有一件事”)發(fā)布是蘋果視覺專業(yè)版(Apple Vision Pro),這是一款集成了蘋果生態(tài)系統(tǒng)的新型空間計(jì)算頭戴式設(shè)備。 蘋果視覺專業(yè)版是一個(gè)垂直整合的硬件和軟件平

    2024年02月08日
    瀏覽(18)
  • 走進(jìn)人工智能| Computer Vision 數(shù)字化時(shí)代的視覺啟示錄

    走進(jìn)人工智能| Computer Vision 數(shù)字化時(shí)代的視覺啟示錄

    前言: 計(jì)算機(jī)視覺是通過模仿人類視覺系統(tǒng)的工作原理,使計(jì)算機(jī)能夠感知、理解和解釋圖像和視頻的能力。 ·計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個(gè)重要分支,它涉及使計(jì)算機(jī)能夠“看”和理解圖像和視頻的能力。 通過模仿人類視覺系統(tǒng)的工作原理,計(jì)算機(jī)視覺旨在開發(fā)算法

    2024年02月08日
    瀏覽(21)
  • 【論文閱讀】Vision Mamba:雙向狀態(tài)空間模型的的高效視覺表示學(xué)習(xí)

    【論文閱讀】Vision Mamba:雙向狀態(tài)空間模型的的高效視覺表示學(xué)習(xí)

    論文地址: Vision Mamba 在這篇文章,我們展示對(duì)于視覺表示學(xué)習(xí),不再依賴自注意力,提出一個(gè)新的泛用的視覺backbone基于雙向Mamba塊,通過位置嵌入來標(biāo)示圖片序列,通過雙向狀態(tài)空間模型壓縮視覺表示。結(jié)果表示,Vim有能力解決在高分辨率圖片上應(yīng)用tranformer類型所導(dǎo)致計(jì)算

    2024年03月21日
    瀏覽(28)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包