国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

^{<sup id="zdwth"></sup>}

ChatGPT-4 Vision 催生萬億產(chǎn)業(yè)

2年前作者：高野白分類：Toy博客閱讀(11)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了ChatGPT-4 Vision 催生萬億產(chǎn)業(yè)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

?

（做了多年視覺分析，謹(jǐn)以忐忑的心情寫下本文）

2023年9月25日，微軟發(fā)布ChatGPT-Vision的研究報(bào)告（文章末尾有下載地址），同日openai發(fā)布重要更新：聽，說，看。

2023年10月3日，openai發(fā)布Dall-E3.0。距離ChatGPT獲得全部人類技能，還差觸覺，嗅覺和味覺。

聽，說基于文本，Dall-E有Midjounery大家已經(jīng)熟悉了。今天重點(diǎn)說下Vision，視覺。大家可能低估了這個(gè)更新帶來的颶風(fēng)。

vision是識(shí)別圖片，將圖片化為數(shù)據(jù)（1和0）?；诖竽Ｐ停梢岳斫鈭D片中的內(nèi)容，再結(jié)合ChatGPT自身的數(shù)據(jù)集（所有互聯(lián)網(wǎng)上的人類知識(shí)）。能完成人類做得到和做不到的事?？梢暂敵鑫谋荆Z音和修改后的圖（Dall-E）。

這段時(shí)間，國外網(wǎng)友腦洞大開，嘗試了無數(shù)場景，結(jié)合微軟的報(bào)告。給大家舉例，看看我是不是標(biāo)題黨。

1、教學(xué)

網(wǎng)友Peteryang 使用ChatGPT Vison給學(xué)生演示人體結(jié)構(gòu)，從大腦到心臟都逐一講解。只需要一句話提問：“我現(xiàn)在一年級(jí)。給我解釋一下?！?

?

2、停車

在國外停車牌，有時(shí)候異常復(fù)雜。需要停下來看清楚，才知道自己停去哪里。同樣是Peteryang,拿出手機(jī)拍照，一句話解決：「請(qǐng)一句話告訴我：現(xiàn)在周三下午4點(diǎn)，我能在這停車嗎？」

?

3、飲食健康

網(wǎng)友Mckay Wrigley拍照，要求分析食物中的熱量，蛋白，脂肪等等。再結(jié)合食譜建議，就可以管理起來自己的健康。Mckay Wrigley還要求輸出Json數(shù)據(jù)，可以用來編程。

?

4、故事腳本分析

網(wǎng)友Mckay Wrigley,還讓Vison分析《盜夢空間》的設(shè)計(jì)圖標(biāo)，ChatGPT對(duì)圖表的結(jié)構(gòu)和流程，有深入的理解，可以連貫的拼湊在一起。

?

5、圖片對(duì)照

網(wǎng)友Andrew Morgan，用Vision做圖片對(duì)比，也就是【找不同】的玩法。

?

6、學(xué)術(shù)研究

教授Ethon Mollick 讓Vision識(shí)別手稿，識(shí)別率很高，并且還進(jìn)行了文本推理。

?

7、室內(nèi)設(shè)計(jì)

網(wǎng)友Pietro Schirano拍照，要求Vision 給出設(shè)計(jì)上的建議。發(fā)現(xiàn)其從顏色到觸感都非常出色。

?

8、攝影建議

還是Pietro，要求Vision對(duì)一張照片，給出建議?；貜?fù)看來很專業(yè)，還給出參數(shù)建議。

?

9、看照片說位置

將測試照片的GPS信息去掉，讓VIsion憑一張照片找出位置。

?

?

?

?

10、醫(yī)療-看X片

?

?

?

?

還有很多其他的案例。充分的展示了ChatGPT Vision的能力。我們回答上面的問題，Vision能價(jià)值萬億嗎？隨意展開2個(gè)例子吧。

1、監(jiān)控

所有裝有監(jiān)控的地方，都有識(shí)別的需求。傳統(tǒng)的方式是，先訓(xùn)練，再識(shí)別。標(biāo)注了的能識(shí)別，未標(biāo)注的識(shí)別不了?，F(xiàn)在完全不同了。人類能識(shí)別的，都能識(shí)別。還能推理。

比如，公安系統(tǒng)。小偷進(jìn)去時(shí)候空手，出來多了個(gè)包。在人群里找出來，就是一句話的事情了。

或者一張照片找出嫌犯的位置，就可以不用麻煩水哥了。

交通系統(tǒng)，更具現(xiàn)有人流，車流預(yù)測堵車。識(shí)別安全頭盔等等。做過相關(guān)項(xiàng)目的公司，就明白這里面帶來的沖擊。

2、醫(yī)療

人眼有時(shí)候，受視力和光線的影響，看不清微小的細(xì)節(jié)。同時(shí)，知識(shí)儲(chǔ)備無法和AI相比。用vision看x片，給出所有的細(xì)節(jié)和建議?？赡苁俏磥硭嗅t(yī)生每天都要做的事。

另外，會(huì)診，醫(yī)療事故判定，醫(yī)學(xué)科研，藥物研究，都是不可或缺的。

其他的比如，設(shè)計(jì)，教學(xué)，編程，導(dǎo)游。無法想象它到底可以顛覆多少行業(yè)。

本質(zhì)上，ChatGPT Vision和這么多年來的視覺分析有本質(zhì)的不同。他不需要預(yù)先標(biāo)注訓(xùn)練。其次，他有海量的知識(shí)背景。這讓他無比強(qiáng)大。仿佛上帝視角。

我們拭目以待把。技術(shù)背后的價(jià)值，投資人應(yīng)該更加清楚，萬億是夸張，但誰也無法否定。因?yàn)椴豢晒懒俊?/p>

目前ChatGPT Vision只有北美地區(qū)開放。國內(nèi)想試用ChatGPT的話，給大家推薦我在用的這個(gè)吧。http://www.ppword.cn

手機(jī)上使用，搜索ppword，也可以點(diǎn)擊下方公眾號(hào)。（有個(gè)細(xì)小的行業(yè)，能馬上被顛覆，有興趣的加ppword網(wǎng)站上的群）

微軟測評(píng)報(bào)告下載地址：https://arxiv.org/pdf/2309.17421.pdf?文章來源地址http://www.zghlxwxcb.cn/news/detail-711367.html

到了這里，關(guān)于ChatGPT-4 Vision 催生萬億產(chǎn)業(yè)的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

【計(jì)算機(jī)視覺】Vision Transformer （ViT）詳細(xì)解析
論文地址：An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale code地址：github.com/google-research/vision_transformer Transformer 最早提出是針對(duì)NLP領(lǐng)域的，并且在NLP領(lǐng)域引起了強(qiáng)烈的轟動(dòng)。提出ViT模型的這篇文章題名為《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》
2024年02月04日
瀏覽(25)
我?guī)е?chatGPT 做了 2800 道算法題
學(xué)算法認(rèn)準(zhǔn)? labuladong 后臺(tái)回復(fù)課程查看精品課點(diǎn)擊卡片可搜索文章?? 在線學(xué)習(xí)網(wǎng)站： https://labuladong.github.io/algo/ 老讀者都知道，以前我的算法教程主要使用 Java 語言。但是現(xiàn)在有了 chatGPT 的幫助，《labuladong 的刷題全家桶》已經(jīng)全面支持了 Java/C++/Python/Golang/JavaScript 等所有
2023年04月26日
瀏覽(31)
使用Google Vision API進(jìn)行計(jì)算機(jī)視覺圖像創(chuàng)意分析
介紹計(jì)算機(jī)視覺可以用來從圖像、視頻和音頻中提取有用的信息。它允許計(jì)算機(jī)看到并理解從視覺輸入中可以收集到什么信息。在接收到視覺輸入后，它可以在圖像中收集有價(jià)值的信息，并確定必須采取的下一步。 Google Vision API是一種Google云服務(wù)，它允許使用計(jì)算機(jī)視覺從圖
2024年02月06日
瀏覽(24)
【ChatGPT實(shí)戰(zhàn)】9.使用ChatGPT-+-Midjourney-幫忙做了個(gè)App
在當(dāng)今數(shù)字化的時(shí)代，手機(jī)App已經(jīng)成為人們生活的重要組成部分。開發(fā)一個(gè)優(yōu)秀的手機(jī)App需要付出大量的時(shí)間和精力，特別是在設(shè)計(jì)和開發(fā)階段。但是現(xiàn)在我們可以借助工具和技術(shù)來協(xié)助自己簡化這個(gè)過程。在這篇教程中，我將介紹如何使用ChatGPT和Midjourney來幫助我們開發(fā)一
2024年02月09日
瀏覽(22)
我做了一個(gè) VSCode 插件版的 ChatGPT
大家好，我是風(fēng)箏其實(shí)很早之前就想學(xué)學(xué) VSCode 插件開發(fā)了，但是又不知道做什么，加上我這半吊子前端水平，遲遲沒有動(dòng)手。最近 ChatGPT 火的一塌糊涂，我也一直在用，真的非常好用，有些問題之前需要 Google 搜索，現(xiàn)在用 ChatGPT 基本上都能直接解決，效率提升了不少。
2024年02月03日
瀏覽(25)
【Computer Vision Foundation】全球計(jì)算機(jī)視覺基金會(huì)論文網(wǎng)
計(jì)算機(jī)視覺基金會(huì)（Computer Vision Foundation，簡稱CVF）是一個(gè)致力于推動(dòng)計(jì)算機(jī)視覺領(lǐng)域研究和發(fā)展的組織。以下是關(guān)于計(jì)算機(jī)視覺基金會(huì)的一些基本信息：成立目的： CVF成立的目的是促進(jìn)計(jì)算機(jī)視覺領(lǐng)域的學(xué)術(shù)研究、技術(shù)發(fā)展和知識(shí)交流。該基金會(huì)的工作旨在推動(dòng)計(jì)算機(jī)視覺
2024年02月03日
瀏覽(22)
【多模態(tài)】13、Vision-Language 模型在視覺任務(wù)中的調(diào)研
近來，一種新的學(xué)習(xí)范式 pre-training → Finetuning → Prediction 取得了很大的進(jìn)步，并且在視覺識(shí)別任務(wù)中取得了很好的效果。使用 pretrained 模型來學(xué)習(xí)豐富的知識(shí)，可以加速模型對(duì)下游任務(wù)的收斂速度并且提高效果但是，這種學(xué)習(xí)范式在下游任務(wù)仍然需要很多帶標(biāo)注的數(shù)據(jù)，如
2024年02月17日
瀏覽(27)
將Apple Vision Pro和visionOS與計(jì)算機(jī)視覺結(jié)合使用
在2023年6月5日的WWDC大會(huì)上，蘋果宣布推出多年來最大規(guī)模的硬件和軟件組合產(chǎn)品。今年的“One more thing”（“還有一件事”）發(fā)布是蘋果視覺專業(yè)版（Apple Vision Pro），這是一款集成了蘋果生態(tài)系統(tǒng)的新型空間計(jì)算頭戴式設(shè)備。蘋果視覺專業(yè)版是一個(gè)垂直整合的硬件和軟件平
2024年02月08日
瀏覽(18)
走進(jìn)人工智能| Computer Vision 數(shù)字化時(shí)代的視覺啟示錄
前言：計(jì)算機(jī)視覺是通過模仿人類視覺系統(tǒng)的工作原理，使計(jì)算機(jī)能夠感知、理解和解釋圖像和視頻的能力。 ·計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個(gè)重要分支，它涉及使計(jì)算機(jī)能夠“看”和理解圖像和視頻的能力。通過模仿人類視覺系統(tǒng)的工作原理，計(jì)算機(jī)視覺旨在開發(fā)算法
2024年02月08日
瀏覽(21)
【論文閱讀】Vision Mamba:雙向狀態(tài)空間模型的的高效視覺表示學(xué)習(xí)
論文地址： Vision Mamba 在這篇文章，我們展示對(duì)于視覺表示學(xué)習(xí)，不再依賴自注意力，提出一個(gè)新的泛用的視覺backbone基于雙向Mamba塊，通過位置嵌入來標(biāo)示圖片序列，通過雙向狀態(tài)空間模型壓縮視覺表示。結(jié)果表示，Vim有能力解決在高分辨率圖片上應(yīng)用tranformer類型所導(dǎo)致計(jì)算
2024年03月21日
瀏覽(28)

<label id="fpu3g"><strong id="fpu3g"></strong></label>

<pre id="fpu3g"><em id="fpu3g"></em></pre>

<dfn id="fpu3g"><strong id="fpu3g"></strong></dfn><tr id="fpu3g"></tr>