国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

微軟、OpenAI用上“數(shù)據(jù)永動(dòng)機(jī)” 合成數(shù)據(jù)是晨曦還是暮光?

這篇具有很好參考價(jià)值的文章主要介紹了微軟、OpenAI用上“數(shù)據(jù)永動(dòng)機(jī)” 合成數(shù)據(jù)是晨曦還是暮光?。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

微軟、OpenAI、Cohere等公司已經(jīng)開始測試使用合成數(shù)據(jù)來訓(xùn)練AI模型。Cohere首席執(zhí)行官Aiden Gomez表示,合成數(shù)據(jù)可以適用于很多訓(xùn)練場景,只是目前尚未全面推廣。

  已有的(通用)數(shù)據(jù)資源似乎接近效能極限,開發(fā)人員認(rèn)為,網(wǎng)絡(luò)上那些通用數(shù)據(jù)已不足以推動(dòng)AI模型的性能發(fā)展。Gomez便指出,網(wǎng)絡(luò)極為嘈雜混亂,“它并不能為你提供你真正想要的數(shù)據(jù),網(wǎng)絡(luò)無法滿足我們的一切需求?!?/span>

  今年5月的一場活動(dòng)上,OpenAI首席執(zhí)行官Sam Altman曾被問及,是否擔(dān)心監(jiān)管部門調(diào)查ChatGPT可能侵犯用戶隱私的事。Altman對此不置可否,并表示自己“非常有信心,很快所有數(shù)據(jù)都將是合成數(shù)據(jù)”

▌人類真實(shí)數(shù)據(jù)售價(jià)高昂

  為了大幅提高AI模型的性能,提升它們在科學(xué)、醫(yī)學(xué)、商業(yè)等領(lǐng)域的水平,AI模型需要的是“獨(dú)特且復(fù)雜”的數(shù)據(jù)集。而這類數(shù)據(jù)或是需要來自科學(xué)家、醫(yī)生、作家、演員、工程師等“內(nèi)行人”,或是需要從藥企、銀行、零售商等大型企業(yè)獲取專業(yè)數(shù)據(jù)。

這也就帶來了讓AI公司們轉(zhuǎn)向合成數(shù)據(jù)的另一層原因——數(shù)據(jù)太貴了。

  且不說那些技術(shù)含量極高的制藥、科學(xué)數(shù)據(jù),光是之前Reddit和推特給出的數(shù)據(jù)采集要價(jià),都被Gomez“嫌棄”價(jià)格太高。

  在這種情況下,合成數(shù)據(jù)自然成了一個(gè)實(shí)惠方案,不僅可以避開這些數(shù)據(jù)的高昂售價(jià),還能生成一些更復(fù)雜的數(shù)據(jù)來訓(xùn)練AI。

▌如何用合成數(shù)據(jù)訓(xùn)練?

  具體如何用合成數(shù)據(jù)訓(xùn)練AI大模型?Gomez舉了一個(gè)例子:

在訓(xùn)練一個(gè)高級數(shù)學(xué)模型時(shí),Cohere可能會使用兩個(gè)AI模型進(jìn)行對話,其中一個(gè)扮演數(shù)學(xué)老師,另一個(gè)則充當(dāng)學(xué)生。之后這兩個(gè)模型就會就三角函數(shù)等數(shù)學(xué)問題對話,“其實(shí)一切都是模型‘想象’出來的”。

如果在這個(gè)過程中,模型說錯(cuò)了什么,人類就會在查看這段對話時(shí)作出糾正。

  而微軟研究院最近的兩項(xiàng)研究,也表明合成數(shù)據(jù)可以用來訓(xùn)練AI模型,這些模型一般比OpenAI的GPT-4、谷歌的PaLM-2更小更簡單。

  在其中一篇論文中,GPT-4生成了一個(gè)名為“TinyStories”的短篇故事合成數(shù)據(jù)集,里面使用的單詞全部非常簡單,一個(gè)四歲兒童都能理解。這一數(shù)據(jù)集被用來訓(xùn)練一個(gè)簡單的大語言模型,后者能生成流暢且語法正確的故事。

晨曦還是暮光?

  想要合成數(shù)據(jù)的客戶有了,供應(yīng)商自然也如雨后春筍般涌現(xiàn),例如Scale AI、Gretel.ai等初創(chuàng)公司。Gretel.ai由來自美國國安局和中情局的前情報(bào)分析師成立,其已與谷歌、匯豐銀行、Riot Games、Illumina等公司合作,用合成數(shù)據(jù)來擴(kuò)充現(xiàn)有數(shù)據(jù),幫助訓(xùn)練人工智能模型。

Gretel.ai首席執(zhí)行官Ali Golshan表示,合成數(shù)據(jù)的關(guān)鍵在于,它既能保護(hù)數(shù)據(jù)集中所有個(gè)人的隱私,又能保持?jǐn)?shù)據(jù)的統(tǒng)計(jì)完整性。

同時(shí),合成數(shù)據(jù)還可以消除現(xiàn)有數(shù)據(jù)中的偏差和不平衡。

不過,也有人不看好合成數(shù)據(jù)。

  反對派認(rèn)為,并不是所有合成數(shù)據(jù)都經(jīng)過精心調(diào)試,并能反映或改進(jìn)真實(shí)世界。

  來自牛津、劍橋、帝國理工等機(jī)構(gòu)研究人員發(fā)現(xiàn),合成數(shù)據(jù)的負(fù)面影響甚至堪比“毒藥”。如果在訓(xùn)練時(shí)大量使用AI內(nèi)容,會引發(fā)模型崩潰(model collapse),造成不可逆的缺陷。

  新一代模型的訓(xùn)練數(shù)據(jù)會被上一代模型的生成數(shù)據(jù)所污染,從而對現(xiàn)實(shí)世界的感知產(chǎn)生錯(cuò)誤理解。隨著時(shí)間推移,模型就會忘記真實(shí)基礎(chǔ)數(shù)據(jù)部分。即使在幾乎理想的長期學(xué)習(xí)狀態(tài)下,這個(gè)情況也無法避免——研究人員也將此形容為“AI大模型患上‘癡呆癥’”。

微軟、OpenAI用上“數(shù)據(jù)永動(dòng)機(jī)” 合成數(shù)據(jù)是晨曦還是暮光?,社會科技行業(yè)熱點(diǎn)觀察局,人工智能,業(yè)界資訊,微軟,合成數(shù)據(jù),大模型,OpenAI,ai

?

  即便是合成數(shù)據(jù)從業(yè)人員Golshan也坦承,在劣質(zhì)合成數(shù)據(jù)上進(jìn)行訓(xùn)練可能會阻礙進(jìn)步。

“網(wǎng)上越來越多的內(nèi)容都是由AI生成的。隨著時(shí)間推移,這確實(shí)會導(dǎo)致退化,因?yàn)檫@些大模型產(chǎn)生的知識都是重復(fù)的,沒有任何新的見解。文章來源地址http://www.zghlxwxcb.cn/news/detail-605836.html

到了這里,關(guān)于微軟、OpenAI用上“數(shù)據(jù)永動(dòng)機(jī)” 合成數(shù)據(jù)是晨曦還是暮光?的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • AI已悄悄改變職場,微軟如何推動(dòng)數(shù)十萬員工都用上Copilot?

    AI已悄悄改變職場,微軟如何推動(dòng)數(shù)十萬員工都用上Copilot?

    ??歡迎大家在 GitHub 上 Star 我們: 分布式全鏈路因果學(xué)習(xí)系統(tǒng) OpenASCE:?https://github.com/Open-All-Scale-Causal-Engine/OpenASCE 大模型驅(qū)動(dòng)的知識圖譜 OpenSPG:?https://github.com/OpenSPG/openspg 大規(guī)模圖學(xué)習(xí)系統(tǒng) OpenAGL:?https://github.com/TuGraph-family/TuGraph-AntGraphLearning 不久前,微軟 AI 辦公副總裁 J

    2024年04月25日
    瀏覽(18)
  • Unity C# 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)以及表情嘴型 Animation 的簡單整理

    Unity C# 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)以及表情嘴型 Animation 的簡單整理

    目錄 Unity C# 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)以及表情嘴型 Animation 的簡單整理 一、簡單介紹 二、實(shí)現(xiàn)原理 三、注意事項(xiàng) 四、實(shí)現(xiàn)步驟 五、關(guān)鍵代碼 Unity 工具類,自己整理的一些游戲開發(fā)可能用到的模塊,單獨(dú)獨(dú)立使用,方便游戲開發(fā)。 本節(jié)介紹,這里在使用

    2024年02月12日
    瀏覽(31)
  • [Unity+OpenAI TTS] 集成openAI官方提供的語音合成服務(wù),構(gòu)建海王暖男數(shù)字人

    [Unity+OpenAI TTS] 集成openAI官方提供的語音合成服務(wù),構(gòu)建海王暖男數(shù)字人

    ? ? ? ? 最近openAI官方發(fā)布了很多新功能,其中就包括了最新發(fā)布的TTS語音合成服務(wù)的api接口。說到這個(gè)語音合成接口,大家可能會比較陌生,但是說到chatgpt官方應(yīng)用上的聊天機(jī)器人,那個(gè)臺灣腔的海王暖男的聲音,可能就有印象了吧。那么從官方文檔中,可以發(fā)現(xiàn),openA

    2024年02月04日
    瀏覽(27)
  • 微軟語音合成(tts)服務(wù)申請和調(diào)用

    微軟語音合成(tts)服務(wù)申請和調(diào)用

    https://azure.microsoft.com/zh-cn/free/ 這里有個(gè)視頻教程,根據(jù)此完成申請流程: https://www.bilibili.com/video/BV15a4y1W7re?vd_source=bf07f28d37849885d215dc3aea189eba 申請完成后,就可以到這里申請資源: https://portal.azure.com/#home 點(diǎn)擊資源組,里面就有部署好的服務(wù)了 點(diǎn)擊這里,可以獲取 subscription

    2024年02月11日
    瀏覽(28)
  • 微軟-文字轉(zhuǎn)語音.語音合成--逆向爬蟲實(shí)戰(zhàn)

    微軟-文字轉(zhuǎn)語音.語音合成--逆向爬蟲實(shí)戰(zhàn)

    gospider 是一個(gè)golang 爬蟲神器,它內(nèi)置了多種爬蟲模塊,是golang 爬蟲必備的工具包 注意:這個(gè)地址中有個(gè)X-ConnectionId參數(shù),這個(gè)參數(shù)寫死或者自己生成假的都可以,這個(gè)參數(shù)不重要 這里一個(gè)發(fā)送了三次參數(shù),三個(gè)參數(shù)中的X-RequestId 值,這個(gè)參數(shù)寫死或者自己生成假的都可以,這

    2024年02月11日
    瀏覽(27)
  • 【語音合成】微軟 edge-tts

    目錄 1.?edge-tts 介紹 2. 代碼示例 https://github.com/rany2/edge-tts 在Python代碼中使用Microsoft Edge的在線文本到語音服務(wù)

    2024年02月14日
    瀏覽(23)
  • 如何注冊微軟Azure并獲取語音合成服務(wù)?

    如何注冊微軟Azure并獲取語音合成服務(wù)?

    按步驟,一步步來。 使用條件,以下可選: 1、有信用卡 2、有學(xué)生郵箱、學(xué)校郵箱。 步驟: 1、打開地址,去注冊。 信用卡注冊: 文本轉(zhuǎn)語音 – 真實(shí) AI 語音生成器 | Microsoft Azure 學(xué)生郵箱: 面向?qū)W生的 Azure - 免費(fèi)帳戶額度 | Microsoft Azure 2、注冊后去后臺,打開語音服務(wù)。 后

    2024年02月03日
    瀏覽(19)
  • 微軟語音合成網(wǎng)頁版源碼,影視解說配音網(wǎng)頁版

    微軟語音合成網(wǎng)頁版源碼,影視解說配音網(wǎng)頁版

    簡介: 最新微軟語音合成網(wǎng)頁版源碼,影視解說配音網(wǎng)頁版,僅幾個(gè)文件寫成的微軟語音合成接口,調(diào)用的是官方api,親測合成很快,大家總聽到的短視頻電影解說與搞笑短視頻,都是微軟配音員,可以說是市面上語音合成中最像真人的了。 搭建教程 1.將壓縮包內(nèi)的index.h

    2024年02月19日
    瀏覽(31)
  • MS-TTS:免費(fèi)微軟TTS語音合成工具(一鍵合成導(dǎo)出MP3音頻)

    MS-TTS:免費(fèi)微軟TTS語音合成工具(一鍵合成導(dǎo)出MP3音頻)

    聲明 本工具是個(gè)免費(fèi)工具,遇到問題,還請自行解決,下面有文字教程,B站有視頻教程(鏈接在文章末尾); 其次,微軟接口卡頓,連接超時(shí)等問題下方有詳細(xì)說明,請仔細(xì)看一下; 再次,強(qiáng)制升級是為了統(tǒng)一版本方便問題的收集與解決,如果你能理解最好,不能理解的話

    2024年02月03日
    瀏覽(54)
  • 文本轉(zhuǎn)語音:微軟語音合成標(biāo)記語言 (SSML) 文本結(jié)構(gòu)和事件

    文本轉(zhuǎn)語音:微軟語音合成標(biāo)記語言 (SSML) 文本結(jié)構(gòu)和事件

    ? SSML 的語音服務(wù)實(shí)現(xiàn)基于萬維網(wǎng)聯(lián)合會的語音合成標(biāo)記語言版本 1.0。 ? 語音服務(wù)支持的元素可能與 W3C 標(biāo)準(zhǔn)不同。 每個(gè) SSML 文檔是使用 SSML 元素(或標(biāo)記)創(chuàng)建的。 這些元素用于調(diào)整語音、風(fēng)格、音節(jié)、韻律、音量等。 下面是 SSML 文檔的基本結(jié)構(gòu)和語法的子集: 以下列

    2024年02月03日
    瀏覽(21)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包