引言
1950 年,艾倫·圖靈提出著名的「圖靈測試」,給出判定機器是否具有智能的試驗方法。16 年后,世界上第一款可人機對話的機器人“Eliza”問世,這是 AI 技術(shù)最早期的萌芽階段。但由于當時的科技水平限制,AIGC 僅限于小范圍實驗。
AIGC的技術(shù)發(fā)展
Eliza 的出現(xiàn)代表了人們對人工智能和自然語言處理的探索和興趣,同時也反映了人們對計算機能否模擬人類思維和語言能力的好奇和探索能力。
如今人工智能技術(shù)經(jīng)歷了幾十年的起伏和發(fā)展,現(xiàn)代人工智能應(yīng)用也變得越來越智能化和逼真。遞歸神經(jīng)網(wǎng)絡(luò)(RNN)和生成對抗網(wǎng)絡(luò)(GAN)等深度學(xué)習(xí)技術(shù)的出現(xiàn),也讓 AI 能夠更好地理解人類語言,并生成更加自然和流暢的文本、圖像、音頻等內(nèi)容。
到了 2022 年,這是生成式 AI 的突破之年,最具代表性的就是 ChatGPT,其一經(jīng)發(fā)布便引起了廣泛的關(guān)注和討論,被認為是自然語言處理領(lǐng)域的一次重大突破。3 月 15 日,OpenAI 繼續(xù)發(fā)布了其多模態(tài)的訓(xùn)練大模型——GPT-4,在 ChatGPT 的基礎(chǔ)上增加了強大的識圖能力,模態(tài)更豐富,且研發(fā)速度之快,令人驚嘆。
除對話聊天工具外,AI 在其他領(lǐng)域也取得了不小的突破,3 月 16 日,Midijournry V5 發(fā)布,可創(chuàng)造高質(zhì)量、高分辨率、高逼真的圖像。Runaway 于 3 月 20 日發(fā)布GEN-2 視頻生成模型的試用申請,新增根據(jù)文本和圖片生成視頻的功能。3 月 22 日,代碼托管平臺 GitHub 再次發(fā)布重磅“炸彈”:GitHub Copilot X,用戶只需“動動嘴”,它就能幫你把代碼寫了。
回顧技術(shù)的發(fā)展,我們可以發(fā)現(xiàn),每一輪技術(shù)變革,都帶來了產(chǎn)業(yè)級的投資機會。先行覺悟的人,會在其中獲取巨大的利益,而后知后覺的人大幾率是被社會推動著走。
例如互聯(lián)網(wǎng)誕生起就催生了在線教育、數(shù)字娛樂和社交網(wǎng)絡(luò)等新興行業(yè),進一步推動了人類交流和信息傳輸?shù)念I(lǐng)域發(fā)展。
智能手機的出現(xiàn)讓用戶不再受限于鍵盤和鼠標,帶來了移動支付、共享經(jīng)濟、應(yīng)用開發(fā)等一眾產(chǎn)業(yè)機會,進一步改變了人們的消費和生活方式。
5G 技術(shù)的普及,也使得人們將能夠更智能地與物聯(lián)網(wǎng)、無人機、自動駕駛汽車等連接,這不僅催生了智能交通、智能物流、智能制造等新的產(chǎn)業(yè)鏈,而且也讓傳統(tǒng)行業(yè)趨向數(shù)字化、自動化方向轉(zhuǎn)型。
以生產(chǎn)工具為標志的生產(chǎn)力的發(fā)展是社會存在的根本柱石,也是歷史的第一推動力。這是馬克思主義關(guān)于生產(chǎn)力理論的經(jīng)典觀點。歷史的進步和社會變革都源于生產(chǎn)力和生產(chǎn)關(guān)系的發(fā)展和變革。生產(chǎn)工具越是先進,其生產(chǎn)力就越是強大。而如今 AIGC 技術(shù)似乎就是革命性的生產(chǎn)工具。
AIGC 技術(shù)正在經(jīng)歷新一輪的變革浪潮,其交互方式也從生成文本、代碼、圖片正朝著更多元、更自然的形式上發(fā)展。歷史總在循環(huán)往復(fù),互聯(lián)網(wǎng)的交互形式最初也是從文本、到圖像、到音視頻再逐步發(fā)展到如今的互動音視頻(直播)?,F(xiàn)在 AIGC 也正朝著更加逼真的方向發(fā)展,隨著技術(shù)的不斷升級和深入,AIGC 將可預(yù)見地顛覆音視頻領(lǐng)域。
大咖經(jīng)驗分享
AIGC 已經(jīng)開始重塑音視頻哪些細分領(lǐng)域了?距離 AIGC 全面賦能音視頻行業(yè)還有多遠?未來會不會出現(xiàn)更加智能化、高效化的音視頻應(yīng)用與創(chuàng)作形式?會不會有更加自然、智能的語音交互出現(xiàn)?
4 月 26 日(周三)晚 20:00,「TVP 技術(shù)夜未眠」第七期來啦,本期我們特別邀請了騰訊云直播、媒體處理專家工程師 趙軍老師與上海交通大學(xué)電子工程系教授、圖像所副所長、騰訊云TVP 宋利老師,與我們一起探討 AIGC 在音視頻領(lǐng)域的應(yīng)用與發(fā)展。
講師介紹:
趙軍:騰訊云直播、媒體處理專家工程師
騰訊專家工程師, 開源愛好者,F(xiàn)Fmpeg maintainer,目前在騰訊云音視頻負責(zé)視頻云的媒體處理框架以及優(yōu)化等工作,同時也以開放的心態(tài),持續(xù)在開源社區(qū)提交相關(guān) Patch。
宋利:上海交通大學(xué)電子工程系教授、圖像所副所長、騰訊云 TVP
上海交通大學(xué)電院、人工智能研究院、未來媒體網(wǎng)絡(luò)協(xié)同創(chuàng)新中心教授、博士生導(dǎo)師,IEEE 高級會員,多媒體信息領(lǐng)域技術(shù)專家,圖像通信與網(wǎng)絡(luò)工程研究所副所長。主持國家 863 課題、自然科學(xué)基金等科研項目數(shù)二十余項,發(fā)表學(xué)術(shù)論文 200 余篇,授權(quán)發(fā)明專利 35 項,軟件著作權(quán) 5 項。
添加云小助微信:tvp1215,回復(fù)「音視頻」即可加入本次直播交流群,可以提前交流互動,并參與群內(nèi)互動抽獎!文章來源:http://www.zghlxwxcb.cn/news/detail-617588.html
TVP技術(shù)夜未眠
TVP 技術(shù)夜未眠 —— 技術(shù)暢言,夜深不眠。聚焦最新、最熱、最受關(guān)注的技術(shù)話題,邀請各領(lǐng)域資深專家對話 TVP 大咖,深度剖析技術(shù)原理,洞察互聯(lián)網(wǎng)技術(shù)走向,碰撞出思維火花,照亮技術(shù)之夜。文章來源地址http://www.zghlxwxcb.cn/news/detail-617588.html
到了這里,關(guān)于從文本、圖像到音視頻,AIGC技術(shù)將如何重構(gòu)我們的數(shù)字世界?的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!