IMMENSE、36氪|作者
01 “未來是屬于AI的”
3月2日,內(nèi)容創(chuàng)作圈大地震。
就在3月2日凌晨,OpenAI宣布開放ChatGPT本體模型API,其價格為1k tokens/$0.002。也就是說,從這一天開始,任何企業(yè)都能讓ChatGPT為自己打工,而價格僅僅是每輸出100萬個單詞18元人民幣(2.7美元)。
如果對這個價格沒有概念的話,舉個例子。今年,河南省鶴壁市淇縣某機動車維修店招聘文案編輯,店里開出的最低薪酬是2000元/月,學歷不限。
圖片方面,早在ChatGPT走紅之前,AI繪畫早已引發(fā)了藝術圈的一場大地震。
去年9月,一幅由AI創(chuàng)作的繪畫作品《太空歌劇院》獲得美國科羅拉多州藝術博覽會數(shù)字藝術類別冠軍,幾乎標志著AI作畫的“AlphaGo時刻”。
《太空歌劇院》(Théatre D'opéra Spatial)
這幅作品是基于AI生成的畫作加上人類畫師的后期繪制,這一點被業(yè)內(nèi)人士大為詬病,指責作者以AI為噱頭,實際上依舊需要人類加工。
這些質(zhì)疑AI作畫能力的人忽略了一個重要因素——進化。
人們往往極大低估了AI大模型的學習與進步能力。僅僅在幾年之前,人工智能還是被戲稱為“人工智障”的存在。人們時常拿間或出現(xiàn)的“翻車”案例證明AI與人類的差距,卻忽略了這項技術在最近數(shù)年間突飛猛進的進化能力。
在知乎“AI繪畫半年了,到目前為止,AI繪畫讓多少畫師失業(yè)了?未來又會有多少?”的這條問題底下,3202人點贊了同一條回答:
“AI對美術行業(yè)的沖擊是巨大的,這個效應會在未來兩三年隨著顯卡升級大爆發(fā),美術行業(yè)會變的卷中卷,50%的人可能面臨轉行?!?/p>
“……我只是在做勸退而已,我希望新人不要跳火坑了,未來是屬于AI的?!?/p>
也許有人認為,文字與圖片都是高度結構化的信息,能夠被輕易替代無可厚非。但是,視頻內(nèi)容信息量大、非結構性數(shù)據(jù)多,是AI尚未攻克的堅固堡壘,也是內(nèi)容創(chuàng)作者最后一塊自留地。
事實并非如此。
早些年DeepFake換臉帶來的恐慌暫且不論,近年間,谷歌、Meta(Facebook)陸續(xù)發(fā)布Phenaki、Imagen Video、Make-A-Video AI視頻自動生成模型,其效果有時足以以假亂真。
沒有創(chuàng)作者能夠和這樣的力量抗爭。
02 “沒有人的文明,毫無意義”
在ChatGPT剛火起來那陣子,網(wǎng)上流傳過一個笑話:
“快進到10年以后,乙方方案全部由ChatGPT生成,甲方方案全部由ChatGPT審核。雙方合作大半年,一點工作沒干過?!?/p>
這個笑話引人發(fā)笑的荒謬之處顯而易見——雙方的工作都沒有意義。
如果更進一步思考,什么是意義?
無獨有偶,在今年春節(jié)檔爆款電影《流浪地球2》中,一句廣為流傳的臺詞給出了答案:“沒有人的文明,毫無意義。”
是的,ChatGPT本質(zhì)上依舊是為人類所設計、制造、使用的工具,認為這項技術將會替代人類文明實際上是一種本末倒置。
就像歷史上其他人認為懷疑自我存在意義的時刻一樣,在工業(yè)革命之后,電視、計算機、手機、互聯(lián)網(wǎng)、云計算,這種種新興科技產(chǎn)品都曾在不同時間段引發(fā)過人們的恐慌。
人工智能也不例外。早在1997年,IBM的深藍計算機就已在國際象棋比賽中打敗了世界冠軍卡斯帕羅夫。全球在深藍贏得比賽之后陷入了興奮與恐慌,“機器將會在未來取代人類,占領地球”的言論層出不窮。
可事實上,20多年過去了,如今我們每一個人的智能手機算力都足以與當年的深藍相匹敵,但人類文明并沒有因此而終結。
正如美國政治記者與作家諾曼·卡曾斯在其1935~1974年所撰寫的《人的選擇》一書中所載:文明的建立,靠的不是機器,而是思想。
21世紀的今天,機器占領人類文明的事件不但沒有發(fā)生,科技、工業(yè)、自動化的進步反而讓邊遠山區(qū)通水通電,讓大規(guī)模消費日用品的價格低到人人可享,讓每一個人的生活都比我們兩個世紀以前最優(yōu)渥的祖先都要更便捷、更豐腴、更自由。
即便是如今引發(fā)大量恐慌的ChatGPT類AIGC技術,也在不斷被運用于普惠人類、降低服務門檻的地方。
比如,基于人口統(tǒng)計學、相關的病史或流行病學風險因素,Glass.health AI能夠輔助醫(yī)生更快速、更準確地診斷病人;
而基于AI文檔分析技術,Humata.ai能夠快速幫助用戶提取文檔中的有價值信息,降低技術文檔、法律文檔等專業(yè)文件的閱讀難度,讓缺乏相關訓練的普羅大眾能夠更好地保護自身利益;
基于AI文本摘要和TTS技術生成的口播文案,AI繪畫生成的貼紙、特效等不斷應用在短視頻生產(chǎn)領域,進一步降低了短視頻生產(chǎn)門檻,越來越多的內(nèi)容創(chuàng)作者搭上了短視頻的“快車”。
其他關于AI寫作、AI繪畫、AI視頻等的AI創(chuàng)作工具則更是層出不窮。小到腳本錯別字檢查,大到分鏡設計與畫面排版,曾經(jīng)困難重重的內(nèi)容創(chuàng)作環(huán)節(jié)被不斷拆解重構,降低入門門檻。
而AI與AI使用者的關系,也在這一次次的工具迭代之中,被時代所不斷解構、重組、賦予了新的內(nèi)涵。
舉個例子,2021年5月,安徽的一名小伙子突然在網(wǎng)絡上走紅。
此前的幾年間,通過AI技術,他累計幫助了超過500人“復活”了親人們的老照片。那些泛黃模糊的照片經(jīng)過他一頓操作,不僅變得更清晰明亮,還能朝著電腦前的親人眨眼、微笑、擺頭。
看著自己6歲時就去世的父親重新在電腦屏幕上“活過來”,那些哭得情難自禁的情景,也許才是AI與文明的真實意義。
03 是顛覆者,更是解放者
在祛除了對AI的盲目崇拜與盲目恐懼之后,我們終于可以稍微理性地看待AIGC這回事。
一直以來,在內(nèi)容創(chuàng)作的過程中,都存在著大量的重復動作,它們繁瑣、冗余、耗時極長卻又本質(zhì)上與創(chuàng)作無關。
比如,文稿校對者為了找出錯別字,一次又一次地重復閱讀一篇文章,讀得眼睛都發(fā)酸、發(fā)脹。
再比如,畫家靈感迸發(fā),在畫布上揮毫而就一幅巨作,然后花上十倍的時間對整幅畫面的每一處細節(jié)重復勾線、加陰影、卡閉塞、勾線、加陰影、卡閉塞……
視頻制作則更是重災區(qū)。視頻拍攝的原始素材動輒長達幾十、甚至幾百小時,后期剪輯師不僅要用肉眼逐一觀看,還要一而再再而三地對其進行重復識別、篩選、剪輯切割,在AI出現(xiàn)之前還要用耳朵一遍遍聽原片內(nèi)容,手動添加字幕。
這些過程既無趣,又冗長,而且與真正的人類創(chuàng)造力幾乎毫無關系。創(chuàng)作者們的大量精力都被分散到了這些重復環(huán)節(jié),真正用來創(chuàng)作的部分少之又少。
AIGC對于內(nèi)容創(chuàng)作者的意義,正是將他們解放出來,讓創(chuàng)作者的精力更好地用于探索創(chuàng)意極限,而重復、冗雜的工作交給AIGC,讓創(chuàng)作者的產(chǎn)能不再受到制約,讓優(yōu)質(zhì)內(nèi)容能夠爆炸式增長。
聽起來這一天似乎很遙遠,但實際上,由AI輔助生成的創(chuàng)意內(nèi)容已經(jīng)來到了我們身邊。
去年冬奧期間,央視體育新媒體和總臺技術團隊聯(lián)合阿里云視頻云、達摩院,打造了“AI云智剪”智能視頻剪輯工具。
基于阿里AI視頻理解技術EMC2與阿里云強大的流媒體處理能力,AI云智剪能夠實時解析并提取賽事視頻中的運動員信息、精彩動作、鏡頭類型、賽程信息、運動員特點等,并自動生成多種類型的集錦視頻,大規(guī)模解放剪輯師壓力。
去年整個冬奧期間,阿里AI云智剪共生產(chǎn)出39878段素材,時長超過200小時,覆蓋超200場比賽。
除了AI視頻生成之外,通過和云計算結合,AIGC還能夠從根源上顛覆電視臺與演播室的工作流程,將原本龐大、復雜、昂貴的演播環(huán)節(jié),全部集成在一臺普通的手機上。
比如,在連續(xù)多屆的全國兩會期間,人民日報新媒體記者的手機里就裝進了一款內(nèi)容創(chuàng)作增效“神器”:兩會“AI編輯部”移動版。
這是基于阿里云視頻云的“AI編輯部”衍生而來的定制化智能媒體生產(chǎn)產(chǎn)品。通過“AI編輯部”,記者所拍攝的現(xiàn)場視頻素材既能由5G網(wǎng)絡同步回傳后方,也能由記者在前方即時剪輯。從發(fā)現(xiàn)線索、獲取素材,到拍攝制作、審核簽發(fā),以及發(fā)起直播、連麥訪談等系列動作,都能通過一部手機實時完成。
在當前的AIGC領域,AI全自動生成的文字與圖片,在不少時刻都幾乎能達到“以假亂真”的效果。在視頻制作領域,對比文字、圖片,視頻的信息量最大、非結構化數(shù)據(jù)最多,AI需要對于視頻內(nèi)人物、物品、場景、關系等高階信息進行理解,加之視頻制作本身對于審美、節(jié)奏、畫面、BGM的極高要求……
AI全自動生成過程雖然略顯漫長,但并不是那么天方夜譚的未來。
冬奧會的AI云智剪,面向特定的賽事場景,限定了素材集的范圍,套用成熟的編排模式,由AI負責素材的預處理,并按預設模版進行編排,這是AIGC的序曲,實現(xiàn)了視頻全智能生產(chǎn)的第一個階段。
AIGC的第二個階段,AI除了負責素材的預處理,還能完成本屬于視頻創(chuàng)意環(huán)節(jié)的編排工作,從而實現(xiàn)智能批量混剪。
第三階段,面向特定場景和特定要求的成品,由AI根據(jù)已有成片反向解構分鏡頭,負責素材的搜索、篩選、處理、編排,并最終制作合成。
第四階段,面向特定場景,AI負責理解場景的要求,包括素材的搜索、篩選(以及部分素材生成)、處理、編排,并最終制作合成。
AIGC視頻生成的終極階段,由AI挖掘視頻制作的興趣點及創(chuàng)意點,并完成相應的制作。
當然,在此之前,AI視頻制作依舊面臨著一個迫在眉睫的挑戰(zhàn)——算力。
一段文字、一張圖片、一段視頻,處理它們所需要的算力級別呈指數(shù)型爆炸上升。
這道題,云計算成了唯一的答案。
目前,云計算和人工智能的結合正處于技術突破和發(fā)展的關鍵時期,生成式AI正在發(fā)生顛覆性突破,阿里巴巴將全力構建自己的AI預訓練大模型,并為市場上風起云涌的模型和應用提供好算力的支撐,阿里董事會主席兼首席執(zhí)行官張勇在今年2月的財報會上表示。
04 結語
早在1956年,以約翰·麥卡錫、馬文·明斯基、克勞德·香農(nóng)等為代表的科學家們就在美國達特茅斯組織了一場為期兩個月的人工智能夏季研討會,開啟了人工智能技術的探索之路。
半個多世紀后的今天,在云計算、深度學習、萬億級參數(shù)大模型等相關技術的發(fā)展之下,AIGC才第一次真正走進我們的生活,它在繪畫、作曲、視頻等創(chuàng)作領域幾乎完美地替代了重復人工,進而將成為革命性意義的新時代生產(chǎn)力工具。
3月15日凌晨,OpenAI正式上線了新一代人工智能大模型 GPT-4。與它的上一代相比,這款多模態(tài)模型不僅可以接受文本輸入,甚至已經(jīng)可以接受圖像等其他模態(tài)的信息輸入,離真正的通用型人工智能又近了一步。
不要溫和地走進這場AIGC。
文章來源:http://www.zghlxwxcb.cn/news/detail-783451.html
當人類優(yōu)渥于一種狀態(tài),總有想象力來沖破平衡。Cloud Imagine《云想之力》是阿里云聯(lián)合36氪共同打造的系列報道,旨在探索云計算大背景下爆發(fā)的應用場景和新興技術,以想象的高維碰撞之力,窺探“云”上的無限空間。從蒸汽機到人工智能,一切生產(chǎn)力工具都是為了將人類從繁冗的勞動中解放出來,將時間與精力留給創(chuàng)意與想象的破界。文章來源地址http://www.zghlxwxcb.cn/news/detail-783451.html
到了這里,關于借AI之勢,打破創(chuàng)意與想象的邊界的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!