衡宇 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
3月最后一天,王長(zhǎng)虎在龍湖集團(tuán)的last day。
這位字節(jié)跳動(dòng)前視覺技術(shù)負(fù)責(zé)人、AI Lab總監(jiān)辭職掛印,火速啟程下一站:AIGC創(chuàng)業(yè),成立新公司愛詩(shī)科技。
他拉團(tuán)隊(duì)自起爐灶,要打造一個(gè)聚焦AIGC的視覺多模態(tài)算法平臺(tái)?,覆蓋視覺相關(guān)的各種垂直應(yīng)用場(chǎng)景。
當(dāng)此大熱的AIGC風(fēng)口,王長(zhǎng)虎已經(jīng)是近期第N位勇闖創(chuàng)業(yè)潮的AI牛人。
聊起這事,王長(zhǎng)虎說話間不自覺就提高了聲音,語(yǔ)速也更快。他提到,創(chuàng)業(yè)是受時(shí)代和內(nèi)心的雙重感召,而且在風(fēng)口和經(jīng)歷背書的雙重加持下,目前看來(lái),早期的融資推進(jìn)頗為順暢。
關(guān)于創(chuàng)業(yè)要干的事,他信心飽滿:
技術(shù)難點(diǎn)?一定有,但也是好事,它就是我們不斷形成競(jìng)爭(zhēng)壁壘的機(jī)會(huì),就是這時(shí)候需要我們?nèi)プ龅摹?/p>
而且我們真的是打過硬仗的,之前在字節(jié),那么難的事情都被我們扛過去了。所以在新的應(yīng)用場(chǎng)景里邊看到難點(diǎn),蠻興奮,看到了,就去解決它。
(“那么難的事情”,指對(duì)字節(jié)系短視頻產(chǎn)品從0-1進(jìn)行建設(shè))
支持AIGC全生命周期的視覺多模態(tài)算法平臺(tái)
在ChatGPT引爆的AIGC創(chuàng)業(yè)風(fēng)潮后,王長(zhǎng)虎的切入點(diǎn)不是底層大模型或To C應(yīng)用層。
而是基于過去近20年的學(xué)術(shù)研究和技術(shù)應(yīng)用能力,殺入中間層,打造視覺多模態(tài)算法平臺(tái),將焦點(diǎn)聚集在AIGC相關(guān)視覺領(lǐng)域的各個(gè)垂直應(yīng)用場(chǎng)景。
并且在初始階段,To B先落地踐行。
所包含的多模態(tài)具體樣式,根據(jù)視覺垂類領(lǐng)域應(yīng)用的需求,初步設(shè)定為文字、圖片、語(yǔ)音、視頻,以及用戶的個(gè)性化特征等,也是AIGC領(lǐng)域不斷涌現(xiàn)新能力和產(chǎn)品的載體。
根據(jù)王長(zhǎng)虎的解釋,利用AI,可以完成從UGC到AIGC的內(nèi)容新升級(jí)。
“很多人關(guān)注AIGC,更多關(guān)注在內(nèi)容生成方面。”從王長(zhǎng)虎視角看過去,內(nèi)容生成只是AIGC全生命周期的一個(gè)階段,“其余階段也有很多問題等待去解決?!?/p>
“很多問題”是哪些問題?
他結(jié)合此前經(jīng)歷,舉例了兩個(gè)UGC時(shí)代代表性場(chǎng)景來(lái)佐證他所說的內(nèi)容生成之外,AIGC時(shí)代生產(chǎn)鏈的其他環(huán)節(jié)很大可能會(huì)遇到相同難題。
一個(gè)是在日活6億,正負(fù)樣本極不均衡的抖音或TikTok平臺(tái)上,根據(jù)不同文化背景、具體要求等,必須要篩選出不合規(guī)的視頻進(jìn)行攔截,且需精準(zhǔn)快速。
AIGC時(shí)代,這樣確保安全的審核同樣重要,且審核需求量更大。視覺多模態(tài)算法平臺(tái)提供的算法,就包含了能夠幫助使用方提高篩選和攔截效率的那種,并且很有可能如當(dāng)初的字節(jié)一般,在王長(zhǎng)虎提供的技術(shù)支持下代替成本高昂的人工審核,同時(shí)提升效率。
另一個(gè)場(chǎng)景是抄襲頻發(fā)。AIGC時(shí)代,創(chuàng)作門檻降低,作品數(shù)量爆發(fā),抄襲現(xiàn)象和版權(quán)糾紛大概率顯著上升。
UGC時(shí)代已經(jīng)驗(yàn)證過,長(zhǎng)此以往,不僅打擊原創(chuàng)者的創(chuàng)作意愿,對(duì)平臺(tái)生態(tài)不利;而內(nèi)容雷同或完全相同的視頻持續(xù)推薦,用戶體驗(yàn)也會(huì)大打折扣。
針對(duì)這個(gè)場(chǎng)景,王長(zhǎng)虎要做的平臺(tái),就能為用戶側(cè)提供減少類似或雷同視頻分發(fā)的AI算法。
他還表示,這個(gè)聚焦AIGC的算法平臺(tái)搭建過程中,很大可能會(huì)利用AIGC技術(shù)提升效率。
上述所有都是王長(zhǎng)虎的現(xiàn)階段思考,他才正式離職,剛剛開始籌備新公司事宜,新公司名為愛詩(shī)科技。
糧草先行,目前組建了10余人的初始團(tuán)隊(duì),也在招募核心技術(shù)和產(chǎn)品人才,為真正踩下出發(fā)的油門蓄力。
梳理他言語(yǔ)間透露出的規(guī)劃,能嗅到關(guān)于創(chuàng)業(yè)項(xiàng)目的信息點(diǎn):
搭建這樣一個(gè)視覺多模態(tài)算法平臺(tái),能夠支持AIGC新內(nèi)容,幫用戶解決內(nèi)容生成、安全、版權(quán)、分發(fā)、商業(yè)化等幾乎全生命周期的各項(xiàng)問題。
新的AI浪潮到來(lái),王長(zhǎng)虎身處其間,感知到變化,并打算在新事業(yè)從善如流地用上舊經(jīng)驗(yàn),包括但不限于GPU集群能力、服務(wù)調(diào)度能力、自動(dòng)化模型訓(xùn)練能力,推斷能力等。
經(jīng)驗(yàn)不會(huì)憑空出現(xiàn),既有功力的來(lái)源,主要可以定位回他在字節(jié)跳動(dòng)任職期間。
2017年,王長(zhǎng)虎加入字節(jié)跳動(dòng)。那時(shí)候人們對(duì)字節(jié)的感知,通過今日頭條遠(yuǎn)大于通過抖音。王長(zhǎng)虎加入之初,就是在字節(jié)內(nèi)部創(chuàng)業(yè)般,從0到1深度參與建設(shè)短視頻類產(chǎn)品。
此次To B和To C層面可能遭遇的各種問題,如降本增效、版權(quán)厘清、用戶體驗(yàn)等,王長(zhǎng)虎都在那時(shí)以技術(shù)或?qū)崿F(xiàn)或改善或解決。
再一次“從0到1建設(shè)技術(shù)平臺(tái)和產(chǎn)品”,王長(zhǎng)虎表示,上述經(jīng)驗(yàn)都可以一以貫之應(yīng)用在此次AIGC創(chuàng)業(yè)。
與AIGC緣起20年前的本科研究
新公司還在襁褓,王長(zhǎng)虎不愿過多詳談,他更愿意談?wù)摰氖谴饲暗募夹g(shù)經(jīng)驗(yàn),當(dāng)然也包括“技術(shù)底色上滋養(yǎng)出的AI情結(jié)”。
這要從王長(zhǎng)虎還是中國(guó)科學(xué)技術(shù)大學(xué)6系(電子工程與信息科學(xué)系)大四學(xué)生時(shí)聊起。
那是2004年,他做了人生首個(gè)研究,即根據(jù)一張或多張人臉圖片,生成該人臉的3D模型。此研究后來(lái)發(fā)表到國(guó)際會(huì)議上。
他不無(wú)興奮地說:
回看20年前,我此生做的第一個(gè)研究,就和AIGC有關(guān)。
同年,王長(zhǎng)虎進(jìn)入MSRA實(shí)習(xí),中科大博士畢業(yè)后轉(zhuǎn)為正式員工,直到2017年離開。
13年間的工作內(nèi)容也與AIGC有千絲萬(wàn)縷的聯(lián)系,他所在團(tuán)隊(duì)研究的“神筆馬良”草圖搜索技術(shù),可以基于海量圖像數(shù)據(jù)建立搜索引擎。
當(dāng)然,那時(shí)候生成式技術(shù)沒有成熟,業(yè)界對(duì)大規(guī)模數(shù)據(jù)的訓(xùn)練和處理經(jīng)驗(yàn)也遠(yuǎn)不如今日豐富,所以整個(gè)過程是在海量數(shù)據(jù)庫(kù)中尋找和草圖最匹配的那一張。
回憶此處,王長(zhǎng)虎的語(yǔ)氣中多少帶了些感慨,因?yàn)楝F(xiàn)在的范式也是基于海量數(shù)據(jù)去訓(xùn)練一個(gè)模型,然后根據(jù)用戶輸入的文字或圖像信息,生成一張最匹配prompt的圖片。
△草圖搜索技術(shù)示例
都說十年磨一劍,但在微軟實(shí)習(xí)和工作13年后,王長(zhǎng)虎毅然奔赴字節(jié)跳動(dòng),選擇的還是當(dāng)時(shí)并非招牌的視頻類產(chǎn)品。
為什么去字節(jié)?畢竟王長(zhǎng)虎自己也承認(rèn),在微軟可以做世界上最頂尖前沿的科學(xué)研究。
但在微軟,科研項(xiàng)目應(yīng)用到公司產(chǎn)品需要的周期特別長(zhǎng)。
他舉例分享,自己二零零幾年做的工作,若干年后才真正應(yīng)用在必應(yīng)搜索引擎,新技術(shù)很難在第一時(shí)間影響用戶。
但這一點(diǎn)在字節(jié)可以實(shí)現(xiàn),再加上加入字節(jié)時(shí),恰巧是短視頻類產(chǎn)品篳路藍(lán)縷打根基的時(shí)候——這也是字節(jié)AI Lab與其他大廠AI Lab的區(qū)別所在,即并非在產(chǎn)品成熟后才建立AI部門,也因此,王長(zhǎng)虎有機(jī)會(huì)在產(chǎn)品0到1發(fā)展歷程中扮演核心角色。
公開資料顯示,字節(jié)跳動(dòng)人工智能實(shí)驗(yàn)室(AI Lab)的成立使命,就是推動(dòng)機(jī)器智能的極限,致力于將AI理論研究快速應(yīng)用于產(chǎn)品部署。
現(xiàn)在翻看王長(zhǎng)虎公開簡(jiǎn)歷,字節(jié)任職期間,留下的足跡如下:
完整參與了抖音和TikTok等短視頻類產(chǎn)品從0到1的建設(shè)和發(fā)展;
建設(shè)了視覺技術(shù)和業(yè)務(wù)中臺(tái),帶領(lǐng)團(tuán)隊(duì)將相關(guān)技術(shù)廣泛應(yīng)用到字節(jié)跳動(dòng)全線產(chǎn)品中;
為集團(tuán)各產(chǎn)品提供AI技術(shù)支撐和業(yè)務(wù)解決方案,覆蓋了視覺相關(guān)產(chǎn)品內(nèi)容生產(chǎn)與消費(fèi)的全流程。
期間,他搭建的數(shù)百人團(tuán)隊(duì),不僅有技術(shù)人員,還包含了產(chǎn)品同學(xué)。如果把微軟看成王長(zhǎng)虎的技術(shù)練兵地,王長(zhǎng)虎就把字節(jié)和龍湖的經(jīng)歷,看成是對(duì)他技術(shù)和產(chǎn)品兩方面認(rèn)知的鍛煉。
△王長(zhǎng)虎
和從字節(jié)去龍湖的原因一樣,選擇加入AI 2.0創(chuàng)業(yè)大潮,他的理由是“跳出舒適區(qū)”。
當(dāng)然,這一次的催動(dòng)因素更復(fù)雜,譬如ChatGPT和Stable Diffusion的驚艷表現(xiàn),以及自己從DL熱潮走來(lái),對(duì)又一次“翻天覆地變化”的不容錯(cuò)過。
他說,這個(gè)機(jī)會(huì)更大,不像元宇宙、區(qū)塊鏈?zhǔn)潜灰徊糠秩丝吹?,AIGC是多數(shù)普通人能看到和感受到的。言語(yǔ)間,王長(zhǎng)虎又傳遞出自己對(duì)“新技術(shù)快速影響用戶”的看重。
如今離職創(chuàng)業(yè),他又有機(jī)會(huì)身體力行地這樣做了。
參考鏈接:
[1]《草圖搜索的魅力與挑戰(zhàn)》https://blog.sina.com.cn/s/blog_4caedc7a0102en29.html
—?聯(lián)系作者?—
— 完 —
「人工智能」、「智能汽車」微信社群邀你加入!
歡迎關(guān)注人工智能、智能汽車的小伙伴們加入交流群,與AI從業(yè)者交流、切磋,不錯(cuò)過最新行業(yè)發(fā)展&技術(shù)進(jìn)展。
PS. 加好友請(qǐng)務(wù)必備注您的姓名-公司-職位噢?~文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-487837.html
點(diǎn)這里??關(guān)注我,記得標(biāo)星哦~文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-487837.html
到了這里,關(guān)于字節(jié)技術(shù)大牛跑步進(jìn)入AIGC創(chuàng)業(yè),聚焦視覺領(lǐng)域,搭建算法平臺(tái),還是多模態(tài)的那種...的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!