AIGC接下來的研究思路 | AIGC
原創(chuàng) 科技周豎人 科技周豎人 2023-04-26 23:22 發(fā)表于上海
文 | 科技周豎人
歡迎關(guān)注同名公眾號獲取更詳細(xì)內(nèi)容
寫在前面:AIGC全稱生成式AI(AI Generated Content),與傳統(tǒng)AI最大的區(qū)別體現(xiàn)在其強大的創(chuàng)造性。傳統(tǒng)AI側(cè)重于從現(xiàn)有的數(shù)據(jù)中識別出模式,其建立在具有判別力的統(tǒng)計模型之上。而生成式AI不僅僅是輸出分析答案,其側(cè)重于從底層數(shù)據(jù)集的基礎(chǔ)上創(chuàng)造與生成全新的內(nèi)容,主要為文字、圖像、音頻、視頻、代碼等等。它使得人能夠通過自然語言而不是機器語言與計算機之間進行通信與交互。因此,AIGC與傳統(tǒng)AI存在較大的差別,這也是本輪行情中投資者最容易混淆的地方。
本文將主要圍繞對目前行情的看法、計算機行業(yè)研究框架簡述、未來AIGC領(lǐng)域研究方向三大主題展開。
**
01 對目前AIGC主題下市場的看法
**
產(chǎn)業(yè)趨勢較為明確,短期面臨回調(diào),不改長期向上趨勢。從宏觀環(huán)境來看,經(jīng)濟呈現(xiàn)弱復(fù)蘇態(tài)勢,景氣行業(yè)稀缺,科技TMT在AIGC大產(chǎn)業(yè)主題下具備相對配置優(yōu)勢。政策層面,政府多次強調(diào)經(jīng)濟轉(zhuǎn)型升級與“數(shù)字經(jīng)濟”,多項政策陸續(xù)發(fā)布,國家數(shù)據(jù)局成立,信創(chuàng)、數(shù)據(jù)要素、數(shù)字經(jīng)濟具備強政策支撐。產(chǎn)業(yè)層面,AIGC被定義為人工智能的“iPhone時刻”。不同于元宇宙、AR/VR當(dāng)下受限于基礎(chǔ)設(shè)施(設(shè)備)高昂價格以及目前性能的局限性,應(yīng)用場景相對比較狹窄,短時間內(nèi)很難得到廣泛的應(yīng)用。而AIGC在國外已經(jīng)落地了一些商業(yè)應(yīng)用場景和盈利模式。國內(nèi)大模型的研發(fā)成功與否是具備戰(zhàn)略意義的,并且國內(nèi)是有能力和儲備能做出大模型的,產(chǎn)業(yè)趨勢較為明確。
下一輪行情板塊內(nèi)標(biāo)的將形成分化,第一輪普漲的走勢將不再延續(xù),需要從不確定性中尋找確定性較強、真正能出業(yè)績的標(biāo)的。科技行業(yè)從某種程度上來說是供給創(chuàng)造需求的行業(yè),技術(shù)的變革推動新興產(chǎn)業(yè)的發(fā)展,產(chǎn)業(yè)鏈上下游形成閉環(huán)生態(tài),產(chǎn)能與成本持續(xù)優(yōu)化,價格下降加速需求的提升與行業(yè)的滲透。
比如現(xiàn)在大家都在說這輪行情有點像2013年移動互聯(lián)網(wǎng)浪潮,新的技術(shù)的誕生,并且產(chǎn)生了落地的應(yīng)用場景,對技術(shù)將會形成產(chǎn)業(yè)趨勢這一觀點市場似乎是達成了共識。但現(xiàn)階段來看,業(yè)績的兌現(xiàn)與驗證不會那么快,因為國內(nèi)可用、可大規(guī)模商用的大模型本身最快也要今年底或明年初才能拿出來,后續(xù)的商業(yè)模式與應(yīng)用的落地會相對更晚一些。因此,AI后續(xù)走勢不會像現(xiàn)在第一輪行情這樣普漲,所有沾邊的都漲,而是大浪淘沙,一些具備相對確定性的標(biāo)的才能笑到最后,同時也會淘汰掉一批本輪普漲帶動下漲幅較大的標(biāo)的。
**
02 從計算機行業(yè)研究框架來看AIGC
**
AI技術(shù)其實屬于計算機技術(shù)中的一項分支,其商用落地與投資機會同樣不能脫離計算機整體的投資框架。
2.1 投資跨度角度
計算機行業(yè)的投資跨度不外乎也分為短中長期,其主要來源于三大催化因素。第一,基礎(chǔ)技術(shù)的變革帶來的長期時代性的投資機會,投資跨度一般在10年以上。比如互聯(lián)網(wǎng)技術(shù)與PC的誕生促使Windows和Intel的Wintel體系稱霸多年,云計算的誕生使得亞馬遜從電商公司變?yōu)镮T基礎(chǔ)設(shè)施巨頭等。這種技術(shù)變革主導(dǎo)下的投資機會往往率先在美國誕生與落地,國內(nèi)與海外存在著以年為單位的時間差。這種時間差的長短由技術(shù)的不同而不同,但從整體來說,時間差在逐步縮小。因此,此類投資機會對美國技術(shù)的進步迭代與產(chǎn)業(yè)落地的情況跟蹤極為重要,對國內(nèi)有著對標(biāo)屬性的研究意義。第二,應(yīng)用場景與應(yīng)用模式的改變帶來的中期投資機會,投資跨度一般在5-10年區(qū)間。例如移動互聯(lián)網(wǎng)的誕生下,催生出了移動支付、短視頻、外賣等商業(yè)模式。此類投資機會具備一定的本地適配屬性,底層技術(shù)的升級可能來自于美國,但具體的應(yīng)用模式與商業(yè)模式卻在中國得到了極大的創(chuàng)新。第三,微觀或階段性因素帶來的短期機遇,投資跨度一般在1-3年。一般來自于行業(yè)需求、競爭格局、公司自身的一些變化。主要有以下幾個方面:政策層面的強制性造成的階段性需求拉升;經(jīng)營層面的下游邊際改善、市場延展或市場擴充,公司管理層的良性變革等;資本層面的股權(quán)激勵、增發(fā)、并購等;競爭格局的持續(xù)優(yōu)化下,少量頭部廠商業(yè)績的邊際抬升等。
2.2 產(chǎn)業(yè)鏈與產(chǎn)業(yè)圖譜角度
從計算機的產(chǎn)業(yè)鏈來看,計算機行業(yè)上游主要有芯片等硬件與IT工程師。從計算機行業(yè)本身來說主要有硬件、軟件、軟硬件共同組成的解決方案與IT服務(wù)。從下游客戶來說,主要有政府(G)、企業(yè)(B)與個人(C)。
▽計算機行業(yè)產(chǎn)業(yè)鏈上下游
計算機行業(yè)的主要分類方式主要有幾種,按業(yè)務(wù)類型劃分,分為硬件、軟件、服務(wù)與集成、互聯(lián)網(wǎng);按下游客戶類型劃分,分為2G(政府)、2B(企業(yè))、2C(個人);按下游客戶所屬行業(yè)劃分:分為金融IT、醫(yī)療IT、工業(yè)軟件等;按熱點主題或技術(shù)類型劃分,分為云計算、人工智能、智慧城市、在線教育等。
人工智能作為一個技術(shù)其實是計算機行業(yè)一個較為成熟的主題概念,其投資機會的尋找離不開整個產(chǎn)業(yè)鏈圖譜的摸排。從上游來說,AIGC大模型的訓(xùn)練與推理離不開算力的支撐,算力靠由基礎(chǔ)硬件構(gòu)成的AIDC機房提供。從軟件層面來說,第一是AIGC大模型本身的落地,第二是訓(xùn)練好的大模型如何對垂直或者通用的行業(yè)領(lǐng)域進行賦能,使得企業(yè)或者個人能夠降本增效。
▽計算機行業(yè)架構(gòu)與產(chǎn)品圖譜
**
03 大模型本身的落地與后續(xù)商業(yè)模式 入場券門檻極高,大廠的舞臺與必爭之地
**
國內(nèi)大模型落地之爭進入白熱化,魚龍混雜,其實還是大廠的舞臺。大模型的原材料是算力、數(shù)據(jù)和程序員,從程序員儲備、技術(shù)儲備、資本能力對算力成本的支撐去看,能夠做出大模型同樣最有動力去做的主要就是幾家大廠,百度、騰訊、阿里、華為、字節(jié)以及專注AI領(lǐng)域多年的特殊存在–商湯。
從算力層面來說,以GPT3為例,需要約10000張英偉達V100卡。目前國內(nèi)需要做出類GPT3.5級別的大模型同樣至少需要10000張A100/A800卡,單張卡的單價大概在10萬人民幣左右,預(yù)計至少需要10個億的投入,加上各家廠商擔(dān)心芯片供貨問題,至少會提前進行囤貨儲備2-3年,預(yù)計未來1-3年至少投入10-20億。
程序員算法工程師方面,以O(shè)penAI為例,自然語言算法工程師大概在百人以上,3-8年經(jīng)驗工程師平均薪酬約100萬,疊加國內(nèi)肯定會出現(xiàn)一些搶人的情況,預(yù)計人員薪酬投入2億以上。疊加大廠在過去已經(jīng)有很多AI方面的技術(shù)積累,所以我認(rèn)為大模型本身方面只有大廠能夠做出來。對于國內(nèi)大廠來說,AIGC的全新技術(shù)將帶來商業(yè)模式的全新玩法,傳統(tǒng)的一些商業(yè)模式可能被顛覆,行業(yè)競爭格局將發(fā)生巨大改變,搶灘登陸勢在必行。
大模型落地后的商業(yè)模式:
大模型的落地后商業(yè)模式應(yīng)該主要通過AI-aaS的方式進行提供,將AI的能力進行云化通過API接口的方式賦能出去。主要有兩種方式,一是直接將通用模型云化提供給下游行業(yè)領(lǐng)域進行應(yīng)用,也就是Model-aaS,另一種是將AI里面細(xì)分領(lǐng)域的能力通過云化接口提供出去,比如視覺識別APIs、語音識別APIs、自然語言NLP APIs等分項能力。下游應(yīng)用層面的廠商可根據(jù)自身需求進行選擇,付費方式也將有所不同。
**
04 上游算力需求
**
計算機行業(yè)主要集中在服務(wù)器領(lǐng)域
計算機算力部分主要是服務(wù)器部分,對服務(wù)器市場帶來多少增量,未來1-3年測算:
假設(shè)現(xiàn)在有8家左右大廠需要做大模型的預(yù)訓(xùn)練,每個大模型需要至少10000張芯片,總共需要80000張芯片。每個AI服務(wù)器可以放下4-8張芯片卡,那么需要服務(wù)器的數(shù)量約1-2萬臺,取均值1.5萬臺。預(yù)計大廠考慮到美國管制芯片供應(yīng)的情況,將按照2-3倍的量去做備貨。那么需求量區(qū)間為3-4.5萬臺。價格方面,按照均值6卡去算,對應(yīng)收入約80萬一臺。預(yù)計未來1-3年,AI服務(wù)器市場空間新增240-360億。(一個算法,希望對大家有啟發(fā))
一個插曲:因為國內(nèi)大模型研發(fā)的迫切性,從目前GPU選擇上來說,英偉達仍然是主流,目前上面提到的幾家國內(nèi)互聯(lián)網(wǎng)大廠外加商湯均擁有一萬塊英偉達GPU,用于目前的研發(fā)應(yīng)該問題不大,外加A800的陸續(xù)到貨,未來兩年在追趕上面GPU應(yīng)該還沒到卡脖子的地步。國產(chǎn)芯片可能在后續(xù)推理部分能夠起到一定作用。
**
05 下游商業(yè)模式
**
①基礎(chǔ)層與平臺層(IaaS & PaaS)
AI IaaS(計算機里的賣水人):AIDC算力租賃,需求來自于一是用于大模型的研發(fā)支持,二是應(yīng)用軟件廠商在細(xì)分場景的小模型研發(fā)。同時還可以提供小模型訓(xùn)練支持,其中包括模型訓(xùn)練服務(wù),提供GPU等硬件資源和深度學(xué)習(xí)框架,模型部署服務(wù)供客戶使用。
目前AI IaaS在云計算領(lǐng)域其實已經(jīng)較為成熟,和傳統(tǒng)IaaS并沒有太大差異,預(yù)計未來競爭格局的演進方式也類似。美國的主流玩家主要依然是AWS、微軟、谷歌、IBM,英偉達在今年4月發(fā)布會上也宣布加入這一賽場。國內(nèi)主流玩家目前主要還是阿里云、百度云、騰訊云、華為云、商湯等,創(chuàng)業(yè)玩家與運營商目前在AI芯片和服務(wù)器上受限。根據(jù)IDC預(yù)測,AI公有云將在2024年達到增速的最高點,在180%左右。從2024年之后,增速會維持在一個比較穩(wěn)定的水平上,也會在100%以上。AI公有云前四位分別為百度智能云、阿里云、華為云和騰訊云,份額分別為28.1%、28%、20.5%、16.6%。
這一領(lǐng)域可緊密跟蹤海外與國內(nèi)互聯(lián)網(wǎng)大廠的資本性開支與AI IaaS收入情況。
▽國內(nèi) AI IaaS 公有云市場競爭格局
見同名公眾號
數(shù)據(jù)來源:IDC
②應(yīng)用層(SaaS)
應(yīng)用層承接上文大模型本身的商業(yè)模式,主要有兩種模式,一個是大模型+下游細(xì)分賽道小模型或者說是大模型與具體任務(wù)相結(jié)合的方式,另一個是下游有強能力的廠商在所在細(xì)分領(lǐng)域直接做出小模型。
大模型+細(xì)分賽道場景小模型/大模型與具體任務(wù)的結(jié)合:大模型廠商通過開放API接口向下游細(xì)分賽道應(yīng)用軟件廠商開放大模型的使用,大模型主要提供通用的生成與交互模式,具體賽道的知識理解的小模型則由具體行業(yè)軟件公司來提供。AIGC賦能下的應(yīng)用軟件廠商可以通過提高原有產(chǎn)品價格或者促使新品SKU的產(chǎn)生來增加收入。大模型在通用語義與創(chuàng)作的能力上遠高于小模型,但在細(xì)分領(lǐng)域的知識理解能力上較為欠缺,細(xì)分應(yīng)用領(lǐng)域大+小的模式應(yīng)該是未來的趨勢。
細(xì)分賽道小模型:具備較強AI能力的應(yīng)用軟件廠商也可以自己訓(xùn)練小模型。從海外來看,3月份,在彭博發(fā)布的論文中驗證了這一模式的可行性。BloombergGPT是LLM在垂直金融場景的落地加速的象征。BloombergGPT聚焦于金融場景,將其多年積累的金融領(lǐng)域報告術(shù)語等對LLM進行訓(xùn)練,相較普適性類ChatGPT產(chǎn)品,其對金融術(shù)語的理解更為高效與準(zhǔn)確。
BloombergGPT采用500億參數(shù)與7000億數(shù)據(jù)集規(guī)模對大模型進行訓(xùn)練,遠小于GPT3的1750億參數(shù)與45TB數(shù)據(jù)量。其數(shù)據(jù)集主要包含兩個部分,一個數(shù)據(jù)量占比49%的通用型文本數(shù)據(jù)集,主要包括The Pile、C4、Wikipedia等通用常識類數(shù)據(jù)集,另一個數(shù)據(jù)量占比51%的金融預(yù)料數(shù)據(jù)集,主要包含括新聞、研究報告、公司財報、網(wǎng)絡(luò)爬取的金融文件以及提取到的社交媒體消息等內(nèi)容。BloombergGPT在通用領(lǐng)域能力與GPT3幾乎持平,但在金融垂直領(lǐng)域文本撰寫和問答能力更為突出。BloombergGPT LLM預(yù)訓(xùn)練的成功說明LLM在垂直領(lǐng)域應(yīng)用的可用性和訓(xùn)練成本可控的可行性。
細(xì)分賽道的選擇上,主要有三個參考指標(biāo),下游行業(yè)IT支出空間是否夠大、信息化程度滲透較低、行業(yè)競爭格局較優(yōu)。海外大模型領(lǐng)先于國內(nèi)2年左右,細(xì)分行業(yè)軟件的落地也將先于國內(nèi)。因此海外目前落地的應(yīng)用場景可以對大模型的應(yīng)用落地具備一個參考意義。(下次強調(diào)!是AIGC+而不是AI+ ?。?!??)
▽一些不完全海外應(yīng)用場景對標(biāo)A股公司
③多模態(tài)
視覺采集:??低暋⒋笕A股份
交互設(shè)備:螢石網(wǎng)絡(luò)
回到最開始,AIGC與傳統(tǒng)AI具備一定區(qū)別,其側(cè)重于創(chuàng)造性與人機交互,從這個角度來看,一些傳統(tǒng)的AI公司在本輪浪潮下,完全有被替代的風(fēng)險,需要根據(jù)其從事具體業(yè)務(wù)進行分析,投資有風(fēng)險,入市需謹(jǐn)慎。文章來源:http://www.zghlxwxcb.cn/news/detail-490038.html
微信掃一掃
關(guān)注該公眾號文章來源地址http://www.zghlxwxcb.cn/news/detail-490038.html
到了這里,關(guān)于AIGC接下來的研究思路 生成式AI投資研究框架的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!