目錄
AIGC發(fā)展概覽?
AIGC發(fā)展的重要里程碑事件
媒體平臺AIGC功能?
媒體平臺AIGC功能-廣點通
媒體平臺AIGC功能
?AIGC在廣告各場景應(yīng)用?
AIGC在廣告各場景應(yīng)用—文生文
AIGC在廣告各場景應(yīng)用—文生圖
視頻生成
AIGC在廣告各場景應(yīng)用——AI投手
?展望?
?問答?
AIGC發(fā)展概覽?
AIGC,即AI文本生成,是基于大型預(yù)訓(xùn)練模型的一項技術(shù)。它在經(jīng)典模型的基礎(chǔ)上進(jìn)行了改進(jìn),成為科技領(lǐng)域的熱門話題之一。
AIGC通過利用模型中的大量參數(shù)和數(shù)據(jù),尋找規(guī)律并具備一定的方法能力,從而生成所需的文本、圖像、視頻或其他內(nèi)容。
從狹義上來說,AIGC主要關(guān)注圖像文本、音頻視頻等內(nèi)容的生成。從廣義上來說,它還包括生成策略和代碼等內(nèi)容,可以提高代碼編寫的效率。
在上文左右兩邊圖中,我們可以看到這些生成內(nèi)容的例子。
-
左邊是一張圖像,如果你在抖音或者小紅書等平臺上瀏覽,可能經(jīng)常會遇到一些臉部相似的內(nèi)容。在這種情況下,你不必懷疑,很可能是AIGC用一種軟件生成的。
這樣的圖片看起來燈光和背景會比較統(tǒng)一。如果你不仔細(xì)觀察其他細(xì)節(jié),真實程度還是很高的,它們可以用于廣告投放等用途。
-
右邊的這張圖,是一張對話。我在向他咨詢?nèi)绾螌懞靡环軵PT,且不超過200字。在這種情況下,對話會采用一種擬人化的形式,回復(fù)方式更加精準(zhǔn)和人性化。
對話伙伴會詢問你關(guān)于PPT主題、排版和演講速度等方面的需求,并幫助你設(shè)計一個好的流程。
與平常的文字文本或生成模型相比,這種對話給人一種與NPC或通用智能交互的感覺。因此,這一技術(shù)在chatGPT出現(xiàn)后成為一個新的里程碑。
對于未來的發(fā)展,首先我們需要意識到這項技術(shù)的實用性,這樣我們才會更好地思考如何在各種實際應(yīng)用場景中大力使用它。
AIGC發(fā)展的重要里程碑事件
從前年年底ChatGPT上線以來,它迅速吸引了大量用戶的使用。你們剛才看到的截圖展示了其中一種使用方式,它給人一種驚艷的通用智能體驗。特別是對于那些熟悉AI產(chǎn)品的程序員或用戶來說,他們紛紛開始投入使用。
之后,OpenAI開始發(fā)布一些新的模型和能力,比如多模態(tài)模型。通過上傳圖片或音頻,這些模型可以幫助我們理解其中的內(nèi)容。這意味著它們具備了視覺和聽覺的能力,為我們打開了一個前所未有的領(lǐng)域。
在前年,國內(nèi)公司如百度、阿里和騰訊紛紛開放了它們自己的大語言模型,而華為、OPPO和Vivo也在他們的手機(jī)端推出了大語言模型能力。小米也曾提及過,各個手機(jī)廠商基本上都在致力于大語言模型的發(fā)展。
與此同時,看到下面一側(cè),AIGC的發(fā)展速度也引起了相關(guān)政策法規(guī)的關(guān)注。由于可能涉及版權(quán)和數(shù)據(jù)源的問題,政策法規(guī)部門也在跟進(jìn)。
之前有新聞提到,各類新聞媒體如紐約時報開始關(guān)注是否有機(jī)構(gòu)使用他們的數(shù)據(jù)進(jìn)行訓(xùn)練,因為一些生成的內(nèi)容與其文章高度相似,這可能會引發(fā)侵權(quán)問題。
另外一方面,AIGC在未來的市場規(guī)模是我們評估行業(yè)技術(shù)發(fā)展的一個重要方面。
首先,我們需要關(guān)注整個市場的規(guī)模預(yù)測。若市場規(guī)模預(yù)測足夠龐大,那么AIGC的未來趨勢將是一個非常值得投資或創(chuàng)業(yè)的前景。
據(jù)中國AI產(chǎn)業(yè)群體報告顯示,到2030年,AIGC的市場規(guī)模有望達(dá)到萬億級別。
今年,多家廠商已經(jīng)在主流應(yīng)用場景中鋪開了部署,并推出了一些收費模式。
-
舉例來說,像阿里云和華為云開放了大語言模型能力,并提供收費調(diào)用服務(wù)。
-
另外,一些公司可能會提供圖像生成工具,用戶可以在其網(wǎng)站上生成并下載圖片,下載過程可能需要付費,尤其是對于超出內(nèi)容的部分。
-
第三種則是用戶訂閱軟件或一次性購買模型,然后針對其私有數(shù)據(jù)進(jìn)行定制開發(fā)。
這些付費邏輯點可能會在AIGC未來的發(fā)展中扮演重要角色,尤其是在面向To C端或To B端的情況下。
右邊的圖像,是一個名為"妙鴨相機(jī)"的app,最近這段時間很流行。它的基本原理是圖像生成模型。你可以輸入大約20多張圖像,讓模型學(xué)習(xí)你的臉部輪廓和細(xì)節(jié),并對其進(jìn)行微調(diào),最后生成符合你預(yù)期的證件照。
在AIGC爆發(fā)之前,像這種小程序或APP進(jìn)行AIGC內(nèi)容生成并不常見,因此使用時會給人一種神奇的感覺。
這種應(yīng)用的優(yōu)點是相對于線下或其他拍照方式,它能夠即時生成證件照,并且價格更親民,成品率也相對較高。
總體而言,我認(rèn)為目前AIGC在這個領(lǐng)域的發(fā)展非常迅速,未來將對產(chǎn)業(yè)做出重大貢獻(xiàn)。過去,數(shù)據(jù)應(yīng)用主要基于已有形態(tài),比如輸入文本進(jìn)行分類。
但現(xiàn)在,隨著AI技術(shù)的發(fā)展,與之交互的方式有了根本性的改變。AI可以與用戶互動、進(jìn)行對話,讓你感覺像是在與一個智能NPC聊天,這種變化顛覆了以往的流程。
媒體平臺AIGC功能?
媒體平臺AIGC功能-廣點通
首先,我使用的是廣點通廣告賬戶。作為廣告主,當(dāng)我點擊進(jìn)入后,可以看到創(chuàng)意中心和AIGC工具箱。如果你也是廣告主賬戶,你可以直接進(jìn)入功能頁查看。這些圖片都是我從騰訊廣告平臺上截取的。
從這些圖片中可以看出,很多都是關(guān)于文生圖內(nèi)容,包括像素材制作、商品核查、智能編輯、快速視圖以及文案助手等功能,大多數(shù)功能都是以文生圖為主。
在左下角,我們可以看到一個行業(yè)選項。當(dāng)你選擇素材創(chuàng)作時,它會提供幾個選項,包括選擇不同行業(yè),然后會針對不同行業(yè)做一些個性微調(diào)。
它不會一上來就給你一個通用大模型,因為這樣的話,模型訓(xùn)練到的效果可能不夠精準(zhǔn),輸出的效果也不會很好。如果你有對應(yīng)的行業(yè),選擇針對行業(yè)進(jìn)行微調(diào),那么輸出的效果就會更符合預(yù)期,成功率也會更高。
對于模型的選擇,它提供了三個選項。如果你想生成一些常見的物品,比如電商產(chǎn)品、化妝品或瓶子等,寫實通用模型可能已經(jīng)足夠好了。
如果你想生成模特或者電商服裝模特,我建議選擇混元寫實模型,因為經(jīng)過對比,輸出的效果更加寫實,看起來更加真實。
而如果有去了解過阿里云、騰訊云、華為云這些,在你使用它們的時候,也會提供上述類似的選項給你。
在廣點通中,我認(rèn)為相對比較出色的地方在于右側(cè)的部分。在這一塊,當(dāng)你需要生成文生成圖時,你需要有一些文字描述,然后讓模型幫助你生成你想要的圖片。
在這種情況下,你可能不清楚如何編寫文字以確保模型認(rèn)可并輸出高質(zhì)量的圖片。在這點上,廣點通做得相當(dāng)不錯。
比如,當(dāng)我輸入“一瓶消毒水”,它可以擴(kuò)展成三個內(nèi)容,這顯然是針對模型本身的能力。當(dāng)我們輸入“消毒水”時,它可能會自動生成一些內(nèi)容,比如透明塑料瓶和一些簡單的標(biāo)簽。我們可以點擊這些標(biāo)簽進(jìn)行修改,同時微調(diào)擴(kuò)寫的細(xì)節(jié),對關(guān)鍵詞進(jìn)行修改,使描述更加清晰。
接下來,我將展示一下廣點通在這方面的功能。如果我們想要輸出一個模特的圖片,那么對于輸入的描述應(yīng)該怎樣更合適呢?
首先,我可能會簡潔地描述為一個穿著連衣裙的模特,正面拍攝,簡約背景,高度詳細(xì)的光線,類似時尚雜志照片的關(guān)鍵詞。
因為實際上,整個輸出的內(nèi)容主要是由關(guān)鍵詞組成的,要匹配你預(yù)期的圖片生成樣式。你可以看到,管理審核非常嚴(yán)格,左上角和右下角會生成四張圖片,但其中兩張會被過濾掉。
在這方面,我認(rèn)為平臺還沒有做得很好,它應(yīng)該能夠自動過濾掉一些不符合要求的內(nèi)容,并重新生成符合要求的內(nèi)容,而不是需要你重新操作來增加交互的程度。
另外,對于右側(cè)的部分,我添加了一個全身照片,質(zhì)量精致。你會發(fā)現(xiàn),即使我沒有輸入一些敏感或相對隱晦的詞語,它仍然會對我的審核內(nèi)容和生成內(nèi)容進(jìn)行說明。
媒體對內(nèi)容質(zhì)量要求較高,而廣點通是一個生成素材的工具。通過輸入文字并點擊立即生成,它可以生成圖片,而不是生成文案。
你可以通過使用關(guān)鍵詞逐漸使生成的圖片更精致、符合預(yù)期要求,這是該工具的特點之一。
此外,它還具備商品摳圖和商品合成的功能。
就質(zhì)量而言,我認(rèn)為這部分相對簡單,因為商品合成后的結(jié)果可能需要更好的關(guān)聯(lián)性。如果有技術(shù)能力,與AIGC的關(guān)聯(lián)可能會更簡單,因為它只是幫助你進(jìn)行簡單的摳圖。如果你具備Photoshop技能,你也可以輕松實現(xiàn)。
對于沒有技術(shù)能力的人來說,可以嘗試使用這個功能,但實際上,它的定制化能力相對較弱。
接下來我們來談?wù)勵^條。
與廣點通相反,頭條的投放內(nèi)容中,文生文的比例較大。
這與頭條當(dāng)前的場景相關(guān),它在這方面做得相當(dāng)不錯。頭條在腳本和直播腳本方面的深度較大,首先開放了文生文,因為這方面的能力開放相對較容易。
我了解到,它其實也可以投放文生圖,但需要去開白并使用,并沒有提供明面上的創(chuàng)意工具體驗。
在頭條的廣告賬戶中,進(jìn)入聚焦創(chuàng)意創(chuàng)作工具,你會發(fā)現(xiàn)基本上還是以文生文為主。其他功能基本上是一些簡單的剪輯或者Photoshop功能。如果你沒有技術(shù)能力,也可以在這個平臺上進(jìn)行簡單的操作。
在右上角的AI視頻部分,如果你輸入的內(nèi)容與熱門產(chǎn)品相關(guān),比如我的產(chǎn)品是王者榮耀,處理起來可能會更容易,因為模型中可能已經(jīng)包含了這方面的信息。建議在輸入內(nèi)容時,可以假設(shè)你的產(chǎn)品是一個熱門產(chǎn)品,對標(biāo)一些大的競品,然后進(jìn)行輸入。
輸入完成后,如果想要使用其中的內(nèi)容,可以將其復(fù)制出來,然后用你自己的產(chǎn)品或品牌進(jìn)行替換,這是一個相對不錯的技巧。
在視頻腳本制作方面,大多數(shù)人在使用這些平臺產(chǎn)品時不會直接使用它們提供的框架。我認(rèn)為最好的用法是將其用作靈感的擴(kuò)展,因為它生成的內(nèi)容大多是基于網(wǎng)上熱門的結(jié)構(gòu)和內(nèi)容。
你可以通過它來生成本地化的腳本內(nèi)容,以便在新的平臺上觸及更廣的廣告角度,這是最主要的用途之一。
另外一個用途是單品腳本的生成,它也提供了直播腳本,但你不會直接使用它的話術(shù),因為這些話術(shù)比較通用。
關(guān)鍵是要利用它的靈感,而不是直接使用其中的內(nèi)容,否則你的內(nèi)容可能會與網(wǎng)上的重復(fù)度很高。
在視頻初期階段,腳本內(nèi)容可能存在問題,但如果你在畫面和細(xì)節(jié)上有所差異,你可能會創(chuàng)作出一些熱門視頻。你需要在細(xì)微之處有一些變化,包括整體畫面、音頻、腳本內(nèi)容的差異化??偟膩碚f,這個工具主要是用來瀏覽靈感庫的。
在這方面,我認(rèn)為媒體平臺的AI功能是非常重要的。現(xiàn)在主要有三個平臺,分別是頭條、廣點通和百度。
關(guān)于為什么沒有提到快手,我進(jìn)行了一些調(diào)研,發(fā)現(xiàn)快手并沒有直接展現(xiàn)AIGC功能的部分,它更多是混編的功能。所以在定義為AI生成內(nèi)容方面,快手可能并不適用。
我主要關(guān)注的是頭條、廣點通和百度,其中百度的百家號是最簡單的一個平臺,里面有很多內(nèi)容。我對這三個平臺有一些了解。特別是百度在文本生成方面做得非常好,在國內(nèi)處于領(lǐng)先地位。
如果你對文本生成感興趣,即使沒有廣告主賬戶,你也可以通過百度的文心一言去體驗它的文本生成環(huán)境。
媒體平臺AIGC功能
-
首先是平臺成熟業(yè)務(wù)
比如字節(jié)或者說頭條,它們的巨量直播業(yè)務(wù)做得非常好,因此可以將AI生成內(nèi)容作為成熟業(yè)務(wù)的延伸。由于它們擁有大量的數(shù)據(jù),所以實施起來更容易成功,因為數(shù)據(jù)量很大。
再看廣點通,為什么要進(jìn)行文生成圖?我個人理解是因為廣點通在圖文領(lǐng)域確實做得很出色。所以在整個擁有大量數(shù)據(jù)的環(huán)境下,只要你實施AI生成內(nèi)容,成功的概率就會更高。
-
其次是內(nèi)容的可信要求
你看一下廣點通,即使只是輸入一些普通的詞匯,便立刻不給你過審。目前AI生成內(nèi)容正處于快速發(fā)展階段,它可能會受到一些政策要求的限制,AI生成內(nèi)容對自身的要求也會比較嚴(yán)格。因此,在未來,這一領(lǐng)域可能會陸續(xù)采取一些合規(guī)措施。
-
最后,未來的想象空間是非常大的
目前的功能相對來說還比較有限,開放的能力維度也不是很全面。我現(xiàn)在只能介紹文生成圖這個方面,但是像文生成視頻、圖生成視頻或者視頻生成視頻等類似場景還沒有完全開發(fā)出來,可能有一些是從灰度測試的角度,還有一些是私下提供給部分廣告主進(jìn)行體驗。
總的來說,在這個領(lǐng)域,未來的發(fā)展還將大力推進(jìn),因為廣告創(chuàng)作內(nèi)容是一個非常強(qiáng)大且廣泛應(yīng)用的領(lǐng)域。
?AIGC在廣告各場景應(yīng)用?
目前來說AIGC在廣告各場景應(yīng)用主要有:文生文;文生圖、圖生圖;視頻生成;AI投放助手。
AIGC在廣告各場景應(yīng)用—文生文
像前面一二點,現(xiàn)在一些公司或廠商已經(jīng)開始大規(guī)模推廣AIGC的各項功能。如果你在一家廣告代理公司或廣告部門工作,可能會有廠商向你推廣AIGC的各項功能,特別是在垂直領(lǐng)域可能會更有優(yōu)勢。
舉例來說,文本生成應(yīng)用已經(jīng)非常成熟,因為它符合了廣告文案、小紅書文和廣告文案等領(lǐng)域的需求。相對來說,使用文本生成應(yīng)用會更容易且更成熟。在廣告營銷的文本生成場景中,可能會面臨選擇哪種文本生成模型的困惑,因為現(xiàn)在有太多的模型可供選擇。
然而,如果你不知道該選哪個,那么選擇chatGPT系列肯定是一個明智的選擇,因為在綜合性能上,它無疑是最優(yōu)秀的。
如果你無法使用GPT-4或者其他版本,我建議你可以嘗試國內(nèi)的模型,因為國內(nèi)在文本生成領(lǐng)域已經(jīng)開始趕上像chatGPT這樣的領(lǐng)先模型,比如文心一言、阿里的通訊新聞、騰訊的會員以及搜狗或訊飛等。
基本上,當(dāng)你使用完這些模型之后,你會發(fā)現(xiàn)它們就像智能NPC一樣與你交互,并且生成的內(nèi)容質(zhì)量也不錯。
總體來說,就中文語言理解和生成能力而言,國內(nèi)的大型模型已經(jīng)迎頭趕上國外的同類模型。這一維度可能是國內(nèi)模型的相對優(yōu)勢,因為它們專注于中文領(lǐng)域。
在選擇模型時,首先你需要選擇一個模型。然后,你可以使用該模型生成內(nèi)容。在使用過程中,你可能會遇到一些困惑,例如在進(jìn)入文心一言、chatGPT頁面后,你可能不清楚如何輸入內(nèi)容以獲得更好的文本生成結(jié)果。
我通過一個流程圖逐步介紹給你,并為你提供反饋。如果你的輸入內(nèi)容不太合適,你可以再輸入一些內(nèi)容,模型會逐漸變得更準(zhǔn)確,并且生成的內(nèi)容將更符合你的預(yù)期。
在我最左邊的話是一個設(shè)計師一個角色,首先我們需要使用大型語言模型或文心一言來生成符合蛋仔派對宣傳信息流的文案,長度不超過30個字。
我們輸入一個請求,模型可能會返回這樣一句話:"蛋仔派對,脆香甜"。如果你對蛋仔派對有所了解,你可能會笑,因為蛋仔派對是一個游戲,這樣的廣告?zhèn)鞑タ隙ㄊ怯袉栴}的,因此這個文案是不可行的。
在使用大型語言模型時,首先需要明確指出你的需求。大型語言模型與角色扮演有很大的不同,你讓他去寫一個PPT演講稿,你就對他說你是一個PPT演講專家,如果你要讓他寫一個文案,你就跟他講說你是一個文案寫作專家。
它需要清晰的指導(dǎo),因為它的數(shù)據(jù)量和維度遠(yuǎn)超角色扮演,需要將你的需求映射到相應(yīng)的數(shù)據(jù)集或數(shù)據(jù)維度,然后提供相關(guān)背景知識,以生成符合預(yù)期的內(nèi)容。
從廣告文案的角度來看,"加入我們的蛋仔派對,一起探索這充滿樂趣的世界吧!"這句話可能顯得有些冗長。通常廣告標(biāo)題大約在15字以內(nèi),有時可以延伸到30字以內(nèi)。因此,我們需要進(jìn)行關(guān)鍵詞提取,以確保文案簡潔明了。
在我圈選的中間有一塊叫做“Prompt”的設(shè)計增強(qiáng)。關(guān)于"Prompt"的設(shè)計增強(qiáng),它指的是輸入內(nèi)容的方式,是一個專有術(shù)語。關(guān)鍵詞提取需要精準(zhǔn)表達(dá)想要傳達(dá)的信息,使文案更口語化、年輕化,符合信息流用戶的語言習(xí)慣。
這樣的設(shè)計能夠被大型語言模型理解,并輸出符合預(yù)期的內(nèi)容。
第二個就是在進(jìn)行廣告文案編輯時,需要專注于分享游戲體驗,而不是直接引導(dǎo)下載。同時,避免使用拉踩或其他極限表達(dá)形式,盡量避免類似廣告法的用詞。
我們希望避免模型輸出一些過于極端的內(nèi)容。但你看,你輸出完之后。他就輸出“蛋仔派對簡直是我的最愛”,并不符合要求。
大型語言模型的輸出具有一定的概率性,因此并不是輸入什么就一定會得到相應(yīng)的反饋。我們的目標(biāo)是通過良好的寫作方式,提高模型輸出符合預(yù)期內(nèi)容的概率,雖然無法完全確保百分之百的準(zhǔn)確性,但通過逐步改進(jìn),我們可以提高模型輸出準(zhǔn)確內(nèi)容的概率,通過后面的一個思路慢慢去生成。
第三個叫集成學(xué)習(xí),另外也叫對抗學(xué)習(xí)。例如我在文心一言輸入相關(guān)指令,文案出來了。我新增一個對話,問另外一個文心一言,評價剛剛那個文心一言生成的文案是否合適。通過這種方式,他對抗,我評價,然后把評價返回給我,以此讓模型進(jìn)行學(xué)習(xí),包括了解我在之前提到的需要補(bǔ)充的內(nèi)容。
在這個過程中,模型可能會提供一些評價,并給出優(yōu)化建議。優(yōu)化建議中可能會涉及到他提到的最喜愛的游戲,指出了之前沒有明確說明的問題,然后將"我的最愛"改為"我最喜歡的游戲"可能會更好一些。
有一個術(shù)語叫做大語言模型中的CoT,它是思維鏈和數(shù)據(jù)鏈的提示方式,是一個相對專有的定義。
類似于代理模型的研究,有人發(fā)表論文指出,對于特定問題,可以通過教導(dǎo)模型進(jìn)行簡單計算,例如教它1加1等于2,2加2等于4。這種教學(xué)方法可以通過問答和示例來實現(xiàn),在輸入過程中,我們可以寫下這個過程,并發(fā)現(xiàn)準(zhǔn)確率會明顯提高,同時也符合穩(wěn)定性的要求。
類似的,對于文案生成,如果出現(xiàn)不符合廣告法的內(nèi)容,比如使用"最"、"第一"等詞語,我們可以將這些文案替換為合適的詞語。
請你一步一步思考,這句話也要教,因為你少加一句,或者說多加一句,反饋的結(jié)果是不太一樣的。
它最后生成“你聽過蛋仔派對嗎?它簡直是我很喜歡的游戲!趕緊來邀請你的小伙伴一起參與這場戰(zhàn)斗,感受蛋搭子的派對吧!”從一開始的“蛋仔派對,脆香甜!”會直觀感受到廣告文案的整個生成過程。
AIGC在廣告各場景應(yīng)用—文生圖
相比文生圖,我覺得文生文更容易理解。在廣告平臺上,我們經(jīng)常會看到文案助手等工具,它們可以生成一些文案,這可能就是文生文的初步雛形。
文生文在特定場景下可能更成熟,但是文生圖的顛覆性更大。
以前你可能需要使用Photoshop來創(chuàng)建圖像,但現(xiàn)在它可以直接生成一張圖。
這張圖可能與你預(yù)期的成品相差不大,現(xiàn)在可以直接使用,甚至簡單的插畫或游戲插圖,稍加修飾后就可以使用,這是之前完全沒有想象到的。
整個設(shè)計軟件,從工具類應(yīng)用到生產(chǎn)力應(yīng)用的轉(zhuǎn)變,我覺得在AIGC所做的文生圖和圖片領(lǐng)域,帶來了顛覆性的變革。
頁面上展示的內(nèi)容,你可能看不出來是由AI生成的,可能會以為是由專業(yè)設(shè)計師制作的成品圖,這帶來了一種全新的體驗。
現(xiàn)在我來說明一下,傳統(tǒng)工作流以及AI生產(chǎn)的工作流有何不同。
傳統(tǒng)工作流
傳統(tǒng)工作流通常包括幾個步驟。首先是方案設(shè)定,通?;跔I銷策略和投放結(jié)果,確定后續(xù)素材內(nèi)容生成的主題方向。
接下來是草案設(shè)計,你會提供一個相對粗糙的稿子,因為很少一稿就能通過審核。你會將這份初稿交給客戶或者投放團(tuán)隊的同事,等待確認(rèn)后才會進(jìn)行大規(guī)模的創(chuàng)意設(shè)計。
設(shè)計完成后,部分成品交付或成品交付后可能需要進(jìn)行創(chuàng)意微調(diào)和修改,最終交付成品。傳統(tǒng)工作流可以簡單理解為流水線式的流程。
AI生成工作流
由于AI的快速發(fā)展,它在主題生成方面的能力已經(jīng)相當(dāng)出色。
主題生成是指從一些關(guān)鍵詞中提取主題,然后使用AI生成相關(guān)內(nèi)容。在這個過程中,你可能會得到許多生成的內(nèi)容,然后將其呈現(xiàn)給業(yè)務(wù)方。由于生成的量可能很大,業(yè)務(wù)方可能會選擇其中一個方向進(jìn)行批準(zhǔn)。
一旦批準(zhǔn)后,你可以通過AI直接對細(xì)節(jié)進(jìn)行進(jìn)一步的控制,以便快速得到最終的數(shù)字成品,這是一種AI生成工作流的方式。
第二種方式是輸出一些半成品,例如背景圖,然后你可以選擇找真實模特進(jìn)行拍攝,再與AI進(jìn)行平衡。這種AI創(chuàng)意可以提升你的效率。接著是注冊微調(diào)和加工產(chǎn)品。你會逐漸發(fā)現(xiàn)它會提高你的制作效率,并擴(kuò)大你的創(chuàng)作思維的覆蓋范圍。
另外,文生圖最主要最核心的兩個應(yīng)用,一個是StableDiffusion,一個是Midjourney。
對于那些擁有技術(shù)能力的內(nèi)部廣告增長平臺或創(chuàng)意管理平臺,大部分都會致力于實現(xiàn)高度定制化。特別是在電商領(lǐng)域,這一點尤為突出。它們可以進(jìn)行精細(xì)的肢體調(diào)節(jié)和控制,相對于目前其他廠家提供的控制方式,定制化程度更高。
而像Midjourney這樣的平臺,它輸出的圖像通常具有高清晰度和高度精美的特點。大多數(shù)情況下,Midjourney的輸出內(nèi)容也會符合你的要求。
我注意到很多設(shè)計師同行都會在這個平臺上生成一些草圖,并進(jìn)行微調(diào)。因為使用這個平臺,你只需要一定的途徑即可,而不需要自己搭建服務(wù)器等復(fù)雜操作。因此,大多數(shù)設(shè)計師同行更傾向于使用Midjourney。
以Midjourney為例
首先,你需要提取營銷策略和關(guān)鍵詞的信息以確定整體設(shè)計風(fēng)格。對于提取關(guān)鍵詞,你可以使用Midjourney的參考圖作為輸入,或者根據(jù)自己已有的關(guān)鍵詞或情緒板進(jìn)行輸入。
如果你需要進(jìn)行類似延伸或競品的設(shè)計,Midjourney可以輸出相關(guān)的關(guān)鍵詞。完成關(guān)鍵詞輸出后,你可以使用以下命令來了解Midjourney模型的特點。
建議你先了解一下這些命令,以便更好地使用關(guān)鍵詞生成功能。如果你對Midjourney模型不太熟悉,我建議你上網(wǎng)搜索相關(guān)資料,這將有助于你快速入門。
另外,細(xì)節(jié)修改和墊圖也是Midjourney的特點。對于細(xì)節(jié)修改,我建議你使用墊圖。墊圖類似于你之前已經(jīng)有的成品圖,但你希望進(jìn)行一些形狀或色調(diào)上的調(diào)整。
好比化妝品形狀本來是豎的,但你希望它是斜一點的。如果直接使用關(guān)鍵詞,它可能無法滿足你的要求,因為關(guān)鍵詞可能存在一些偏差。但是,使用墊圖后,你可以將圖像和文字結(jié)合,整體內(nèi)容就能更好地達(dá)到你的預(yù)期。
在進(jìn)行細(xì)節(jié)修改時,還有一個叫做圖像權(quán)重系數(shù)的參數(shù)。一般來說,推薦的經(jīng)驗參數(shù)是1到2。你可以直接使用2,因為這是一個經(jīng)驗參數(shù)。使用這個參數(shù)后,生成的圖像可能會更接近你的墊圖內(nèi)容,因為你本來就希望將其內(nèi)容進(jìn)行組合。
在使用墊圖時,有幾個要點需要注意。
-
首先,墊圖應(yīng)該是一張沒有文字的圖片。如果墊圖帶有文字,生成的圖像可能會包含亂七八糟的文字,并且不符合你的字體要求,所以最好避免這種情況。
-
其次,墊圖中的細(xì)節(jié)不應(yīng)太多,因為太多的細(xì)節(jié)會使模型難以理解你想要突出的主體是什么。
-
第三,墊圖的風(fēng)格應(yīng)與需求相符。你不能使用一張與目標(biāo)完全不同風(fēng)格的照片作為墊圖,例如用一張純黑的照片去墊一張白色背景的圖,這樣的要求是不一致的。
總的來說,通過這樣的輸入,在Midjourney的流程中按下輔助鍵,你會發(fā)現(xiàn)生成的圖像與參考圖非常相似。因為墊圖實際上是參考圖去除了一些文字和背景材料后進(jìn)行的繪制,目的是與參考圖相似。
視頻生成
目前來看,視頻生成任務(wù)本身就具有相當(dāng)大的挑戰(zhàn)性。我所展示的樣品示例已經(jīng)相當(dāng)不錯了。但實際體驗時,與期望的效果還有相當(dāng)大的差距。
因此,整個視頻生成流程目前還未達(dá)到非常出色的水平。每一幀的過渡和細(xì)節(jié)表達(dá)都需要更精細(xì)的處理,特別是在需要滿足廣告視頻等15秒到30秒的短時任務(wù)要求時,我們對細(xì)節(jié)的要求會更高。
當(dāng)然,我相信未來會有更多突破和創(chuàng)新,視頻生成技術(shù)會不斷發(fā)展。我對這方面充滿期待,因為整個流程目前還在不斷發(fā)展之中,而像類動畫使用會比較多。
對于我們來說,視頻生成在信息流和廣告主辦方面都是非常重要的環(huán)節(jié),因為視頻媒體在當(dāng)前的信息流中已經(jīng)占據(jù)了很大的比重。
那么,我們應(yīng)該如何解決這個問題?我們應(yīng)該如何利用大型語言模型來提升視頻生成的產(chǎn)能和內(nèi)容效果呢?
我要向大家介紹一個我們自己內(nèi)部的實用技術(shù),即AI混編。
在AI混編中,我們使用視頻鏡頭的素材。通常情況下,混編是通過將多個視頻鏡頭組合成一個視頻。
但是,通過AI技術(shù)或者設(shè)計師的幫助,我們可以將這些素材或視頻片段分解成原始材料,然后利用大型語言模型和機(jī)器學(xué)習(xí)模型重新組合,生成一個具有故事情節(jié)或相似內(nèi)容的視頻。
市面上的一些混編產(chǎn)品大多數(shù)仍然需要人工處理,盡管它們有一些推薦邏輯,但手工處理仍然占據(jù)主導(dǎo)地位。然而,我提出的方案可能只需要很少的手工處理,主要是維護(hù)一些元素、片段。
整體而言,后續(xù)的生成過程可能會比完全手工操作效果更好。
在混編過程中,如果使用過多相似素材,可能會導(dǎo)致重復(fù)度過高。通過類似腳本生成的方式,利用生成模型生成虛擬腳本,可以滿足一些特定要求。
這種方法可以利用歷史腳本數(shù)據(jù)以及大型語言模型的輸入,生成略有不同或更好的腳本。設(shè)計師也可以提供腳本結(jié)構(gòu),因為AI需要使用大型語言模型來完成這些任務(wù)。
我們可以通過素材片段的組合推薦來構(gòu)建腳本結(jié)構(gòu)。這里有一個關(guān)鍵點:是鏡頭推薦模型,它是一個圖像識別模型,用于評估鏡頭的質(zhì)量和相似度。
這個模型會對鏡頭進(jìn)行數(shù)據(jù)評估,判斷鏡頭的受歡迎程度以及與其他鏡頭的相似度。然后,我們讓生成模型將這些有潛力的鏡頭串聯(lián)起來。
接著,通過向量數(shù)據(jù)庫,也就是大型語言模型中稱為知識庫或搜索引擎庫,我們存儲了大量視頻片段,可以在這個數(shù)據(jù)庫中檢索出我們需要的整個視頻片段。
完成這些步驟后,我們可以得到一個預(yù)設(shè)的分類,包括黃金三秒和故事內(nèi)容還有落版。
AIGC在廣告各場景應(yīng)用——AI投手
利用Agent協(xié)作進(jìn)行廣告投放
AI投手的話,我們使用的是Agent。很多人可能接觸到文生圖,但不知道Agent是什么東西。
Agent指的是一種能夠感知環(huán)境、理解環(huán)境并做出決策和采取行動的人工智能系統(tǒng),它是一個不斷學(xué)習(xí)和進(jìn)化的AI系統(tǒng),具備強(qiáng)化學(xué)習(xí)能力,可以做出智能決策。
比如下面的游戲場景,左邊是一個小鎮(zhèn),叫做斯坦福小鎮(zhèn),這是一個游戲中的地方,會有很多NPC,而這些NPC實際上都是Agent,他們有自己的初始設(shè)定,會自己進(jìn)行對話,類似于自然對話,沒有人為干預(yù)。
我們進(jìn)行了一個實驗,兩周后,他們可以自己組織一個派對,甚至有些NPC會主動去找別人結(jié)婚。我們并沒有編寫NPC的腳本或者決策流程,完全是通過大模型的技術(shù)實現(xiàn)的。
所以,這里有一個AI投手的概念,因為像智能投放這樣的東西,比如廣告投放,大家希望有一個投手來幫助實現(xiàn)整個智能投放環(huán)節(jié),實現(xiàn)自動投放,解放人力,并實現(xiàn)一些策略執(zhí)行的環(huán)節(jié)。
Agent 強(qiáng)化學(xué)習(xí)
Agent 本身是強(qiáng)化學(xué)習(xí)的過程,加上大語言模型的技術(shù),整合起來就是AI的新技術(shù)。訓(xùn)練方面,因為智能投放需要準(zhǔn)備和思考的環(huán)節(jié)很多,所以并不是說使用一個Agent就可以完全實現(xiàn),這是不現(xiàn)實的。
在運營方面有兩個層級,第一個是利用模型預(yù)測成績,通過Marketing API的接口拉取投放數(shù)據(jù),根據(jù)業(yè)務(wù)規(guī)則判斷正負(fù)樣本。投手們在做一些內(nèi)容和操作時,并不清楚自己的操作是否正常,所以可能會出現(xiàn)問題。
通過數(shù)據(jù)清洗和針對我們當(dāng)前階段目標(biāo)的一些規(guī)則,比如成本優(yōu)先、過量優(yōu)先或ROI優(yōu)先,進(jìn)行正負(fù)樣本的清洗。完成這個模型后,就會得到一些候選廣告,這些廣告會有一些得分。
這一部分是一個找約束的過程,我們預(yù)測得分時,并沒有強(qiáng)制要求它是怎樣的情況,我們希望它按照成本優(yōu)先或獲量優(yōu)先的方式進(jìn)行預(yù)測,這是從機(jī)器學(xué)習(xí)預(yù)測的角度出發(fā)的。
可能我們會有一些場景,使用這個模型進(jìn)行廣告推薦,這已經(jīng)是一個非常成熟的環(huán)節(jié)了。但現(xiàn)在我們不再由人來操作廣告推薦,而是由AI來操作。對于這些AI,我們需要給它們一些約束,我稱之為硬性約束,比如總預(yù)算、人群定向和創(chuàng)意等。
因為你必須給它們一個不可逾越的目標(biāo),否則如果它們幫你跑太多量,或者增加了成本,那就會很麻煩。在這里,約束是必要的,我們可能會有不同的配置,這些配置要在投放中進(jìn)行調(diào)整。
Agent的話,有一個預(yù)算敏感型和成本敏感型,還有一個是記憶模塊。廣告本身是一個周期性的東西,你可能上半年是這樣子的,下半年可能就不是這樣子了,所以你會選擇設(shè)定時長。
第三個的話,要理解整個創(chuàng)建計劃的流程,包括預(yù)算、規(guī)格、計劃數(shù)量。
在這個具體的流程中,我們在預(yù)測范圍內(nèi)根據(jù)我們的要求篩選符合條件的元素。接著,我們對這些元素進(jìn)行軟約束并進(jìn)行評分。
完成評分后,我們進(jìn)行篩選,得到符合要求的一些計劃。然后進(jìn)行投放,根據(jù)效果數(shù)據(jù)再次執(zhí)行計劃階段,然后不斷反復(fù),最終達(dá)到我們的投放要求。
AI投放的核心在于強(qiáng)化學(xué)習(xí)和決策學(xué)習(xí)。目前機(jī)器無法保證100%的成功。整個流程是數(shù)據(jù)化的,因為你可以通過這個流程去改進(jìn)整個AI投放的細(xì)節(jié)。如果能夠復(fù)制可用的AI投放策略,就可以省去很多成本。
從某種程度上來說,它可能會覆蓋三分之二到四分之一的投放工作,只需要在決策層做一些流程上的調(diào)整。我認(rèn)為在廣告領(lǐng)域,這是我們未來可能會探索的方向。
?展望?
目前來看,作為運營,我認(rèn)為提升廣告內(nèi)容的創(chuàng)作和決策效率是非常重要的。
我們應(yīng)該充分利用創(chuàng)作和決策的優(yōu)勢來提高效率。我注意到有些同事或設(shè)計人員了解一些技術(shù)細(xì)節(jié),但他們直接使用市面上的通用工具。
我個人建議不要這樣操作,因為通用工具往往不能滿足產(chǎn)品的具體要求,工具的落地效果與產(chǎn)品實際需求之間存在較大差異。因此,我們需要在通用工具的基礎(chǔ)上進(jìn)行優(yōu)化和定制,實現(xiàn)更精細(xì)化的創(chuàng)作,以滿足深層次的需求。
考慮到AI在規(guī)?;矫娴膬?yōu)勢,我建議逐步利用對廣告整體策略的控制流程。最初,可以嘗試優(yōu)化其中的某個方面,而不是一下子嘗試優(yōu)化多個方面。否則,你可能不清楚哪個部分需要優(yōu)化,這會導(dǎo)致大量資源的浪費,因為素材上的消耗通常是相當(dāng)大的。
因此,建議采取漸進(jìn)式的方式,以便更具針對性地投放,并且對AI的效果會更加顯著。最終,無論是文本、圖片還是視頻,通過你的流程或產(chǎn)品特質(zhì)進(jìn)行優(yōu)化是非常重要的。
?問答?
Q1:游戲廣告素材視頻有沒有一個最佳一些最佳時間路徑?
從視頻的角度來看,我們討論的主要內(nèi)容是關(guān)于游戲廣告素材的制作。例如,對于夜間游戲,可以在視頻剪輯過程中添加各種過渡特效。
此外,對于游戲中的元素,如標(biāo)語或貼圖,從媒體的角度來看,它們已經(jīng)包含了一些內(nèi)容和畫面的變化。由于游戲內(nèi)容相對有限,如果要大規(guī)模生產(chǎn),可能會遇到一些流程上的問題和重復(fù)度較高的挑戰(zhàn)。
因此,建議在貼圖上加入動畫元素,以豐富整個故事線,從而減少重復(fù)內(nèi)容的數(shù)量。你可以通過游戲內(nèi)容的豐富度來存儲視頻元素,將整個流程串聯(lián)起來。
無論如何,只要給每個環(huán)節(jié)打上標(biāo)簽,并通過AI技術(shù)讓系統(tǒng)理解,就可以實現(xiàn)這一點。雖然AI投手技術(shù)可能比較難以理解如何進(jìn)行投放,但是通過創(chuàng)新理解整個游戲視頻內(nèi)容的環(huán)節(jié)是相對簡單的。
算法工程師可以嘗試實現(xiàn)這一流程,并獲得良好的結(jié)果。我認(rèn)為最重要的一點是,通過這種方式,您可以大大緩解重復(fù)內(nèi)容的問題。
Q2:AIGC生成廣告可以全自動的說一定要人工參與?
根據(jù)目前的情況來看,如果要參與其中,可能只占到了30%左右,但仍然必須要有一定的參與度。有兩個關(guān)鍵點需要考慮。
首先,如果您希望生成的內(nèi)容質(zhì)量較高,必須進(jìn)行審核。如果不進(jìn)行審核,可能會出現(xiàn)一些問題,比如生成的模特可能會有三只手,或者女生的手指可能有四只或只有一只,這顯然不符合您的要求。
因此,您必須審核這些內(nèi)容才能進(jìn)行投放,因為這會對線上投放效果產(chǎn)生很大的影響,尤其是在大規(guī)模投放的情況下,風(fēng)險也會增加。
另外一個關(guān)鍵點是,在前期階段仍然需要一些主題或關(guān)鍵詞的設(shè)定。您不能完全沒有任何限制,然后期望系統(tǒng)能夠按照正常的流程生成內(nèi)容。
如果沒有一些明確的關(guān)鍵詞,系統(tǒng)可能會陷入一個死循環(huán),生成的內(nèi)容會越來越同質(zhì)化,最終無法達(dá)到您的預(yù)期。
因此,在參與這個過程時,需要審核生成的內(nèi)容,并設(shè)定一些主題或關(guān)鍵詞,以確保所生成的內(nèi)容質(zhì)量較高且多樣化,從而達(dá)到預(yù)期的效果。
Q3:AI生成的內(nèi)容都是根據(jù)歷史數(shù)據(jù)源,廣告的創(chuàng)新程度不高的話,會不會跟媒體算法推薦沖突?
在整個流程中,我希望大家能夠充分利用AI技術(shù)。具體來說,通過垂直領(lǐng)域的數(shù)據(jù)來進(jìn)行操作,而不是簡單地使用一個在線的預(yù)訓(xùn)練模型。
為什么這么說呢?因為在線預(yù)訓(xùn)練模型往往是基于公開的數(shù)據(jù)集,或者是別人已經(jīng)訓(xùn)練好的模型。
如果你再用這些模型進(jìn)行訓(xùn)練,那么你最初發(fā)布的內(nèi)容很可能與其他人的內(nèi)容相似。對于圖片處理,特別是視頻生成,無論是UGC(用戶生成內(nèi)容)還是用戶上傳的視頻,已經(jīng)有很多相關(guān)的應(yīng)用了。
所以,在這個領(lǐng)域中,你應(yīng)該使用自己領(lǐng)域的數(shù)據(jù)集來進(jìn)行模型訓(xùn)練,而不是使用公共的數(shù)據(jù)集。(國內(nèi)可以搜索的大語言模型排量數(shù)據(jù)資料,大多可以在SuperClue社群找到)。
你的公司肯定有一些小型產(chǎn)品或者已經(jīng)積累了一定數(shù)量的數(shù)據(jù),如果你沒有足夠的數(shù)據(jù)積累,我建議你可以參考競爭對手的信息或者使用已經(jīng)成熟的競品數(shù)據(jù),這樣可以提高你的效率。你不需要全部重新做一遍,但可以通過它們來提高你的初期效率,這是可行的。
所以,這個東西本身也不能完全照搬。因此,創(chuàng)新程度取決于你對數(shù)據(jù)源的掌控能力。如果你擁有自己的數(shù)據(jù)源,那么就不會違背媒體對創(chuàng)新程度的要求。
你可以開始時有一個由十個設(shè)計師組成的團(tuán)隊,后來可能剩下五個人,但是這五個人的工作效率會更高。它不能完全取代設(shè)計師同行,因為它只是一個工具,而不是完全智能化的東西。
關(guān)于圖像處理,我認(rèn)為人工的工作不僅僅是處理圖像,更重要的是廣告的人文因素。這也是一個要考慮的因素。就像我剛才提到的,你不能將帶有背景和文字的圖片直接放入電子圖中,因為電子圖生成的字體和文字可能會變得混亂,而且字體可能不符合你的要求,因為某些字體是受版權(quán)保護(hù)的。
在這方面,你肯定需要自己進(jìn)行操作,這可以節(jié)省前期流程中可能產(chǎn)生的許多工作,這是提高效率的一部分。
Q4:AIGC的廣告價值在于數(shù)量還是質(zhì)量?
我認(rèn)為這個環(huán)節(jié)目前還沒有一個確定的標(biāo)準(zhǔn)答案。首先,這只是我個人的觀點,并沒有一個明確的答案。在項目剛開始時,或者說團(tuán)隊還沒有達(dá)到較高水平時,我們需要達(dá)成共識。
如果能夠達(dá)成共識,后續(xù)的問題就不會成為障礙。你提到的AIGC,你的最終目標(biāo)是提高效率。如果這個方法能夠奏效,無論是在項目初期人員較少的情況下,還是在人力資源充足的情況下,你開始時采用這種方法可能會有一定的優(yōu)勢。
可能在質(zhì)量上無法與其他方法相媲美,但是因為你能夠更快地推出更多的內(nèi)容,所以就有可能取得成功。因此,你首先要確保質(zhì)量至少達(dá)到一個基準(zhǔn),然后才能提高效率。
第二個方面,當(dāng)你的項目已經(jīng)相對成熟,團(tuán)隊或產(chǎn)品已經(jīng)比較成熟時,AIGC可以幫助你減少常規(guī)圖像或視頻工作的工作量。它可以解決這個問題,讓你有更多的時間去探索和創(chuàng)作精品內(nèi)容。在這方面,它可以體現(xiàn)整體質(zhì)量的標(biāo)準(zhǔn)。
因此,AIGC本質(zhì)上是一個工具和流程,它只是作為一個基礎(chǔ),而設(shè)計團(tuán)隊的思想、創(chuàng)意和設(shè)計流程才是最重要的。文章來源:http://www.zghlxwxcb.cn/news/detail-797390.html
質(zhì)量和數(shù)量也是在設(shè)計團(tuán)隊中體現(xiàn)出來的。AIGC并不能完全串聯(lián)整個流程,但可以幫助你更快地推進(jìn)整個投放過程。文章來源地址http://www.zghlxwxcb.cn/news/detail-797390.html
到了這里,關(guān)于AIGC內(nèi)容分享(三十四):AIGC+信息流廣告的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!