国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

AIGC(AI Generate Content)之改頭換面——基于標(biāo)題生成和摘要生成的內(nèi)容創(chuàng)作方法

這篇具有很好參考價值的文章主要介紹了AIGC(AI Generate Content)之改頭換面——基于標(biāo)題生成和摘要生成的內(nèi)容創(chuàng)作方法。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。


內(nèi)容,已經(jīng)成了我們生活中必不可少的成分,無論是小紅書、抖音、愛奇藝等文本、短視頻以及視頻內(nèi)容還是騰訊、網(wǎng)易的游戲內(nèi)容。每天有不可計數(shù)的內(nèi)容被生成,同時又被無數(shù)人的消費著,通過手機、電腦沉浸在一個個的 APP 中,用自己的時間、精力、金錢為各種內(nèi)容買單。

內(nèi)容的生產(chǎn)方式也是隨著時代的變化在變化的,從最早的 PGC(Professionally Generated Content)到后來的 UGC(User Generated Content),以及現(xiàn)在逐漸火熱的 AIGC(AI Generate Content),面對龐大的內(nèi)容消費市場,我們?nèi)绾瓮ㄟ^ AIGC 的方式來進行內(nèi)容生產(chǎn)呢?本文以文本內(nèi)容為例,提供了一種思路,詳情見正文,其他方法見后續(xù)文章。

AIGC(AI Generate Content)之改頭換面——基于標(biāo)題生成和摘要生成的內(nèi)容創(chuàng)作方法


keywords: AIGC、摘要生成、文本生成、NLP、內(nèi)容創(chuàng)作、AI創(chuàng)作

一、概述

一篇文本內(nèi)容,一般有標(biāo)題+正文的方式,正文通常是圖文或者純文本的形式。本文以純文本為例。

生成思路:通過已有的原文數(shù)據(jù),通過一定的手段,生成新的標(biāo)題和正文數(shù)據(jù)

AIGC(AI Generate Content)之改頭換面——基于標(biāo)題生成和摘要生成的內(nèi)容創(chuàng)作方法

巧婦難為無米之炊,創(chuàng)業(yè)還需要啟動資金呢,我們至少有一批種子數(shù)據(jù),而新內(nèi)容是在已有的原文基礎(chǔ)上進行的生成,
新內(nèi)容的標(biāo)題和正文,可以通過 NLP 中文本生成的方法獲取,即標(biāo)題生成和摘要生成。

摘要生成,一般包括抽取式和生成式,抽取式是從原文中抽取關(guān)鍵的句子組成摘要;生成式則是在理解原文的基礎(chǔ)上進行語言的重新組織表達。很明顯后者的難度要遠大于前者。

二、過程

從上面我們知道,新內(nèi)容我們拆分為了標(biāo)題和正文的分別生成,那么,新內(nèi)容的創(chuàng)作問題轉(zhuǎn)換為了標(biāo)題生成和正文生成的 NLP 生成問題了,
而這兩個問題在 NLP 領(lǐng)域已經(jīng)進行了深刻的研究并取得了不錯的成果。

標(biāo)題生成

標(biāo)題生成可以看做是摘要生成的一個特例,相比摘要需要一定的長度和前后連貫性的要求,標(biāo)題則需要新穎性、簡短性的要求。兩者的模型一般來說結(jié)構(gòu)相同,訓(xùn)練數(shù)據(jù)格式也經(jīng)常相同。

目前標(biāo)題生成開源模型有:

  • tensorflow GPT2: https://github.com/liucongg/GPT2-NewsTitle
  • paddle Bert: https://aistudio.baidu.com/aistudio/projectdetail/3463042
  • paddle GPT2: https://aistudio.baidu.com/aistudio/projectdetail/2340166

基于公開的開源模型能夠在通用數(shù)據(jù)集上得到一個較好的效果,但如果遷移到自己的領(lǐng)域,可能效果就不盡如人意,需要通過一定的微調(diào)實現(xiàn)領(lǐng)域知識的學(xué)習(xí)。

正文生成

新內(nèi)容的正文,或者說摘要也是通過 NLP 生成模型來實現(xiàn),但目前公開的模型,在中文數(shù)據(jù)集上,實驗效果和實際效果存在一定的差異,或者說是數(shù)據(jù)集有效性,
目前效果比較好的幾個摘要生成開源模型如下:

  • 科學(xué)空間: https://kexue.fm/archives/8046/comment-page-1
  • GPT2: https://zhuanlan.zhihu.com/p/113869509
  • GPT2: https://github.com/qingkongzhiqian/GPT2-Summary
  • bert: https://github.com/dmmiller612/bert-extractive-summarizer
  • bert: https://geek.digiasset.org/pages/nlp/nlpinfo/bert-text-summarizer-chinese/
  • tianma: https://github.com/google-research/pegasus
  • https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/106893673

利用開源模型,或者進行微調(diào)后的開源模型,將原文轉(zhuǎn)換為一定長度和描述的摘要,生成的摘要就可以當(dāng)做新內(nèi)容的正文啦。

三、分析

從上面的過程中,我們可以看出,生成的結(jié)果是兩個模型結(jié)果的組合,并且兩個模型都是壓縮型的模型,將長文本轉(zhuǎn)換為短文本,那么,相應(yīng)的

  • 新內(nèi)容的篇幅一定小于原文的長度,因為無論是標(biāo)題還是摘要都是從原文中進行的概括總描述
  • 理論上,新內(nèi)容的質(zhì)量不高于原文,上限是原文的質(zhì)量等級。

在做 NLP 生成模型中,標(biāo)注數(shù)據(jù)的缺失是普遍遇到的問題。這需要一定的人力。

好啦,AIGC 方式進行內(nèi)容生成的第一個方法就是這樣啦,其他的方法,詳見后續(xù)文章啦~

元宵節(jié)快樂~文章來源地址http://www.zghlxwxcb.cn/news/detail-487892.html

到了這里,關(guān)于AIGC(AI Generate Content)之改頭換面——基于標(biāo)題生成和摘要生成的內(nèi)容創(chuàng)作方法的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • AIGC繪畫:基于Stable Diffusion進行AI繪圖

    AIGC繪畫:基于Stable Diffusion進行AI繪圖

    AIGC深度學(xué)習(xí)模型繪畫系統(tǒng) stable diffusion簡介 Stable Diffusion是2022年發(fā)布的深度學(xué)習(xí)文本到圖像生成模型,它主要用于根據(jù)文本的描述產(chǎn)生詳細圖像,盡管它也可以應(yīng)用于其他任務(wù),如內(nèi)補繪制、外補繪制,以及在提示詞(英語)指導(dǎo)下產(chǎn)生圖生圖的翻譯。 Stable Diffusion主要用于

    2024年02月12日
    瀏覽(31)
  • AIGC(Artificial Intelligence Generated Content)和 Web3對比,未來發(fā)展

    歷史背景 AIGC(Artificial Intelligence Generated Content)是指利用人工智能技術(shù)生成的內(nèi)容。隨著人工智能技術(shù)的不斷發(fā)展,AIGC 行業(yè)逐漸興起。早期的 AIGC 主要應(yīng)用于自動化寫作、新聞?wù)傻阮I(lǐng)域,隨著技術(shù)的不斷進步,AIGC 開始涉及更多的領(lǐng)域,如視頻生成、圖像生成、音頻

    2024年02月14日
    瀏覽(28)
  • AI工智能講師葉梓培訓(xùn)簡歷及提綱:AI人工智能之基于人工智能的內(nèi)容生成(AIGC)簡歷提綱

    AI工智能講師葉梓培訓(xùn)簡歷及提綱:AI人工智能之基于人工智能的內(nèi)容生成(AIGC)簡歷提綱

    威信:amliy007 上海交通大學(xué)計算機專業(yè)博士畢業(yè),高級工程師,高級程序員 主研方向:數(shù)據(jù)挖掘、機器學(xué)習(xí)、人工智能。 國內(nèi)知名上市IT企業(yè)的AI技術(shù)總監(jiān)、資深技術(shù)專家 一線人工智能經(jīng)驗(12年),大數(shù)據(jù)經(jīng)驗(8年),深度學(xué)習(xí)經(jīng)驗(5年) 在國內(nèi)外期刊、會議中發(fā)表論文

    2024年02月10日
    瀏覽(30)
  • 基于 transformers 的 generate() 方法實現(xiàn)多樣化文本生成:參數(shù)含義和算法原理解讀

    基于 transformers 的 generate() 方法實現(xiàn)多樣化文本生成:參數(shù)含義和算法原理解讀

    最近在做文本生成,用到huggingface transformers庫的文本生成 generate() 函數(shù),是 GenerationMixin 類的實現(xiàn)( class transformers.generation_utils.GenerationMixin ),是自回歸文本生成預(yù)訓(xùn)練模型相關(guān)參數(shù)的集大成者。因此本文解讀一下這些參數(shù)的含義以及常用的 Greedy Search 、 Beam Search 、 Sampli

    2024年02月02日
    瀏覽(23)
  • AIGC革新,將文字或者LOGO融入AI視頻基于PIKA-labs(Python3.10)

    很多平臺都會禁止用戶使用帶有網(wǎng)址或者二維碼的頭像以及文章配圖,這樣可以有效的防止用戶的一些“導(dǎo)流”行為。當(dāng)然,頭像、文章或者視頻現(xiàn)在都是AI來審,畢竟現(xiàn)在人工的成本實在太高,但是如果我們把文字元素直接融入圖像或者視頻之中,如此一來,AI也會很難識別

    2024年02月08日
    瀏覽(15)
  • Azure AI 內(nèi)容安全Content Safety Studio實戰(zhàn)

    Azure AI 內(nèi)容安全Content Safety Studio實戰(zhàn)

    Azure AI Content Safety 檢測應(yīng)用程序和服務(wù)中用戶生成和 AI 生成的有害內(nèi)容。 Azure AI 內(nèi)容安全包括文本和圖像 API,可用于檢測有害材料。 交互式 Content Safety Studio,可用于查看、瀏覽和試用用于檢測不同形式的有害內(nèi)容的示例代碼。 關(guān)注TechLead,分享AI全維度知識。作者擁有10

    2024年02月03日
    瀏覽(14)
  • 基于內(nèi)容的推薦算法(Content-Based)

    基于內(nèi)容的推薦算法(Content-Based)

    簡介 基于內(nèi)容的推薦方法是非常直接的,它以物品的內(nèi)容描述信息為依據(jù)來做出的推薦,本質(zhì)上是基于對物品和用戶自身的特征或?qū)傩缘闹苯臃治龊陀嬎恪?內(nèi)容推薦算法是指在網(wǎng)站或應(yīng)用中向用戶推薦內(nèi)容的一種機器學(xué)習(xí)算法。這些算法通過分析用戶的歷史瀏覽記錄、搜索

    2024年02月04日
    瀏覽(13)
  • 認識 AIGC ,淺淡 AIGC 的那些事—— AIGC:用 AI 創(chuàng)造萬物

    認識 AIGC ,淺淡 AIGC 的那些事—— AIGC:用 AI 創(chuàng)造萬物

    關(guān)注 AIGC 、人工智能繪畫方面的博友們,應(yīng)該很快就認出了這幅畫吧,沒錯這就是 AIGC 的產(chǎn)物,由新型 AI 繪畫工具 “Midjourney” 創(chuàng)作而成,名為《太空歌劇院》。 《太空歌劇院》是一幅神奇的畫作,它結(jié)合了古典與科幻的元素,將17世紀(jì)歐洲的歌劇院場景與極具科幻的太空相

    2024年02月08日
    瀏覽(10)
  • (十三)AI作畫、AI繪畫、AIGC本地大模型

    (十三)AI作畫、AI繪畫、AIGC本地大模型

    AI作畫近期很火,涌現(xiàn)出了很多AIGC(AI內(nèi)容生成)的網(wǎng)站、平臺,但這些平臺都是使用的云上的算力,基本都有使用的各種限制等。 一、本代碼自動將大模型下載本地,可以無-限-使-用。但是對硬件的要求較高需要8G顯存以上的顯卡才能快速出圖,用CPU會很慢的。 【同時,針對

    2024年02月11日
    瀏覽(20)
  • AI繪畫升溫、AI寫作降溫,AIGC玩“變臉”

    AI繪畫升溫、AI寫作降溫,AIGC玩“變臉”

    配圖來自Canva可畫 自柯潔在“圍棋人機大戰(zhàn)”中惜敗AlphaGo后,AI再次上演打敗藝術(shù)家的戲碼,AIGC(人工智能自主生成內(nèi)容)時代真的要來了嗎? 據(jù)了解,在今年科羅拉多州博覽會藝術(shù)競賽中,一名叫艾倫的參賽者利用AI繪圖工具Midjourney完成的繪畫作品,拿下了博覽會的數(shù)位

    2024年02月13日
    瀏覽(14)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包