国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理

這篇具有很好參考價(jià)值的文章主要介紹了深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

引言

主要講解三篇論文,主要思想是把自然語言理解、對(duì)話管理和自然語言生成三部分整合到一起。

先導(dǎo)知識(shí)

數(shù)據(jù)集

  • CamRest676
  • MultiWOZ

都是用的自回歸語言模型

  • causal
  • GPT-2、Transformer Decoder

一個(gè)概念:delexicalization

  • 通過相應(yīng)的占位符替換特定的槽值
    • 占位符作為特定的token,不關(guān)心具體的取值
  • 學(xué)習(xí)取值無關(guān)的參數(shù)

首先來看第一篇論文

SimpleTOD

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理

來自論文A Simple Language Model for Task-Oriented Dialogue。
主要做的工作是:

  • 采用causal 語言模型(GPT-2)
  • 把整個(gè)TOD轉(zhuǎn)換成序列預(yù)測問題
  • 損失函數(shù)為最大似然
  • 把整個(gè)TOD分為幾個(gè)子任務(wù),建模子任務(wù)之間的依賴

TOD指任務(wù)導(dǎo)向型的對(duì)話系統(tǒng)。

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
模型的輸入是所有的對(duì)話歷史:
C t = [ U 0 , S 0 , ? ? , U t ] C_t=[U_0,S_0,\cdots, U_t] Ct?=[U0?,S0?,?,Ut?]
其中 U 0 U_0 U0?是用戶輸入的第一句話; S 0 S_0 S0?是系統(tǒng)回復(fù)的第一句話;

然后把這個(gè)上下文輸入給SimpleTOD模型:
B t = SimpleTOD ( C t ) B_t =\text{SimpleTOD}(C_t) Bt?=SimpleTOD(Ct?)
會(huì)輸出一個(gè)belief state,包含domain,slot_name和value。相當(dāng)于做了NLU+DST的工作。

接下來要做對(duì)話動(dòng)作生成,此時(shí)把 C t , B t C_t,B_t Ct?,Bt?和查詢結(jié)果 D t D_t Dt?拼接起來,再輸入給SimpleTOD模型:
A t = SimpleTOD ( [ C t , B t , D t ] ) A_t =\text{SimpleTOD}([C_t, B_t, D_t]) At?=SimpleTOD([Ct?,Bt?,Dt?])
生成動(dòng)作 A t A_t At?。
最后生成響應(yīng)時(shí)把上面所有結(jié)果拼接,輸入給SimpleDOT模型:
S t = SimpleTOD ( [ C t , B t , D t , A t ] ) S_t =\text{SimpleTOD}([C_t, B_t, D_t,A_t]) St?=SimpleTOD([Ct?,Bt?,Dt?,At?])
來生成回復(fù)。這里會(huì)涉及到delexicalization,比如上圖中的[value count],這里表示這個(gè)值是從數(shù)據(jù)庫中查詢的結(jié)果,不關(guān)心具體的值。

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
訓(xùn)練過程如上圖所示,a)訓(xùn)練就是把用戶的輸入、系統(tǒng)的回復(fù)、belif state、DB查詢結(jié)果、生成的動(dòng)作等基于語言模型的要求作為一個(gè)token序列喂給SimpleTOD。

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
其中 x = ( x 1 , ? ? , x n ) x=(x_1,\cdots,x_n) x=(x1?,?,xn?) x t = [ C t ; B t ; D t ; A t ; S t ] x^t=[C_t;B_t;D_t;A_t;S_t] xt=[Ct?;Bt?;Dt?;At?;St?]。

b)推理也是先把 C t C_t Ct?拼接起來,送給模型,然后會(huì)得到一個(gè)belief state,然后再把預(yù)測的 B t B_t Bt?(和查詢到的 D t D_t Dt?)也拼起來繼續(xù)喂給模型得到 A t A_t At?,基于這些來生成回復(fù)。

SOLOIST

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理

來自論文SOLOIST: Building Task Bots at Scale with Transfer Learning and Machine Teaching。
采用預(yù)訓(xùn)練-微調(diào)范式

  • 自回歸語言模型
  • 使用更大的對(duì)話語料庫預(yù)訓(xùn)練
  • 使用一些任務(wù)相關(guān)的對(duì)話微調(diào)

使用的模型是Unified Language Model。

我們來看下它的輸入和輸出。

輸入:

  • 歷史對(duì)話
  • belief state
  • DB state(DB查詢結(jié)果)
  • delexicalized response

可以用 x = ( s , b , c , r ) x=(s,b,c,r) x=(s,b,c,r)來表示。

預(yù)訓(xùn)練時(shí)使用task-grouded的預(yù)訓(xùn)練,包含

  • 多任務(wù)目標(biāo)
  • 自監(jiān)督

在微調(diào)時(shí)用了machine teaching的方法。

模型的訓(xùn)練目標(biāo),也是分為說那個(gè)任務(wù):Belief State Prediction(DST+NLU)、Grounded Response Generation(NLG)和Contrastive Objective(自監(jiān)督)。

它輸入中的歷史對(duì)話和SimpleTOD有一些區(qū)別,這里只有用戶說的話,沒有系統(tǒng)的回復(fù)。

通過以下方式建模:
深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
其中主要有兩個(gè)任務(wù):
深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理

最后使用對(duì)比損失,將輸入中的詞以50%的概率隨機(jī)替換:

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
上面說的machine teacher實(shí)際是指通過人工更正模型輸出的結(jié)果:

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理

UBAR

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理

來自論文UBAR: Towards Fully End-to-End Task-Oriented Dialog System with GPT-2

作者嘗試把完整的對(duì)話歷史喂給模型,還是基于GPT-2模型,基于用戶的輸入,需要預(yù)測blief state、system action和system response。

架構(gòu)類似SimpleTOD和SOLOIST的結(jié)合體,任務(wù)類似SOLOIST的。

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
從上圖可以看到,其中最上面表示模型的輸入,是完整的對(duì)話歷史。U代表用戶的輸入;B是需要預(yù)測的Blief State,A是Action,R是Response,D是數(shù)據(jù)庫查詢。

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
上面是一個(gè)輸入的范例。
在belief state中對(duì)domain和slot value進(jìn)行解耦;同時(shí)在system act中也對(duì)domain和action進(jìn)行解耦。文章來源地址http://www.zghlxwxcb.cn/news/detail-579261.html

參考

  1. 貪心學(xué)院課程
  2. A Simple Language Model for Task-Oriented Dialogue
  3. SOLOIST: Building Task Bots at Scale with Transfer Learning and Machine Teaching
  4. UBAR: Towards Fully End-to-End Task-Oriented Dialog System with GPT-2

到了這里,關(guān)于深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 深入淺出分支語句—【C語言】

    深入淺出分支語句—【C語言】

    目錄 前言:為什么要學(xué)習(xí)分支和循環(huán)語句呢? 1. 語句的分類 2. 分支語句(選擇語句) 2.1 if-else語句 注意點(diǎn):if-else語句后面不加{},默認(rèn)只能跟一條語句 2.2? switch語句 ?注意點(diǎn): 因?yàn)镃語言是一門結(jié)構(gòu)化的程序設(shè)計(jì)語言,具有三種結(jié)構(gòu):順序結(jié)構(gòu)、選擇結(jié)構(gòu)、循環(huán)結(jié)構(gòu),這三

    2024年02月02日
    瀏覽(160)
  • 深入淺出循環(huán)語句—【C語言】

    深入淺出循環(huán)語句—【C語言】

    ? 分支語句博客: http://t.csdn.cn/U2kZF 目錄 ?編輯 前言:我們先來了解一下break 、continue在循環(huán)中的作用 1. while循環(huán) ?while循環(huán)中的break ?while循環(huán)中的continue? 2. for循環(huán) for循環(huán)省略出錯(cuò)舉例: ?for循環(huán)中的break ?for循環(huán)中的continue 3. do???while循環(huán) 利用do?while循環(huán)打印1~10? ?d

    2024年02月04日
    瀏覽(231)
  • 深入淺出C語言—【函數(shù)】上

    深入淺出C語言—【函數(shù)】上

    ?? 目錄 1.函數(shù)的概念 2.C語言函數(shù)的分類 2.1 庫函數(shù) 2.1.1 strcpy庫函數(shù)舉例學(xué)習(xí)方式 2.1.2?庫函數(shù)擴(kuò)展知識(shí) 2.2 自定義函數(shù) 2.2.1求兩個(gè)整數(shù)中的較大值 3. 函數(shù)的參數(shù) 3.1 實(shí)際參數(shù)(實(shí)參) 3.2 形式參數(shù)(形參) 4. 函數(shù)的調(diào)用 4.1 傳值調(diào)用 4.2 傳址調(diào)用 老鐵們,網(wǎng)址自取,記得一鍵

    2024年02月07日
    瀏覽(82)
  • 深入淺出:大語言模型的視覺解析

    深入淺出:大語言模型的視覺解析

    一系列工具與文章的匯編,直觀易懂地解讀復(fù)雜的 AI 概念 圖片由作者利用 unDraw.co 的免費(fèi)插圖制作 在當(dāng)今世界,大語言模型(LLM)成為了熱門話題。幾乎每天都有新的語言模型問世,讓人們在 AI 領(lǐng)域懷有一種“不容錯(cuò)過”的緊迫感。盡管如此,許多人仍對(duì)大語言模型的基礎(chǔ)

    2024年01月19日
    瀏覽(25)
  • 深入淺出堆—C語言版【數(shù)據(jù)結(jié)構(gòu)】

    深入淺出堆—C語言版【數(shù)據(jù)結(jié)構(gòu)】

    二叉樹概念博客 :http://t.csdn.cn/XIW84 目錄 1. 了解堆 1.1 堆的概念 1.2 堆的性質(zhì): 1.3 堆的結(jié)構(gòu)圖片 1.3.1 小堆 1.3.2 大堆 2. 堆的實(shí)現(xiàn) 2.1 插入數(shù)據(jù)進(jìn)堆 2.2 向上調(diào)整函數(shù) 2.3 堆的刪除 2.4 向下調(diào)整 3. 堆的應(yīng)用 3.1 建堆(兩種方式) 3.1.1 建堆方式1 3.1.2 建堆方式2 3.2 堆排序? 3.3 堆的

    2024年02月04日
    瀏覽(24)
  • 深入淺出二叉樹— C語言版【數(shù)據(jù)結(jié)構(gòu)】

    深入淺出二叉樹— C語言版【數(shù)據(jù)結(jié)構(gòu)】

    目錄 ?編輯 1.樹概念及結(jié)構(gòu) 1.1樹的概念 1.2 樹的相關(guān)概念 ?1.3 樹的表示 2.二叉樹概念及結(jié)構(gòu)? ?2.1概念 2.2 特殊的二叉樹 2.3 二叉樹的性質(zhì)? 2.4 簡單二叉樹題目練習(xí)? 2.5 二叉樹的存儲(chǔ)結(jié)構(gòu) 2.5.1 順序存儲(chǔ)——堆 2.5.2 鏈?zhǔn)酱鎯?chǔ) 樹是一種 非線性的數(shù)據(jù)結(jié)構(gòu) ,它是由n(n=0)個(gè)有

    2024年02月03日
    瀏覽(19)
  • 深入淺出推薦系統(tǒng)(一):推薦系統(tǒng)基本架構(gòu)

    深入淺出推薦系統(tǒng)(一):推薦系統(tǒng)基本架構(gòu)

    過去八九年在廣告、生活服務(wù)、電商等領(lǐng)域從事大數(shù)據(jù)及推薦系統(tǒng)相關(guān)工作,近來打算對(duì)過去的工作做一個(gè)系統(tǒng)性的梳理。一方面幫自己查缺補(bǔ)漏、進(jìn)行更深入的學(xué)習(xí);另一方面也希望能通過博客結(jié)交同好,增進(jìn)交流。 這一博客系列以介紹推薦系統(tǒng)為主,會(huì)少量涉及廣告系統(tǒng)

    2023年04月26日
    瀏覽(24)
  • 深入淺出 -- 系統(tǒng)架構(gòu)之單體架構(gòu)

    深入淺出 -- 系統(tǒng)架構(gòu)之單體架構(gòu)

    單體架構(gòu)(Monolithic Architecture)是一種傳統(tǒng)的軟件架構(gòu)模式,將整個(gè)應(yīng)用程序作為一個(gè)單一的、統(tǒng)一的單元進(jìn)行開發(fā)、部署和擴(kuò)展。在單體架構(gòu)中,所有的功能模塊都被打包在一起,共享同一個(gè)代碼庫和數(shù)據(jù)庫。 例如,在網(wǎng)上商城系統(tǒng)中,JavaWeb工程通常會(huì)被打成WA R包部署在

    2024年04月10日
    瀏覽(23)
  • (已完結(jié))深入淺出操作系統(tǒng) - 目錄

    ---- 整理自狄泰軟件唐佐林老師課程 實(shí)驗(yàn)環(huán)境: OS Version: Ubuntu 10.10 QT Version: 4.7.4 QT Creator Version: 2.4.1 Bochs Version: 2.4.5 01 - 進(jìn)階操作系統(tǒng)(BIOS) 02 - Hello, DTOS!(第一個(gè)主引導(dǎo)程序,屏幕上打印Hello,DTOS! ) 03 - 調(diào)試環(huán)境的搭建(Bochs) 04-05 - 主引導(dǎo)程序的擴(kuò)展 06-07-08 - 突破512字節(jié)

    2024年02月12日
    瀏覽(51)
  • 二、深入淺出WPF之系統(tǒng)學(xué)習(xí)XAML語法

    跟Winforms一樣,UI也是個(gè)平面結(jié)構(gòu),與winforms的設(shè)計(jì)思維不同,WPF使用樹形邏輯來描述UI,下面是UI布局的簡單代碼 實(shí)際的頁面效果:

    2024年02月16日
    瀏覽(27)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包