国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理

2年前作者：憤怒的可樂分類：Toy博客閱讀(161)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

引言

主要講解三篇論文，主要思想是把自然語言理解、對(duì)話管理和自然語言生成三部分整合到一起。

先導(dǎo)知識(shí)

數(shù)據(jù)集

CamRest676
MultiWOZ

都是用的自回歸語言模型

causal
GPT-2、Transformer Decoder

一個(gè)概念：delexicalization

通過相應(yīng)的占位符替換特定的槽值
- 占位符作為特定的token，不關(guān)心具體的取值
學(xué)習(xí)取值無關(guān)的參數(shù)

首先來看第一篇論文

SimpleTOD

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理

來自論文A Simple Language Model for Task-Oriented Dialogue。
主要做的工作是：

采用causal 語言模型(GPT-2)
把整個(gè)TOD轉(zhuǎn)換成序列預(yù)測問題
損失函數(shù)為最大似然
把整個(gè)TOD分為幾個(gè)子任務(wù)，建模子任務(wù)之間的依賴

TOD指任務(wù)導(dǎo)向型的對(duì)話系統(tǒng)。

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
模型的輸入是所有的對(duì)話歷史：
$C_t=[U_0,S_0,\cdots, U_t]$
其中 $U_0$ 是用戶輸入的第一句話； $S_0$ 是系統(tǒng)回復(fù)的第一句話；

然后把這個(gè)上下文輸入給SimpleTOD模型：
$B_t =\text{SimpleTOD}(C_t)$
會(huì)輸出一個(gè)belief state，包含domain,slot_name和value。相當(dāng)于做了NLU+DST的工作。

接下來要做對(duì)話動(dòng)作生成，此時(shí)把 $C_t,B_t$ 和查詢結(jié)果 $D_t$ 拼接起來，再輸入給SimpleTOD模型：
$A_t =\text{SimpleTOD}([C_t, B_t, D_t])$
生成動(dòng)作 $A_t$ 。
最后生成響應(yīng)時(shí)把上面所有結(jié)果拼接，輸入給SimpleDOT模型：
$S_t =\text{SimpleTOD}([C_t, B_t, D_t,A_t])$
來生成回復(fù)。這里會(huì)涉及到delexicalization，比如上圖中的[value count]，這里表示這個(gè)值是從數(shù)據(jù)庫中查詢的結(jié)果，不關(guān)心具體的值。

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
訓(xùn)練過程如上圖所示，a)訓(xùn)練就是把用戶的輸入、系統(tǒng)的回復(fù)、belif state、DB查詢結(jié)果、生成的動(dòng)作等基于語言模型的要求作為一個(gè)token序列喂給SimpleTOD。

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
其中 $x=(x_1,\cdots,x_n)$ ； $x^t=[C_t;B_t;D_t;A_t;S_t]$ 。

b)推理也是先把 $C_t$ 拼接起來，送給模型，然后會(huì)得到一個(gè)belief state，然后再把預(yù)測的 $B_t$ (和查詢到的 $D_t$ )也拼起來繼續(xù)喂給模型得到 $A_t$ ，基于這些來生成回復(fù)。

SOLOIST

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理

來自論文SOLOIST: Building Task Bots at Scale with Transfer Learning and Machine Teaching。
采用預(yù)訓(xùn)練-微調(diào)范式

自回歸語言模型
使用更大的對(duì)話語料庫預(yù)訓(xùn)練
使用一些任務(wù)相關(guān)的對(duì)話微調(diào)

使用的模型是Unified Language Model。

我們來看下它的輸入和輸出。

輸入：

歷史對(duì)話
belief state
DB state(DB查詢結(jié)果)
delexicalized response

可以用 $x = (s, b, c, r)$ 來表示。

預(yù)訓(xùn)練時(shí)使用task-grouded的預(yù)訓(xùn)練，包含

多任務(wù)目標(biāo)
自監(jiān)督

在微調(diào)時(shí)用了machine teaching的方法。

模型的訓(xùn)練目標(biāo)，也是分為說那個(gè)任務(wù)：Belief State Prediction(DST+NLU)、Grounded Response Generation(NLG)和Contrastive Objective(自監(jiān)督)。

它輸入中的歷史對(duì)話和SimpleTOD有一些區(qū)別，這里只有用戶說的話，沒有系統(tǒng)的回復(fù)。

通過以下方式建模：
深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
其中主要有兩個(gè)任務(wù)：

最后使用對(duì)比損失，將輸入中的詞以50%的概率隨機(jī)替換：

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
上面說的machine teacher實(shí)際是指通過人工更正模型輸出的結(jié)果：

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理

UBAR

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理

來自論文UBAR: Towards Fully End-to-End Task-Oriented Dialog System with GPT-2

作者嘗試把完整的對(duì)話歷史喂給模型，還是基于GPT-2模型，基于用戶的輸入，需要預(yù)測blief state、system action和system response。

架構(gòu)類似SimpleTOD和SOLOIST的結(jié)合體，任務(wù)類似SOLOIST的。

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
從上圖可以看到，其中最上面表示模型的輸入，是完整的對(duì)話歷史。U代表用戶的輸入；B是需要預(yù)測的Blief State，A是Action，R是Response，D是數(shù)據(jù)庫查詢。

深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理,自然語言處理,讀書筆記,語言模型,人工智能,自然語言處理
上面是一個(gè)輸入的范例。
在belief state中對(duì)domain和slot value進(jìn)行解耦；同時(shí)在system act中也對(duì)domain和action進(jìn)行解耦。文章來源地址http://www.zghlxwxcb.cn/news/detail-579261.html

參考

貪心學(xué)院課程
A Simple Language Model for Task-Oriented Dialogue
SOLOIST: Building Task Bots at Scale with Transfer Learning and Machine Teaching
UBAR: Towards Fully End-to-End Task-Oriented Dialog System with GPT-2

到了這里，關(guān)于深入淺出對(duì)話系統(tǒng)——基于預(yù)訓(xùn)練語言模型的對(duì)話管理的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

深入淺出分支語句—【C語言】
目錄前言：為什么要學(xué)習(xí)分支和循環(huán)語句呢？ 1. 語句的分類 2. 分支語句（選擇語句） 2.1 if-else語句注意點(diǎn)：if-else語句后面不加{}，默認(rèn)只能跟一條語句 2.2? switch語句 ?注意點(diǎn)：因?yàn)镃語言是一門結(jié)構(gòu)化的程序設(shè)計(jì)語言，具有三種結(jié)構(gòu)：順序結(jié)構(gòu)、選擇結(jié)構(gòu)、循環(huán)結(jié)構(gòu)，這三
2024年02月02日
瀏覽(160)
深入淺出循環(huán)語句—【C語言】
? 分支語句博客： http://t.csdn.cn/U2kZF 目錄 ?編輯前言：我們先來了解一下break 、continue在循環(huán)中的作用 1. while循環(huán) ?while循環(huán)中的break ?while循環(huán)中的continue? 2. for循環(huán) for循環(huán)省略出錯(cuò)舉例： ?for循環(huán)中的break ?for循環(huán)中的continue 3. do???while循環(huán) 利用do?while循環(huán)打印1~10? ?d
2024年02月04日
瀏覽(231)
深入淺出C語言—【函數(shù)】上
?? 目錄 1.函數(shù)的概念 2.C語言函數(shù)的分類 2.1 庫函數(shù) 2.1.1 strcpy庫函數(shù)舉例學(xué)習(xí)方式 2.1.2?庫函數(shù)擴(kuò)展知識(shí) 2.2 自定義函數(shù) 2.2.1求兩個(gè)整數(shù)中的較大值 3. 函數(shù)的參數(shù) 3.1 實(shí)際參數(shù)（實(shí)參） 3.2 形式參數(shù)（形參） 4. 函數(shù)的調(diào)用 4.1 傳值調(diào)用 4.2 傳址調(diào)用老鐵們，網(wǎng)址自取，記得一鍵
2024年02月07日
瀏覽(82)
深入淺出：大語言模型的視覺解析
一系列工具與文章的匯編，直觀易懂地解讀復(fù)雜的 AI 概念圖片由作者利用 unDraw.co 的免費(fèi)插圖制作在當(dāng)今世界，大語言模型（LLM）成為了熱門話題。幾乎每天都有新的語言模型問世，讓人們在 AI 領(lǐng)域懷有一種“不容錯(cuò)過”的緊迫感。盡管如此，許多人仍對(duì)大語言模型的基礎(chǔ)
2024年01月19日
瀏覽(25)
深入淺出堆—C語言版【數(shù)據(jù)結(jié)構(gòu)】
二叉樹概念博客：http://t.csdn.cn/XIW84 目錄 1. 了解堆 1.1 堆的概念 1.2 堆的性質(zhì)： 1.3 堆的結(jié)構(gòu)圖片 1.3.1 小堆 1.3.2 大堆 2. 堆的實(shí)現(xiàn) 2.1 插入數(shù)據(jù)進(jìn)堆 2.2 向上調(diào)整函數(shù) 2.3 堆的刪除 2.4 向下調(diào)整 3. 堆的應(yīng)用 3.1 建堆（兩種方式） 3.1.1 建堆方式1 3.1.2 建堆方式2 3.2 堆排序? 3.3 堆的
2024年02月04日
瀏覽(24)
深入淺出二叉樹— C語言版【數(shù)據(jù)結(jié)構(gòu)】
目錄 ?編輯 1.樹概念及結(jié)構(gòu) 1.1樹的概念 1.2 樹的相關(guān)概念 ?1.3 樹的表示 2.二叉樹概念及結(jié)構(gòu)? ?2.1概念 2.2 特殊的二叉樹 2.3 二叉樹的性質(zhì)? 2.4 簡單二叉樹題目練習(xí)? 2.5 二叉樹的存儲(chǔ)結(jié)構(gòu) 2.5.1 順序存儲(chǔ)——堆 2.5.2 鏈?zhǔn)酱鎯?chǔ) 樹是一種非線性的數(shù)據(jù)結(jié)構(gòu) ，它是由n（n=0）個(gè)有
2024年02月03日
瀏覽(19)
深入淺出推薦系統(tǒng)（一）：推薦系統(tǒng)基本架構(gòu)
過去八九年在廣告、生活服務(wù)、電商等領(lǐng)域從事大數(shù)據(jù)及推薦系統(tǒng)相關(guān)工作，近來打算對(duì)過去的工作做一個(gè)系統(tǒng)性的梳理。一方面幫自己查缺補(bǔ)漏、進(jìn)行更深入的學(xué)習(xí)；另一方面也希望能通過博客結(jié)交同好，增進(jìn)交流。這一博客系列以介紹推薦系統(tǒng)為主，會(huì)少量涉及廣告系統(tǒng)
2023年04月26日
瀏覽(24)
深入淺出 -- 系統(tǒng)架構(gòu)之單體架構(gòu)
單體架構(gòu)（Monolithic Architecture）是一種傳統(tǒng)的軟件架構(gòu)模式，將整個(gè)應(yīng)用程序作為一個(gè)單一的、統(tǒng)一的單元進(jìn)行開發(fā)、部署和擴(kuò)展。在單體架構(gòu)中，所有的功能模塊都被打包在一起，共享同一個(gè)代碼庫和數(shù)據(jù)庫。例如，在網(wǎng)上商城系統(tǒng)中，JavaWeb工程通常會(huì)被打成WA R包部署在
2024年04月10日
瀏覽(23)
（已完結(jié)）深入淺出操作系統(tǒng) - 目錄
---- 整理自狄泰軟件唐佐林老師課程實(shí)驗(yàn)環(huán)境： OS Version: Ubuntu 10.10 QT Version: 4.7.4 QT Creator Version: 2.4.1 Bochs Version: 2.4.5 01 - 進(jìn)階操作系統(tǒng)（BIOS） 02 - Hello, DTOS!（第一個(gè)主引導(dǎo)程序，屏幕上打印Hello,DTOS! ） 03 - 調(diào)試環(huán)境的搭建（Bochs） 04-05 - 主引導(dǎo)程序的擴(kuò)展 06-07-08 - 突破512字節(jié)
2024年02月12日
瀏覽(51)
二、深入淺出WPF之系統(tǒng)學(xué)習(xí)XAML語法
跟Winforms一樣，UI也是個(gè)平面結(jié)構(gòu)，與winforms的設(shè)計(jì)思維不同，WPF使用樹形邏輯來描述UI,下面是UI布局的簡單代碼實(shí)際的頁面效果：
2024年02月16日
瀏覽(27)