作者:禪與計算機程序設計藝術文章來源:http://www.zghlxwxcb.cn/news/detail-728211.html
1.簡介
GAN(Generative Adversarial Network)作為深度學習領域中的一種生成模型,近年來在圖像、音頻等多種模態(tài)數(shù)據(jù)上取得了良好的效果。其核心思想就是通過博弈論中的對抗訓練方式,讓兩個網(wǎng)絡(一個生成網(wǎng)絡G和一個判別網(wǎng)絡D)互相競爭,不斷提升自我認為的分布的能力。本文中,作者將生成對抗網(wǎng)絡應用于語音合成任務之中,并以子詞單元的方式構建序列到序列模型,以解決口語轉寫的問題。
NLP(Natural Language Processing)作為人工智能領域的主要研究方向,是實現(xiàn)對自然語言的理解及自動化處理的關鍵技術之一。在過去幾年里,隨著機器翻譯、文本摘要、自動問答系統(tǒng)等各種應用的興起,NLP的研究工作又得到了飛速的發(fā)展。例如,谷歌的新聞機器翻譯系統(tǒng)Baidu實驗室推出的GNMT(Google Neural Machine Translation)模型,就是基于神經(jīng)網(wǎng)絡的深度學習模型,能夠達到令人驚嘆的準確率。目前已有多種傳統(tǒng)的分詞方法被證明有效且準確性高。而在新一代的無監(jiān)督的方法如BERT、XLNet等出現(xiàn)后,分詞這一重要的基礎功能也逐漸成為NLP的一個研究熱點。
本文關注的重點是將生成對抗網(wǎng)絡應用于語音合成任務,即將輸入的漢字字符串轉換為對應的拼音音素(phonemes)。子詞單位(subword units)是NLP中的一個重要概念,它能夠將漢字字符串表示為較小的片段,便于建模和處理。本文將基于Transformer結構的序列到序列(seq2seq)模型進行實踐,并使用子詞單元的方式構造模型,以解決口語轉寫的問題。文章來源地址http://www.zghlxwxcb.cn/news/detail-728211.html
2.相關工作
到了這里,關于GAN(Generative Adversarial Network)作為深度學習領域中的一種生成模型,近年來在圖像、音頻等多種模態(tài)數(shù)據(jù)上取得了良好的效果。其核心思想就是通過博弈論中的對抗訓練方式的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!