前言
博主前段時(shí)間發(fā)布了一篇有關(guān)方言識(shí)別和分類模型訓(xùn)練的博客,在讀者的反饋中發(fā)現(xiàn)許多小伙伴對(duì)方言的辨識(shí)和分類表現(xiàn)出濃厚興趣。鑒于此,博主決定專門撰寫一篇關(guān)于方言分類的博客,以滿足讀者對(duì)這一主題的進(jìn)一步了解和探索的需求。上篇博客可參考:
《基于Python+WaveNet+CTC+Tensorflow智能語(yǔ)音識(shí)別與方言分類—深度學(xué)習(xí)算法應(yīng)用(含全部工程源碼)》
引言
本項(xiàng)目以科大訊飛提供的數(shù)據(jù)集為基礎(chǔ),通過(guò)特征篩選和提取的過(guò)程,選用WaveNet模型進(jìn)行訓(xùn)練。旨在通過(guò)語(yǔ)音的梅爾頻率倒譜系數(shù)(MFCC)特征,建立方言和相應(yīng)類別之間的映射關(guān)系,解決方言分類問(wèn)題。
首先,項(xiàng)目從科大訊飛提供的數(shù)據(jù)集中進(jìn)行了特征篩選和提取。包括對(duì)語(yǔ)音信號(hào)的分析,提取出最能代表語(yǔ)音特征的MFCC,為模型訓(xùn)練提供有力支持。
其次,選擇了WaveNet模型進(jìn)行訓(xùn)練。WaveNet模型是一種序列生成器,用于語(yǔ)音建模,在語(yǔ)音合成的聲學(xué)建模中,可以直接學(xué)習(xí)采樣值序列的映射,通過(guò)先前的信號(hào)序列預(yù)測(cè)下一個(gè)時(shí)刻點(diǎn)值的深度神經(jīng)網(wǎng)絡(luò)模型,具有自回歸的特點(diǎn)。
在訓(xùn)練過(guò)程中,利用語(yǔ)音的MFCC特征,建立了方言和相應(yīng)類別之間的映射關(guān)系。這樣,模型能夠識(shí)別和分類輸入語(yǔ)音的方言,并將其劃分到相應(yīng)的類別中。
最終,通過(guò)這個(gè)項(xiàng)目,實(shí)現(xiàn)了方言分類問(wèn)題的解決方案。這對(duì)于語(yǔ)音識(shí)別、語(yǔ)音助手等領(lǐng)域具有實(shí)際應(yīng)用的潛力,也有助于保護(hù)和傳承各地區(qū)的語(yǔ)言文化。
總體設(shè)計(jì)
本部分包括系統(tǒng)整體結(jié)構(gòu)圖和系統(tǒng)流程圖。
系統(tǒng)整體結(jié)構(gòu)圖
系統(tǒng)整體結(jié)構(gòu)如圖所示。
系統(tǒng)流程圖
系統(tǒng)流程如圖所示。
運(yùn)行環(huán)境
本部分包括Python環(huán)境、TensorFlow環(huán)境、JupyterNotebook環(huán)境、PyCharm環(huán)境。
Python環(huán)境
需要Python 3.6及以上配置,在Windows環(huán)境下推薦下載Anaconda完成Python所需環(huán)境的配置,下載地址為https://www.anaconda.com/,也可下載虛擬機(jī)在Linux環(huán)境下運(yùn)行代碼。
TensorFlow 環(huán)境
安裝方法如下:
打開(kāi)Anaconda Prompt,輸入清華倉(cāng)庫(kù)鏡像。
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config -set show_channel_urls yes
創(chuàng)建Python 3.5的環(huán)境,名稱為TensorFlow,此時(shí)Python版本和后面TensorFlow的版本有匹配問(wèn)題,此步選擇Python 3.x。
conda create -n tensorflow python=3.5
有需要確認(rèn)的地方,都輸入y。在Anaconda Prompt中激活TensorFlow環(huán)境:
conda activate tensorflow
安裝CPU版本的TensorFlow:
pip install -upgrade --ignore -installed tensorflow
測(cè)試代碼如下:
import tensorflow as tf
hello = tf.constant( 'Hello, TensorFlow! ')
sess = tf.Session()
print sess.run(hello)
# 輸出 b'Hello! TensorFlow'
安裝完畢。
Jupyter Notebook環(huán)境
安裝Jupyter Notebook,前提是已安裝Python2.7或Python3.3及以上版本。
一種方法是使用Anaconda安裝,在終端輸入命令:
conda install jupyter notebook
另一種方法是使用pip命令安裝,把pip升級(jí)到最新版本,輸入命令:
pip install -upgrade pip
再安裝JupyterNotebook,輸入命令:
pip install jupyter
安裝完畢。
Pycharm 環(huán)境
保存模型、方言和類別之間的映射關(guān)系后,需要導(dǎo)入PyCharm中進(jìn)行語(yǔ)音測(cè)試。所以需要安裝PyCharm并激活,版本號(hào)如下:
PyCharm 2019.1.1(Professional Edition)
Build #PY-191.6605.12, built on April 3, 2019
Licensed to pig6
Subscription is active until July 8,2089
JRE:11.0.2+9-b159.34 amd64
JVM:OpenJDK 64-Bit Server VM by JetBrains s. r.o
Windows 10 10.0
PyCharm下載地址為http://www.jetbrains.com/pycharm/download/#section=windows,進(jìn)入網(wǎng)站后單擊Comminity版本下的DOWNLOAD下載安裝包,下載完成后安裝。單擊Create New Project創(chuàng)建新的項(xiàng)目文件,Location為存放工程的路徑,單擊project附近的三角符號(hào),可以看到PyCharm已經(jīng)自動(dòng)獲取Python 3.6,單擊create完成。
相關(guān)其它博客
基于Python+WaveNet+MFCC+Tensorflow智能方言分類—深度學(xué)習(xí)算法應(yīng)用(含全部工程源碼)(二)
基于Python+WaveNet+MFCC+Tensorflow智能方言分類—深度學(xué)習(xí)算法應(yīng)用(含全部工程源碼)(三)
基于Python+WaveNet+MFCC+Tensorflow智能方言分類—深度學(xué)習(xí)算法應(yīng)用(含全部工程源碼)(四)
工程源代碼下載
詳見(jiàn)本人博客資源下載頁(yè)文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-752888.html
其它資料下載
如果大家想繼續(xù)了解人工智能相關(guān)學(xué)習(xí)路線和知識(shí)體系,歡迎大家翻閱我的另外一篇博客《重磅 | 完備的人工智能AI 學(xué)習(xí)——基礎(chǔ)知識(shí)學(xué)習(xí)路線,所有資料免關(guān)注免套路直接網(wǎng)盤下載》
這篇博客參考了Github知名開(kāi)源平臺(tái),AI技術(shù)平臺(tái)以及相關(guān)領(lǐng)域?qū)<遥篋atawhale,ApacheCN,AI有道和黃海廣博士等約有近100G相關(guān)資料,希望能幫助到所有小伙伴們。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-752888.html
到了這里,關(guān)于基于Python+WaveNet+MFCC+Tensorflow智能方言分類—深度學(xué)習(xí)算法應(yīng)用(含全部工程源碼)(一)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!