“言為心聲,語為心境”,語言與對話是我們溝通與協(xié)作的重要方式。而智能語音技術(shù)是一種基于人工智能和自然語言處理技術(shù)的語音交互技術(shù)。它可以通過語音識別技術(shù)將用戶的語音指令轉(zhuǎn)換為文本,然后通過自然語言處理技術(shù)對文本進行分析和理解,最終生成相應(yīng)的響應(yīng)或執(zhí)行相應(yīng)的操作。
雖然智能語音技術(shù)由來已久,但直到亞馬遜Echo智能音箱的誕生才再一次引發(fā)了業(yè)界對智能語音技術(shù)的廣泛關(guān)注,因為這樣的智能音箱帶給了人們一種叫作“語音優(yōu)先”的用戶體驗,為用戶提供了一種更加便捷、高效的交互方式。
那么,什么是“語音優(yōu)先”呢?
語音優(yōu)先是指在設(shè)計產(chǎn)品或服務(wù)時,將語音交互作為主要的用戶界面,以便用戶可以通過語音指令來完成操作。這種設(shè)計方法可以提高用戶的使用體驗,特別是雙手正在忙碌的場景下,語音交互可以更加方便和快捷。語音優(yōu)先交互方式的優(yōu)勢在于:
其一是速度,每分鐘可以說120-150個字。
其二是釋放雙手,做飯時通過語音可以完成一些期望做的事。
其三是直覺性,語言是人類的天賦,也是人類交際溝通的自然手段。
其四是同理心,語音中包含了語氣、音量、語調(diào)和語速,這些特征傳達了大量的信息。
智能語音交互離不開人工智能技術(shù),在語音優(yōu)先交互中所涉及的人工智能技術(shù)如下圖所示。
?
如今,在為我們服務(wù)的智能語音設(shè)備背后,有一整套技術(shù)和流程,從語音喚醒到自動語音識別,再到自然語言理解,最終通過自然語言生成以及語音合成技術(shù)形成反饋,整套流程背后又有很多細分的人工智能技術(shù)在支持,如對話管理、深度學(xué)習(xí)、DNN、CNN、NLP、TTS等。
幸運的是,在2017年,我加入了宣稱“All in AI”的百度,負責(zé)智能音箱的研發(fā)。伙伴們和我經(jīng)受了88天的煉獄,終于誕生了百度第一款智能音箱Raven-H。而后,還參與了小度音箱、小度在家等產(chǎn)品的研發(fā)。后來,作為DuerOS首席布道師負責(zé)DuerOS的生態(tài)建設(shè)。DuerOS開放平臺為開發(fā)者提供了開發(fā)智能語音應(yīng)用的工具,使智能語音服務(wù)的開發(fā)更為便利。國外的谷歌與亞馬遜,國內(nèi)的小米、阿里等廠家,也都有著類似于DuerOS開放平臺的開發(fā)者社區(qū)。
開發(fā)者在各種語音開放平臺上開發(fā)智能語音服務(wù)的時候,普遍面臨著對智能語音交互設(shè)計的認知不足的情況,尤其是語音優(yōu)先設(shè)計的適用場景和獨特性。作為一名布道師,非常想寫一本關(guān)于智能語音交互設(shè)計與實現(xiàn)方面的書,但由于種種原因,未能成行。
本書正是這樣一本書,不僅深入淺出地討論了對話技術(shù),還手把手告訴了我們智能語音交互設(shè)計的各種細節(jié),是一本名副其實的設(shè)計指南和實戰(zhàn)手冊。感謝機械工業(yè)出版社讓我參與了這本書的翻譯工作,彌補了自己曾經(jīng)的遺憾。
翻譯團隊的誕生源自幾個有趣靈魂的碰撞,王同林和盧健作為高級產(chǎn)品經(jīng)理,強烈的求知欲和十多年豐富的產(chǎn)品設(shè)計經(jīng)驗,是他們加入翻譯團隊的原動力。嚴謹行文,細心求證,貫穿著我們整個翻譯過程。即便如此,仍然如履薄冰,文中不妥之處,歡迎大家斧正。
【關(guān)聯(lián)閱讀】
令人激動的語音UI背后
AI 語音交互開放平臺的構(gòu)建與演進
“他山之石”,語音技能開發(fā)的10個要點
面向NLP的AI產(chǎn)品方法論——尋找語音交互的業(yè)務(wù)場景
語音交互技術(shù)不是“你問我答”那么簡單!
智能語音應(yīng)用開發(fā)之DPL2.0高級特性
淺談?wù)Z音助手可以給企業(yè)帶來什么?
從認知負荷理論看語音交互設(shè)計
語音交互設(shè)計的一點認知
調(diào)試DuerOS的智能語音技能
揭秘“語音交互”背后的AI硬核黑科技!
《 持續(xù)架構(gòu)實踐 》譯者序
《基于混合方法的自然語言處理》譯者序
計算機網(wǎng)絡(luò)的元認知、實踐與未來文章來源:http://www.zghlxwxcb.cn/news/detail-840394.html
Web3.0,區(qū)塊鏈后花園的姹紫嫣紅
文章來源地址http://www.zghlxwxcb.cn/news/detail-840394.html
到了這里,關(guān)于《語音優(yōu)先》智能語音技術(shù)驅(qū)動的交互界面設(shè)計與語音機器人設(shè)計(譯者序)...的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!