公眾號(hào)關(guān)注?“GitHubDaily”
設(shè)為?“星標(biāo)”,每天帶你逛 GitHub!
在上學(xué)那會(huì),我便一直有個(gè)想法,要是能有一個(gè)英漢自動(dòng)翻譯機(jī),能把我說的話,直接翻譯成英語(yǔ)就好了。這樣,我就不需要在凌晨早起背單詞語(yǔ)法,在操場(chǎng)上訓(xùn)練口語(yǔ)。
當(dāng)我在「流浪地球」電影中,看到劉培強(qiáng)用漢語(yǔ)與其它國(guó)家宇航員進(jìn)行跨國(guó)界無(wú)縫交流時(shí),我覺得,這才是未來該有的樣子。
所有人只需要掌握一種語(yǔ)言,便可通過 AI 智能轉(zhuǎn)譯功能,快速成為任一國(guó)家的 Native Speaker。
前陣子 ChatGPT 橫空出世,開始嘗試通過理解人類語(yǔ)言以及情感,對(duì)語(yǔ)言進(jìn)行翻譯。
這在語(yǔ)言翻譯領(lǐng)域,無(wú)疑是一次大膽的嘗試。
也就是說,現(xiàn)在的 AI,不僅能翻譯語(yǔ)言,還能根據(jù)你所需要表達(dá)的情感對(duì)語(yǔ)言進(jìn)行潤(rùn)色。
現(xiàn)在,就差一個(gè)聲音克隆以及語(yǔ)言表達(dá)工具了。
此前在 GitHub 上有人開源過一款語(yǔ)音克隆工具:Real Time Voice Cloning,它能在 5 秒內(nèi)完成你的聲音克隆,并讓 AI 基于文本生成語(yǔ)音。
?? https://github.com/CorentinJ/Real-Time-Voice-Cloning
這個(gè)項(xiàng)目已經(jīng)推出便受到了不少開發(fā)者的關(guān)注,克隆出來的聲音相似度非常高。
唯一美中不足的,就是 AI 克隆出來的聲音,說話依舊是冷冰冰的,沒有情感。因此,即便聲音聽起來很像原聲,但還是有股濃濃的機(jī)械感。
直到今早起床時(shí),我偶然在 Hacker News 看到了一個(gè)讓我眼前一亮的項(xiàng)目:play.ht。
它可以從 20 秒的音頻中快速生成克隆語(yǔ)音,并自動(dòng)轉(zhuǎn)換為英語(yǔ)。
也就是說,即便你不會(huì)說英語(yǔ),也可以通過語(yǔ)音克隆的方式,立刻說出一口流利的英語(yǔ)。
在使用的過程中,我試了下自己的聲音,確實(shí)有點(diǎn)震撼。
?? playground.play.ht
這里的技術(shù)采用了一個(gè)名為 Parrot 的模型,它能從幾秒的音頻克隆出聲音,并基于文本,重新生成一段富有情感的語(yǔ)音。
目前該模型只支持英語(yǔ),不過技術(shù)團(tuán)隊(duì)已經(jīng)在開始嘗試支持更多語(yǔ)言。
克隆聲音的數(shù)據(jù)樣本主要分兩種:高保真(20 分鐘)和零樣本(20 秒),給的音頻樣本時(shí)間越長(zhǎng),其精度就更佳。
下面提供的兩段音頻示例,是我基于雷總某個(gè)采訪的聲音樣本進(jìn)行克隆的。
這里用的是一段比較粗糙的文本,大概 40 秒左右,就已經(jīng)能擁有這樣的效果:
如果你感興趣的話,也可以用自己的聲音試下。
看著自己的聲音被一步步轉(zhuǎn)化成英語(yǔ),那種感覺,你只有真正體驗(yàn)過,才能知道有多震撼。
未來,該工具將被應(yīng)用到各類數(shù)字內(nèi)容創(chuàng)作(如游戲、媒體、在線教育)等平臺(tái)。
你可以想象,未來的 3A 游戲大作,不再需要人工來配臺(tái)詞,而是通過采集聲優(yōu)的各種情緒配音,自動(dòng)生成所有國(guó)家和地區(qū)的語(yǔ)言,甚至是方言。
電臺(tái)主持人、歌手,以及那些可標(biāo)準(zhǔn)化輸出聲音的職業(yè),都有可能被這個(gè)工具取代。
隨著 AI 的進(jìn)步與發(fā)展,學(xué)習(xí)英語(yǔ)的投入產(chǎn)出比正在逐漸降低。
在將來的某一天,或許我們只需要佩戴個(gè)入耳式耳機(jī),便能與其他語(yǔ)種的人無(wú)縫交流。
一鍵部署 ChatGPT 網(wǎng)頁(yè)應(yīng)用
前兩天有好幾個(gè)朋友都說想自己搭建個(gè) ChatGPT 機(jī)器人玩一玩。
這里推薦一個(gè)我今天在 GitHub 上看到的開源項(xiàng)目:ChatGPT Next Web,可一鍵免費(fèi)部署你的私人 ChatGPT 網(wǎng)頁(yè)應(yīng)用。
UI 做的還蠻好看的:
?? https://github.com/Yidadaa/ChatGPT-Next-Web
主要功能如下:
在 1 分鐘內(nèi)使用 Vercel 免費(fèi)一鍵部署;
精心設(shè)計(jì)的 UI,響應(yīng)式設(shè)計(jì),支持深色模式;
極快的首屏加載速度(~85kb);
自動(dòng)壓縮上下文聊天記錄,在節(jié)省 Token 的同時(shí)支持超長(zhǎng)對(duì)話;
一鍵導(dǎo)出聊天記錄,完整的 Markdown 支持;
可綁定自己的域名。
感興趣的同學(xué)可以試下。
最后再插個(gè)題外話,近期有不少同學(xué)反映說收不到公眾號(hào)文章的推送,有時(shí)要等好幾天才能刷到。
這個(gè)是因?yàn)楣娞?hào)現(xiàn)在改版了,打亂了推文信息流。如果你不對(duì)公眾號(hào)加星標(biāo)的話,確實(shí)沒辦法第一時(shí)間接收到推送。
為了能夠第一時(shí)間接收到文章推送,建議大家到 GitHubDaily 公眾號(hào)主頁(yè)加個(gè)星標(biāo)。
文中所提到的所有開源項(xiàng)目與工具,已收錄至 GitHubDaily 的開源項(xiàng)目列表中。
該列表包含了 GitHub 上諸多高質(zhì)量、有趣實(shí)用的開源技術(shù)教程、開發(fā)者工具、編程網(wǎng)站等內(nèi)容。
從 2015 年至今,累積分享 3500+ 個(gè)開源項(xiàng)目,Star 增長(zhǎng) 21000+,有需要的,可訪問下方 GitHub 地址或點(diǎn)擊文末「閱讀原文」自?。?/p>
GitHub:https://github.com/GitHubDaily/GitHubDaily文章來源:http://www.zghlxwxcb.cn/news/detail-482744.html
文章來源地址http://www.zghlxwxcb.cn/news/detail-482744.html
到了這里,關(guān)于有點(diǎn)恐怖,這個(gè)工具能讓你在 20 秒內(nèi),克隆你的聲音,并轉(zhuǎn)成英語(yǔ)!的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!