国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

^{<sup id="6l3n1"><meter id="6l3n1"></meter></sup>}

微軟文本轉(zhuǎn)語音和語音轉(zhuǎn)文本功能更新，效果顯著！

1年前作者：wuhanwhite分類：Toy博客閱讀(13)違法舉報

這篇具有很好參考價值的文章主要介紹了微軟文本轉(zhuǎn)語音和語音轉(zhuǎn)文本功能更新，效果顯著！。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

今天我要和大家分享一個新功能更新——微軟的文本轉(zhuǎn)語音和語音轉(zhuǎn)文本功能。最近，微軟對其AI語音識別和語音合成技術進行了重大升級，效果非常好，現(xiàn)在我將分別為大家介紹這兩個功能。

先來聽下這個效果吧

微軟文本轉(zhuǎn)語音和語音轉(zhuǎn)文本功能更新

文本轉(zhuǎn)語音

文本轉(zhuǎn)語音（Text-to-Speech, TTS）是一種將文本信息轉(zhuǎn)換為自然聽起來的語音的技術。微軟的文本轉(zhuǎn)語音功能提供了多種語言和語音選項，支持多種平臺和設備，使得用戶可以輕松將文本轉(zhuǎn)換為語音。

更新后的文本轉(zhuǎn)語音功能在語音合成方面有了很大的提升。它不僅能夠更自然地模擬人類語音的語調(diào)、語速和語調(diào)變化，還能夠根據(jù)上下文智能調(diào)整發(fā)音，使得合成的語音更加自然流暢。

python代碼如下：運行后，會在終端運行的目錄下生成一個output.mp3文件

from azure.cognitiveservices.speech import SpeechConfig, SpeechSynthesizer, AudioConfig
from azure.cognitiveservices.speech.audio import AudioOutputConfig
from azure.cognitiveservices.speech import ResultReason, CancellationReason


# 創(chuàng)建SpeechConfig對象
speech_config = SpeechConfig(subscription="key", region="service_region")

# 創(chuàng)建音頻配置對象
audio_config = AudioConfig(filename="output.mp3")  # 輸出到MP3文件


# 創(chuàng)建語音合成器
speech_synthesizer = SpeechSynthesizer(speech_config=speech_config, audio_config=audio_config)
text="How To Unlock Cyberpunk 2077’s New Ending In Phantom Liberty"

# 定義SSML文本


ssml_string2="""
<!--ID=B7267351-473F-409D-9765-754A8EBCDE05;Version=1|{"VoiceNameToIdMapItems":[{"Id":"390baec9-d867-4c01-bdcf-04e5848ee7dc","Name":"Microsoft Server Speech Text to Speech Voice (zh-CN, XiaoxiaoMultilingualNeural)","ShortName":"zh-CN-XiaoxiaoMultilingualNeural","Locale":"zh-CN","VoiceType":"StandardVoice"}]}-->
<!--ID=FCB40C2B-1F9F-4C26-B1A1-CF8E67BE07D1;Version=1|{"Files":{}}-->
<!--ID=5B95B1CC-2C7B-494F-B746-CF22A0E779B7;Version=1|{"Locales":{"zh-CN":{"AutoApplyCustomLexiconFiles":[{}]},"de-DE":{"AutoApplyCustomLexiconFiles":[{}]}}}-->
<speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" xmlns:emo="http://www.w3.org/2009/10/emotionml" version="1.0" xml:lang="zh-CN"><voice name="zh-CN-XiaoxiaoMultilingualNeural"><lang xml:lang="zh-CN"><s />但我現(xiàn)在對這個職業(yè)的熱愛還是非常的，呵呵,非常的，嗯,怎么說呢？日月可鑒的，哈哈，嗯還是希望可以把這個職業(yè)做下去或者做這個聲音相關領域的工作，嗯，就是把自己的優(yōu)勢發(fā)揮的大一點，盡可能能用到自己擅長的東西，而不是說為了工作，為了掙錢而工作。<s /></lang></voice></speak>
"""

# 使用SSML文本進行語音合成
result = speech_synthesizer.speak_ssml_async(ssml_string2).get()

# 檢查結果
if result.reason == ResultReason.SynthesizingAudioCompleted:
    print("Speech synthesized to [output.mp3] for text [{}]".format(ssml_string2))
elif result.reason == ResultReason.Canceled:
    cancellation_details = result.cancellation_details
    print("Speech synthesis canceled: {}".format(cancellation_details.reason))
    if cancellation_details.reason == CancellationReason.Error:
        if cancellation_details.error_details:
            print("Error details: {}".format(cancellation_details.error_details))
    print("Did you update the subscription info?")

其中，Service_region和key值需要到azure中去獲取，先選語音服務

zh-cn-xiaoxiaomultilingualneural,python,microsoft,ai,人工智能,TTS,azure,python

zh-cn-xiaoxiaomultilingualneural,python,microsoft,ai,人工智能,TTS,azure,python

語音轉(zhuǎn)文本

語音轉(zhuǎn)文本（Speech-to-Text, STT）則是一種將語音信息轉(zhuǎn)換為文本的技術。微軟的語音轉(zhuǎn)文本功能支持多種語言和方言，能夠?qū)崟r將語音轉(zhuǎn)換為文本，并提供了強大的噪聲抑制和回聲消除功能，使得識別準確率大大提高。

python代碼如下：

import os
import tkinter as tk
from tkinter import filedialog, ttk
import azure.cognitiveservices.speech as speechsdk
from datetime import datetime

# 配置Azure語音服務的密鑰和區(qū)域
speech_key = "key"
service_region = "service_region"

def recognize_speech():
    # 獲取選擇的WAV文件路徑
    wav_file = filedialog.askopenfilename(filetypes=[("WAV Files", "*.wav")])
    
    if wav_file:
        # 更新狀態(tài)標簽
        status_label.config(text="正在識別...")
        
        # 創(chuàng)建語音配置對象,并設置語言為中文
        speech_config = speechsdk.SpeechConfig(subscription=speech_key, region=service_region)
        speech_config.speech_recognition_language = "zh-CN"
        
        # 創(chuàng)建音頻配置對象
        audio_config = speechsdk.audio.AudioConfig(filename=wav_file)
        
        # 創(chuàng)建語音識別器對象
        speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config, audio_config=audio_config)
        
        # 定義識別結果的回調(diào)函數(shù)
        recognized_text = []
        def handle_final_result(evt):
            recognized_text.append(evt.result.text)
            progress_bar.step(10)  # 每次識別結果更新進度條
        
        # 連接識別結果的事件處理程序
        speech_recognizer.recognized.connect(handle_final_result)
        
        # 定義識別狀態(tài)的標志變量
        is_recognizing = True
        
        # 定義識別結束的回調(diào)函數(shù)
        def handle_session_stopped(evt):
            nonlocal is_recognizing
            is_recognizing = False
        
        # 連接識別結束的事件處理程序
        speech_recognizer.session_stopped.connect(handle_session_stopped)
        
        # 執(zhí)行連續(xù)識別
        speech_recognizer.start_continuous_recognition()
        
        # 等待連續(xù)識別完成
        while is_recognizing:
            window.update()
        
        # 停止連續(xù)識別
        speech_recognizer.stop_continuous_recognition()
        
        # 獲取當前時間戳
        timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
        
        # 構建保存文件的路徑
        save_path = os.path.join("C:\\temp", f"recognized_text_{timestamp}.txt")
        
        # 將識別結果保存到文件
        with open(save_path, "w", encoding="utf-8") as file:
            file.write("\n".join(recognized_text))
        
        # 更新狀態(tài)標簽
        status_label.config(text="識別完成,結果已保存到文件: " + save_path)
        
        # 重置進度條
        progress_bar["value"] = 0

# 創(chuàng)建圖形化界面
window = tk.Tk()
window.title("語音識別")

# 創(chuàng)建選擇文件按鈕
select_button = tk.Button(window, text="選擇WAV文件", command=recognize_speech)
select_button.pack(pady=10)

# 創(chuàng)建狀態(tài)標簽
status_label = tk.Label(window, text="請選擇要識別的WAV文件")
status_label.pack()

# 創(chuàng)建進度條
progress_bar = ttk.Progressbar(window, length=200, mode="determinate")
progress_bar.pack(pady=10)


# 運行圖形化界面
window.mainloop()

運行后，效果如下：

zh-cn-xiaoxiaomultilingualneural,python,microsoft,ai,人工智能,TTS,azure,python

總結

總的來說，微軟的文本轉(zhuǎn)語音和語音轉(zhuǎn)文本功能的這次更新，無疑是一次重大的技術突破。它不僅為用戶提供了更加自然流暢的語音合成體驗，還極大地提高了語音識別的準確率。這對于需要使用語音識別和語音合成功能的用戶來說，無疑是一個巨大的福音。

好了，今天的分享就到這里。如果你對這兩個功能有更多的疑問或者想法，歡迎在評論區(qū)留言討論。我們下期再見！文章來源地址http://www.zghlxwxcb.cn/news/detail-849185.html

到了這里，關于微軟文本轉(zhuǎn)語音和語音轉(zhuǎn)文本功能更新，效果顯著！的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

C#調(diào)用微軟api文本轉(zhuǎn)語音
目錄 1.注冊微軟云服務，搭建文本轉(zhuǎn)語音標準應用（每月500萬字免費好像） 2.Visual studio使用nuget給程序安裝Microsoft.CognitiveServices.Speech框架 ?3.引用命名空間 4.文本轉(zhuǎn)語音參考代碼 5.文本轉(zhuǎn)語音下載到本地參考代碼
2024年02月12日
瀏覽(22)
微軟（TTS）文本轉(zhuǎn)語音服務API實現(xiàn)
此博客實現(xiàn)與java實現(xiàn)微軟文本轉(zhuǎn)語音（TTS）經(jīng)驗總結_java tts_${簡簡單單}的博客-CSDN博客之上，首先感謝博客源碼的提供，本人在上面添加了一些詳細的注釋，方便大家跟好的理解和使用，畢竟我已經(jīng)用原文調(diào)試了一下午才調(diào)通，一些細節(jié)的問題給大家標注出來，免得浪費大家
2024年02月07日
瀏覽(22)
【微信小程序】接入微軟azure文本轉(zhuǎn)語音的記錄
想在微信小程序中實現(xiàn)文本轉(zhuǎn)語音的功能，使用azure的RESTful API。先說結論：還是在后臺處理吧現(xiàn)象：模擬器上運行是正常的，可以獲得轉(zhuǎn)換后的音頻，真機調(diào)試時， statusCode:400 ，在官方文檔中的解釋是，參數(shù)錯誤，常見原因是：標頭過長。原因：小程序wx.request user-age
2024年02月06日
瀏覽(36)
edge-tts微軟文本轉(zhuǎn)語音庫，來聽聽這些語音是否很熟悉？
上期圖文教程，我們分享了Azure機器學習的文本轉(zhuǎn)語音的賬號申請與API申請的詳細步驟，也介紹了基于python3實現(xiàn)Azure機器學習文本轉(zhuǎn)語音功能的代碼實現(xiàn)過程，雖然我們可以使用Azure賬號免費提供一年的試用期，但是畢竟是要付費的，我們的API也無法長期使用，好在微軟發(fā)布了
2024年02月07日
瀏覽(21)
免費下載微軟azure文本轉(zhuǎn)語音的mp3文件
免費下載微軟azure文本轉(zhuǎn)語音的mp3文件 Azure機器學習的文本轉(zhuǎn)語音最接近人聲, 大家平時看的抖音的影視剪輯賬號用的配音都是從這里錄制下載的一、下載 edge瀏覽器由于國內(nèi)下載google瀏覽器插件需要科學上網(wǎng)，所以我們這里使用edge瀏覽器下載地址可以自行百度，或者從這里
2024年02月05日
瀏覽(17)
文本轉(zhuǎn)語音-微軟Azure-一步一步教你從注冊到使用
牙叔教程簡單易懂他們的中文也許還行, 但是英文我試了都不滿意, 我再網(wǎng)上搜到的我認為最好的是但是丫真貴 Best Free Text To Speech Voice Reader | Speechify 現(xiàn)在的匯率是 139 × 6.91 = 960.49 一年一千塊, 好像還行哈, 但是沒卡呀, 擦, 比來比去, 還是微軟Azure性價比最高, 沒有微軟Azure的
2024年02月07日
瀏覽(27)
使用微軟Azure的tts文本轉(zhuǎn)語音服務出現(xiàn)java.lang.UnsatisfiedLinkError
最近，在使用微軟tts文本轉(zhuǎn)語音的speech服務時，項目正常整合了微軟的依賴，服務也正常啟動。但是只要調(diào)用微軟文本轉(zhuǎn)語音服務api時，就會出現(xiàn)如下報錯。該方法是一個native方法，我以為是依賴中的dll文件沒有加載到，結果檢查不是。最后分析：native依賴的是底層實現(xiàn)的
2024年02月14日
瀏覽(26)
uniapp 語音文本播報功能
最近uniapp項目上遇到一個需求就是在接口調(diào)用成功的時候加上語音播報， ‘創(chuàng)建成功’ ‘開始成功’ ‘結束成功’ 之類的。因為是固定的文本，所以我先利用工具生成了文本語音mp3文件，放入項目中，直接用就好了。這里用到的工具：知意配音鏈接地址：https://peiy
2024年02月15日
瀏覽(18)
免費的語音識別 API：簡單實現(xiàn)語音轉(zhuǎn)文本功能
語音識別技術在現(xiàn)代信息處理和人機交互中扮演著重要角色。如果您正在尋找免費的語音識別 API，那么您來對地方了！本文將向您介紹一個簡單的方法來實現(xiàn)語音轉(zhuǎn)文本的功能，并提供相應的源代碼供參考。首先，您需要使用 Python 編程語言來實現(xiàn)這個功能。Python 提供了許
2024年02月03日
瀏覽(14)
小程序中使用微信同聲傳譯插件實現(xiàn)語音識別、語音合成、文本翻譯功能----文本翻譯（三）
官方文檔鏈接：https://mp.weixin.qq.com/wxopen/plugindevdoc?appid=wx069ba97219f66d99token=370941954lang=zh_CN#- 要使用插件需要先在小程序管理后臺的設置-第三方設置-插件管理中添加插件，目前該插件僅認證后的小程序。文本翻譯目前支持的語言有 zh_CN（中國大陸） en_US（英語）。參數(shù)說明：
2024年01月18日
瀏覽(99)

<progress id="joi5r"><u id="joi5r"><rp id="joi5r"></rp></u></progress>

<rp id="joi5r"></rp>