国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Unity 語(yǔ)音轉(zhuǎn)文字

這篇具有很好參考價(jià)值的文章主要介紹了Unity 語(yǔ)音轉(zhuǎn)文字。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

1. Window 自帶的微軟語(yǔ)音識(shí)別

參考官方手冊(cè):Windows.Speech.DictationRecognizer - Unity 腳本 API (unity3d.com)

這個(gè)中英識(shí)別都比較準(zhǔn)確,不過(guò)應(yīng)該只支持Win10以上。

需在設(shè)置里開啟在線語(yǔ)音識(shí)別。

unity 語(yǔ)音轉(zhuǎn)文字,Unity,語(yǔ)音識(shí)別,人工智能,unity

?代碼部分:

using System;
using System.Collections;
using System.Collections.Generic;
using UnityEngine;
using UnityEngine.Events;
using UnityEngine.UI;
using UnityEngine.Windows.Speech;

public class DictationScript : MonoBehaviour
{
    public Text hypothesesText;//顯示輸入過(guò)程中猜想結(jié)果的
    public Text recognitionsText;//顯示識(shí)別結(jié)果的
    public Button startBtn;
    public Button stopBtn;

    private DictationRecognizer dictationRecognizer;

    void Start()
    {
        dictationRecognizer = new DictationRecognizer();

        dictationRecognizer.DictationResult += OnDictationResult;
        dictationRecognizer.DictationHypothesis += OnDictationHypothesis;
        dictationRecognizer.DictationComplete += OnDictationComplete;
        dictationRecognizer.DictationError += OnDictationError;

        //dictationRecognizer.Start();
        startBtn.onClick.AddListener(DictationStart);
        stopBtn.onClick.AddListener(DictionStop);
    }

    private void OnDestroy()
    {
        dictationRecognizer.Stop();
        dictationRecognizer.Dispose();
    }

    /// <summary>
    /// 語(yǔ)音識(shí)別結(jié)果
    /// </summary>
    /// <param name="text">識(shí)別結(jié)果</param>
    /// <param name="confidence"></param>
    private void OnDictationResult(string text, ConfidenceLevel confidence)
    {
        Debug.LogFormat("識(shí)別結(jié)果: {0}", text);
        recognitionsText.text = text;

        DictionStop();//我是希望得到結(jié)果就自動(dòng)停止輸入
    }

    /// <summary>
    /// 語(yǔ)音輸入過(guò)程中對(duì)結(jié)果猜想時(shí)觸發(fā)的事件。
    /// </summary>
    /// <param name="text">識(shí)別猜想</param>
    private void OnDictationHypothesis(string text)
    {
        Debug.LogFormat("識(shí)別猜想: {0}", text);
        hypothesesText.text = text;
    }

    private void OnDictationComplete(DictationCompletionCause cause)
    {
        if (cause != DictationCompletionCause.Complete)
            Debug.LogErrorFormat("識(shí)別失敗: {0}.", cause);
    }

    private void OnDictationError(string error, int hresult)
    {
        Debug.LogErrorFormat("識(shí)別錯(cuò)誤: {0}; HResult = {1}.", error, hresult);
    }

    /// <summary>
    /// 開啟聽(tīng)寫識(shí)別會(huì)話
    /// </summary>
    public void DictationStart()
    {
        dictationRecognizer.Start();
        startBtn.gameObject.SetActive(false);
        stopBtn.gameObject.SetActive(true);
    }

    /// <summary>
    /// 結(jié)束聽(tīng)寫識(shí)別會(huì)話
    /// </summary>
    public void DictionStop()
    {
        dictationRecognizer.Stop();
        startBtn.gameObject.SetActive(true);
        stopBtn.gameObject.SetActive(false);
    }

}

2. 百度SDK

也可以考慮其他平臺(tái)的SDK,我只測(cè)試了百度的,這個(gè)英文識(shí)別不大好(最起碼Unity識(shí)別不出來(lái),IPad可以識(shí)別出來(lái)),上面那個(gè)中英識(shí)別都不錯(cuò),不過(guò)只支持Window,百度的這個(gè)我也沒(méi)測(cè)試其他平臺(tái),自行測(cè)試吧。

官方文檔:https://ai.baidu.com/ai-doc/SPEECH/ilbxfvpau

  1. 在百度智能云控制臺(tái)創(chuàng)建一個(gè)應(yīng)用,勾上短語(yǔ)音識(shí)別
  2. 下載C# SDK:https://ai.baidu.com/sdk#asr
  3. 將SDK 放入U(xiǎn)nity中Plugins文件夾下

然后直接上代碼吧文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-720869.html

using System.Collections;
using System.Collections.Generic;
using UnityEngine;
using Baidu.Aip.Speech;
using UnityEngine.UI;

public class BaiduSpeech : MonoBehaviour
{
    public Text text;//顯示結(jié)果用的

    // 設(shè)置APPID/AK/SK
    string APP_ID = "你的 AppID";
    string API_KEY = "你的 API Key";
    string SECRET_KEY = "你的 Secret Key";

    int rate = 8000;

    Asr client;
    AudioSource aud;
    int audioLength;//錄音的長(zhǎng)度

    private void Awake()
    {
        if (GetComponent<AudioSource>() == null)
            aud = gameObject.AddComponent<AudioSource>();
        else
            aud = gameObject.GetComponent<AudioSource>();
        aud.playOnAwake = false;
    }
    // Start is called before the first frame update
    void Start()
    {
        client = new Asr(APP_ID, API_KEY, SECRET_KEY);
        client.Timeout = 60000;  // 修改超時(shí)時(shí)間
    }

    /// <summary>
    /// 開始錄音
    /// </summary>
    public void StartMic()
    {
        if (Microphone.devices.Length == 0) return;
        Microphone.End(null);
        Debug.Log("Start");
        aud.clip = Microphone.Start(null, false, 10, rate);
    }

    /// <summary>
    /// 結(jié)束錄音
    /// </summary>
    public void EndMic()
    {
        int lastPos = Microphone.GetPosition(null);
        if (Microphone.IsRecording(null))
            audioLength = lastPos / rate;//錄音時(shí)長(zhǎng)  
        else
            audioLength = 10;
        Debug.Log("Stop");
        Microphone.End(null);

        AsrData(GetClipData());
    }

    /// <summary>
    /// 把錄音轉(zhuǎn)換為Byte[]
    /// </summary>
    /// <returns></returns>
    public byte[] GetClipData()
    {
        if (aud.clip == null)
        {
            Debug.LogError("錄音數(shù)據(jù)為空");
            return null;
        }

        float[] samples = new float[aud.clip.samples];
        aud.clip.GetData(samples, 0);

        byte[] outData = new byte[samples.Length * 2];
        int rescaleFactor = 32767; //to convert float to Int16   
        for (int i = 0; i < samples.Length; i++)
        {
            short temshort = (short)(samples[i] * rescaleFactor);

            byte[] temdata = System.BitConverter.GetBytes(temshort);

            outData[i * 2] = temdata[0];
            outData[i * 2 + 1] = temdata[1];
        }
        if (outData == null || outData.Length <= 0)
        {
            Debug.LogError("錄音數(shù)據(jù)為空");
            return null;
        }

        return outData;
    }

    // 識(shí)別本地文件
    public void AsrData(byte[] data)
    {
        // 可選參數(shù)
        var options = new Dictionary<string, object>
        {
            {"dev_pid", 1537}
        };
        client.Timeout = 120000; // 若語(yǔ)音較長(zhǎng),建議設(shè)置更大的超時(shí)時(shí)間. ms
        var result = client.Recognize(data, "pcm", rate, options);
        if (result["result"] != null)
        {
            text.text = result["result"][0].ToString();
        }
        else
        {
            Debug.Log("識(shí)別錯(cuò)誤");
        }
        Debug.Log(result);
    }

}

到了這里,關(guān)于Unity 語(yǔ)音轉(zhuǎn)文字的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 第14章-Python-人工智能-語(yǔ)言識(shí)別-調(diào)用百度語(yǔ)音識(shí)別

    第14章-Python-人工智能-語(yǔ)言識(shí)別-調(diào)用百度語(yǔ)音識(shí)別

    ? ? ? ? 百度語(yǔ)音識(shí)別API是可以免費(fèi)試用的,通過(guò)百度賬號(hào)登錄到百度智能云,在語(yǔ)音技術(shù)頁(yè)面創(chuàng)建的應(yīng)用,生成一個(gè)語(yǔ)音識(shí)別的應(yīng)用,這個(gè)應(yīng)用會(huì)給你一個(gè)APIKey和一個(gè)Secret Key,如圖14.1所示。 ?我們?cè)谧约旱某绦蛑杏?API Key 和 Secret Key 這兩個(gè)值獲取 Koken,然后再通過(guò) Token 調(diào)

    2024年02月08日
    瀏覽(103)
  • 語(yǔ)音識(shí)別與VC維:改變?nèi)斯ぶ悄艿奈磥?lái)

    語(yǔ)音識(shí)別(Speech Recognition)是一種人工智能技術(shù),它旨在將人類的語(yǔ)音信號(hào)轉(zhuǎn)換為文本或其他形式的數(shù)據(jù)。這項(xiàng)技術(shù)在過(guò)去幾年中得到了巨大的發(fā)展,并成為人工智能領(lǐng)域的一個(gè)關(guān)鍵技術(shù)。VC維(Vocabulary Coverage Dimension)是一種數(shù)學(xué)模型,用于描述語(yǔ)言模型的表達(dá)能力。在本文中,

    2024年02月19日
    瀏覽(25)
  • 【人工智能】科大訊飛語(yǔ)音識(shí)別應(yīng)用開發(fā)(第三集)

    【人工智能】科大訊飛語(yǔ)音識(shí)別應(yīng)用開發(fā)(第三集)

    這次需要對(duì)科大訊飛語(yǔ)音識(shí)別接口進(jìn)行語(yǔ)音識(shí)別應(yīng)用開發(fā),前兩次都是通過(guò)WebAPI調(diào)用接口,這次換一下,通過(guò)SDK調(diào)用接口 下面是開發(fā)的詳細(xì)記錄過(guò)程(基于前兩次的基礎(chǔ)上) 網(wǎng)址:https://www.xfyun.cn/services/voicedictation 不領(lǐng)服務(wù)量為500且該包免費(fèi)( 貌似是不同應(yīng)用都可以免費(fèi)領(lǐng)

    2024年02月13日
    瀏覽(22)
  • 人工智能-語(yǔ)音識(shí)別技術(shù)paddlespeech的搭建和使用

    PaddleSpeech是百度飛槳(PaddlePaddle)開源深度學(xué)習(xí)平臺(tái)的其中一個(gè)項(xiàng)目,它基于飛槳的語(yǔ)音方向模型庫(kù),用于語(yǔ)音和音頻中的各種關(guān)鍵任務(wù)的開發(fā),包含大量基于深度學(xué)習(xí)前沿和有影響力的模型。PaddleSpeech支持語(yǔ)音識(shí)別、語(yǔ)音翻譯(英譯中)、語(yǔ)音合成、標(biāo)點(diǎn)恢復(fù)等應(yīng)用示例。

    2024年02月02日
    瀏覽(29)
  • OpenAI的人工智能語(yǔ)音識(shí)別模型Whisper詳解及使用

    OpenAI的人工智能語(yǔ)音識(shí)別模型Whisper詳解及使用

    ????????擁有ChatGPT語(yǔ)言模型的OpenAI公司,開源了 Whisper 自動(dòng)語(yǔ)音識(shí)別系統(tǒng),OpenAI 強(qiáng)調(diào) Whisper 的語(yǔ)音識(shí)別能力已達(dá)到人類水準(zhǔn)。 ????????Whisper是一個(gè)通用的語(yǔ)音識(shí)別模型,它使用了大量的多語(yǔ)言和多任務(wù)的監(jiān)督數(shù)據(jù)來(lái)訓(xùn)練,能夠在英語(yǔ)語(yǔ)音識(shí)別上達(dá)到接近人類水平的魯

    2024年02月09日
    瀏覽(95)
  • 構(gòu)建基于AWSLambda的人工智能應(yīng)用:語(yǔ)音識(shí)別、圖像識(shí)別和自然語(yǔ)言處理

    作者:禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 在人工智能領(lǐng)域,用大數(shù)據(jù)、機(jī)器學(xué)習(xí)等方法來(lái)解決復(fù)雜的問(wèn)題,已經(jīng)成為越來(lái)越多企業(yè)和開發(fā)者關(guān)注的問(wèn)題。但是,如何把這些方法落地到生產(chǎn)環(huán)境中,仍然是一個(gè)難題。 隨著云計(jì)算平臺(tái)的廣泛普及,AWS Lambda作為一項(xiàng)服務(wù)正在成為各個(gè)公司

    2024年02月09日
    瀏覽(36)
  • AI人工智能課題:交通場(chǎng)景文字識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)(基于百度智能云AI接口)

    ?博主介紹 :黃菊華老師《Vue.js入門與商城開發(fā)實(shí)戰(zhàn)》《微信小程序商城開發(fā)》圖書作者,CSDN博客專家,在線教育專家,CSDN鉆石講師;專注大學(xué)生畢業(yè)設(shè)計(jì)教育和輔導(dǎo)。 所有項(xiàng)目都配有從入門到精通的基礎(chǔ)知識(shí)視頻課程,免費(fèi) 項(xiàng)目配有對(duì)應(yīng)開發(fā)文檔、開題報(bào)告、任務(wù)書、

    2024年02月04日
    瀏覽(24)
  • AI人工智能課題:通用場(chǎng)景文字識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)(基于百度智能云AI接口)

    ?博主介紹 :黃菊華老師《Vue.js入門與商城開發(fā)實(shí)戰(zhàn)》《微信小程序商城開發(fā)》圖書作者,CSDN博客專家,在線教育專家,CSDN鉆石講師;專注大學(xué)生畢業(yè)設(shè)計(jì)教育和輔導(dǎo)。 所有項(xiàng)目都配有從入門到精通的基礎(chǔ)知識(shí)視頻課程,免費(fèi) 項(xiàng)目配有對(duì)應(yīng)開發(fā)文檔、開題報(bào)告、任務(wù)書、

    2024年02月05日
    瀏覽(32)
  • AI人工智能課題:教育場(chǎng)景文字識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)(基于百度智能云AI接口)

    ?博主介紹 :黃菊華老師《Vue.js入門與商城開發(fā)實(shí)戰(zhàn)》《微信小程序商城開發(fā)》圖書作者,CSDN博客專家,在線教育專家,CSDN鉆石講師;專注大學(xué)生畢業(yè)設(shè)計(jì)教育和輔導(dǎo)。 所有項(xiàng)目都配有從入門到精通的基礎(chǔ)知識(shí)視頻課程,免費(fèi) 項(xiàng)目配有對(duì)應(yīng)開發(fā)文檔、開題報(bào)告、任務(wù)書、

    2024年02月04日
    瀏覽(28)
  • AI人工智能課題:財(cái)務(wù)票據(jù)文字識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)(基于百度智能云AI接口)

    ?博主介紹 :黃菊華老師《Vue.js入門與商城開發(fā)實(shí)戰(zhàn)》《微信小程序商城開發(fā)》圖書作者,CSDN博客專家,在線教育專家,CSDN鉆石講師;專注大學(xué)生畢業(yè)設(shè)計(jì)教育和輔導(dǎo)。 所有項(xiàng)目都配有從入門到精通的基礎(chǔ)知識(shí)視頻課程,免費(fèi) 項(xiàng)目配有對(duì)應(yīng)開發(fā)文檔、開題報(bào)告、任務(wù)書、

    2024年02月04日
    瀏覽(25)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包