国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

ChatGPT搭建語音智能助手

2年前作者：山鬼謠me分類：Toy博客閱讀(22)違法舉報

這篇具有很好參考價值的文章主要介紹了ChatGPT搭建語音智能助手。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

環(huán)境

python：3+
ffmpeg:用于處理視頻和語音
gradio:UI界面和讀取語音

概述

我們的目的是做一個語音智能助手
ChatGPT搭建語音智能助手
下面我們開始

準備工作

下載Visual Studio Code

Visual Studio Code

因為需要寫python代碼，用Visual Studio Code比較方便。

安裝python

python官網(wǎng)
ChatGPT搭建語音智能助手

執(zhí)行下載好的exe文件，可以建議選擇自定義安裝，這樣可以修改安裝路徑，只要別安裝到C盤就行。

記得勾選添加到環(huán)境變量

添加環(huán)境變量

假設(shè)在安裝時候，忘記了勾選添加到環(huán)境變量，那么我們可以自己配置

ChatGPT搭建語音智能助手

修改subprocess.py文件

ChatGPT搭建語音智能助手

安裝ffmpeg

https://ffmpeg.org/

ChatGPT搭建語音智能助手

將下載好的安裝包，進行解壓，然后將解壓后的文件夾放到平時自己喜歡的安裝目錄里。

比如：我的是D盤：D:\Program Files\ffmpeg。

WINDOWS系統(tǒng)文字轉(zhuǎn)語音WSAY

https://github.com/p-groarke/wsay/releases/tag/v1.5.0

點擊下圖進行下載：
ChatGPT搭建語音智能助手

ChatGPT搭建語音智能助手

使用GRADIO建立用戶界面

先創(chuàng)建一個項目文件夾，比如我的：E:\openai\project\Chatbot

ChatGPT搭建語音智能助手
然后打開我們之前下載好的vsCode，并打開相關(guān)目錄。

參照gradio官網(wǎng)寫測試代碼

https://gradio.app/quickstart/

測試代碼1：頁面

import gradio as gr

def greet(name):
    return "Hello " + name + "!"

demo = gr.Interface(fn=greet, inputs="text", outputs="text")

demo.launch()

執(zhí)行代碼：

PS E:\openai\project\Chatbot> python ui.py

可以看到控制臺會打印如下信息：

Running on local URL:  http://127.0.0.1:7860

然后瀏覽器打開網(wǎng)址http://127.0.0.1:7860：

ChatGPT搭建語音智能助手

但是我們是需要做成語音的，所以我們需要調(diào)整下；

在官網(wǎng)找到：
https://gradio.app/docs/#audio

ChatGPT搭建語音智能助手

測試代碼2：

import gradio as gr

def transcribe(audio):
    print(audio)
    return "這里顯示音頻"

demo = gr.Interface(
    fn=transcribe, 
    inputs=gr.Audio(source="microphone"), 
    outputs="text")

demo.launch()

ChatGPT搭建語音智能助手

執(zhí)行命令：py uimp.py

瀏覽器刷新地址如下頁面：
ChatGPT搭建語音智能助手

接入openAI：

測試代碼3：

ChatGPT搭建語音智能助手

執(zhí)行命令：py uifinish.py

# 最終稿：

import gradio as gr
import openai, subprocess
from pathlib import Path

# 換成你自己的api_key
openai.api_key = "XXXXXXXXXXXXXXXXXXXXXX"

messages = [{"role": "system", "content": '你是一名知識淵博，樂于助人的智能聊天機器人.你的任務是陪我聊天，請用簡短的對話方式，用中文講一段話，每次回答不超過50個字！'}]

def transcribe(audio):
    global messages

    myfile=Path(audio)
    myfile=myfile.rename(myfile.with_suffix('.wav'))
    audio_file = open(myfile,"rb")
    transcript = openai.Audio.transcribe("whisper-1", audio_file)

    messages.append({"role": "user", "content": transcript["text"]})

    response = openai.ChatCompletion.create(model="gpt-3.5-turbo", messages=messages)

    system_message = response["choices"][0]["message"]
    # print(response)
    messages.append(system_message)

    subprocess.call(["wsay", system_message['content']])

    chat_transcript = ""
    for message in messages:
        if message['role'] != 'system':
            chat_transcript += message['role'] + ": " + message['content'] + "\n\n"

    return chat_transcript

ui = gr.Interface(fn=transcribe, inputs=gr.Audio(source="microphone", type="filepath"), outputs="text")
ui.launch()

效果如下：

ChatGPT搭建語音智能助手

總結(jié)

ffmpeg 來處理語音
利用WSAY，將文字轉(zhuǎn)成語音
利用gradio,來生成UI頁面，并提供語音輸入

參考地址：

https://updayday.notion.site/Chat-GPT-WHISPER-API-GPT-3-5-TURBO-2af2630c857a4f0da92abcc763b4fd48

Whisper API cannot read files correctly

Renaming file extension using pathlib (python 3)

Path not found in Python文章來源地址http://www.zghlxwxcb.cn/news/detail-414778.html

到了這里，關(guān)于ChatGPT搭建語音智能助手的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權(quán)，不承擔相關(guān)法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務器費用

人工智能語音助手：如何實現(xiàn)智能助手的實時語音監(jiān)控功能？
作者：禪與計算機程序設(shè)計藝術(shù) 隨著人工智能技術(shù)的快速發(fā)展，語音助手已經(jīng)成為人們?nèi)粘Ｉ钪胁豢苫蛉钡闹悄苤?。作為人工智能助手，實時語音監(jiān)控是必不可少的。本文將介紹如何更好地實現(xiàn)智能助手的實時語音監(jiān)控功能，為用戶提供更加優(yōu)質(zhì)的服務。 1 基本概念解釋
2024年02月08日
瀏覽(93)
機器學習周刊第4期：動手實戰(zhàn)人工智能、計算機科學熱門論文、免費的基于ChatGPT API的安卓端語音助手、每日數(shù)學、檢索增強 (RAG) 生成技術(shù)綜述
機器學習周刊第4期聚焦了AI實戰(zhàn)教程、熱門計算機科學論文、基于ChatGPT的安卓端語音助手、數(shù)學定理分享以及前沿的檢索增強（RAG）生成技術(shù)綜述。
2024年02月02日
瀏覽(35)
人工智能與語音助手：未來的智能助手
語音助手是人工智能領(lǐng)域的一個重要應用，它可以通過自然語言處理和語音識別技術(shù)來理解和回答用戶的問題。在過去的幾年里，語音助手技術(shù)已經(jīng)取得了顯著的進展，例如蘋果的Siri、谷歌的Google Assistant、亞馬遜的Alexa等。這些語音助手可以幫助用戶完成各種任務，如設(shè)置鬧
2024年02月22日
瀏覽(99)
【語音識別】落地實現(xiàn)--離線智能語音助手
參考：基于python和深度學習（語音識別、NLP）實現(xiàn)本地離線智能語音控制終端（帶聊天功能和家居控制功能）基于V3S的語音助手（三）移植pocketsphnix喚醒基于V3S的語音助手（二）移植pyaudio到開發(fā)板基于V3S的語音助手（一）python3的編譯和安裝（該版本解決zlib readline可
2024年03月09日
瀏覽(27)
OpenAI Whisper and ChatGPT 語音助手
麥克風輸入，展示三種結(jié)果輸入ASR結(jié)果輸出文本輸出TTS結(jié)果 gradio==3.19.1 gTTS==2.3.1 openai==0.27.0 openai-whisper==20230124 使用以下命令安裝 ffmpeg 需要科學上網(wǎng)，否則連接超時參考：https://github.com/bhattbhavesh91/voice-assistant-whisper-chatgpt
2024年02月03日
瀏覽(33)
親手打造一個本地LLM語音助手來管理智能家居
經(jīng)歷過 Siri 和 Google 助手之后，我發(fā)現(xiàn)盡管它們能夠控制各種設(shè)備，但卻無法進行個性化定制，并且不可避免地依賴于云服務。出于對新知識的渴望以及想在生活中使用一些酷炫的東西，我下定決心，要追求更高的目標。我的要求很簡單：我想要一個既幽默又帶有諷刺意味的
2024年01月21日
瀏覽(19)
自然語言處理的未來：從語音助手到人工智能
自然語言處理(NLP)是人工智能(AI)領(lǐng)域的一個重要分支，它涉及到計算機理解、生成和處理人類語言的能力。自從2010年左右，NLP技術(shù)在深度學習和大數(shù)據(jù)技術(shù)的推動下發(fā)生了巨大的變革，這使得許多之前只能由專業(yè)人士完成的任務現(xiàn)在可以由計算機自動完成。在過去的幾年里
2024年02月21日
瀏覽(23)
人工智能技術(shù)在智能語音助手中的應用：從智能家居到智慧交通
作者：禪與計算機程序設(shè)計藝術(shù) 引言 1.1. 背景介紹隨著科技的發(fā)展，人工智能技術(shù)越來越受到人們的關(guān)注。人工智能助手作為一種新型的技術(shù)，已經(jīng)成為人們生活中不可或缺的一部分。智能語音助手作為人工智能助手的一種，受到越來越多的用戶青睞。智能語音助手可以實
2024年02月07日
瀏覽(96)
基于Python+百度語音的智能語音ChatGPT聊天機器人（機器學習+深度學習+語義識別）含全部工程源碼適合個人二次開發(fā)
本項目基于機器學習和語義識別技術(shù)，讓機器人理解文本并進行合適的答復?；锇閭兛梢酝ㄟ^該工程源碼，進行個人二次開發(fā)，比如使用語音與機器人交流，實現(xiàn)智能問答、智能音箱及智能機器寵物等等。當然針對現(xiàn)在最火爆的 ChatGPT等通用大語言模型，伙伴們可以直接將其
2024年02月07日
瀏覽(29)
基于GPT3.5逆向和本地Bert-Vits2-2.3 的語音智能助手
各位讀者你們好，我最近在研究一個語音助手的項目，是基于GPT3.5網(wǎng)頁版的逆向和本地BertVits2-2.3 文字轉(zhuǎn)語音，能實現(xiàn)的事情感覺還挺多，目前實現(xiàn)【無需翻墻，國內(nèi)網(wǎng)絡發(fā)送消息，返回答案文字和語音】，網(wǎng)站已上線并未公開鏈接，以下是演示GIF：前端使用uni-app完成，登錄
2024年01月24日
瀏覽(26)