您是否厭倦了手動(dòng)轉(zhuǎn)錄數(shù)小時(shí)的錄音?您想節(jié)省時(shí)間并提高工作效率嗎?然后,您會(huì)很高興聽到 OpenAI 用于語(yǔ)音到文本轉(zhuǎn)換的新 Whisper API!借助這項(xiàng)尖端的 AI 技術(shù),您現(xiàn)在可以在 Python 程序中輕松地將音頻文件轉(zhuǎn)換為文本。讓我們?cè)谙旅嫣接戇@是如何工作的!
創(chuàng)建一個(gè)新文件python-whisper-api.py并通過插入以下 python 代碼行開始:
import os
import openai
openai.api_key = "[INSERT YOUR OPENAI API KEY HERE]"
audio_file = open("sample.mp3", "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)
print(transcript.text)
上面的 Python 代碼是如何使用 OpenAI 的 Whisper API 來使用 Python 轉(zhuǎn)錄音頻文件的示例。以下是每一行代碼的作用的細(xì)分:
import os:這會(huì)導(dǎo)入內(nèi)置的 os 模塊,它允許我們與操作系統(tǒng)交互并執(zhí)行打開文件等任務(wù)。
import openai:這將導(dǎo)入openai模塊,該模塊提供對(duì) OpenAI 的 API 的訪問。如果您尚未在本地 Python 開發(fā)環(huán)境中安裝該模塊,則需要使用以下命令進(jìn)行安裝:pip install openai
openai.api_key = "[INSERT YOUR OPENAI API KEY HERE]":這會(huì)設(shè)置 OpenAI API 的 API 密鑰,這是進(jìn)行 API 調(diào)用所必需的。
audio_file = open("sample.mp3", "rb"):這將以讀取二進(jìn)制模式打開音頻文件“sample.mp3”并將其分配給變量audio_file。
transcript = openai.Audio.transcribe("whisper-1", audio_file):這是使用openai.Audio.transcribe()轉(zhuǎn)錄音頻文件的方法。Screenpresso:強(qiáng)大的 Windows 屏幕捕獲工具第一個(gè)參數(shù)是要使用的模型的名稱(“whisper-1”),第二個(gè)參數(shù)是我們?cè)诘?4 步中打開的音頻文件。該方法返回一個(gè)對(duì)象,我們將其分配transcribe()給Transcription變量transcript。
print(transcript.text):這會(huì)打印出text轉(zhuǎn)錄的,可通過對(duì)象的文本屬性訪問Transcription。
總之,此代碼使用 OpenAI Whisper API 轉(zhuǎn)錄音頻文件并打印出生成的文本轉(zhuǎn)錄。
讓我們運(yùn)行應(yīng)用程序
讓我們通過輸入以下命令來運(yùn)行 Python 應(yīng)用程序:
$ python python-whisper-api.py
您需要確保已將音頻文件存儲(chǔ)在名稱為 sample.mp3 的同一文件夾中。然后您將收到由 Whisper 提供的文本抄本:文章來源:http://www.zghlxwxcb.cn/news/detail-490337.html

結(jié)論
OpenAI 的 Whisper API 為 Python 編程中的語(yǔ)音到文本轉(zhuǎn)換開辟了一個(gè)充滿可能性的世界。通過利用這項(xiàng)新技術(shù),您可以通過自動(dòng)化轉(zhuǎn)錄過程來提高工作效率并節(jié)省時(shí)間。無(wú)論您是記者、研究人員,還是需要定期處理音頻內(nèi)容的人,Whisper API 都可以成為您的武器庫(kù)中的寶貴工具。憑借其令人印象深刻的準(zhǔn)確性和易用性,Whisper API 有望在未來徹底改變我們處理音頻內(nèi)容的方式。那為什么還要等?立即開始探索 Whisper API,發(fā)現(xiàn)您可以使用這項(xiàng)突破性技術(shù)實(shí)現(xiàn)的所有令人驚奇的事情。文章來源地址http://www.zghlxwxcb.cn/news/detail-490337.html
到了這里,關(guān)于在 Python 中使用 OpenAI 的新 Whisper API 進(jìn)行語(yǔ)音轉(zhuǎn)文本的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!