? ? 西安交通大學(xué)開源了人工智能SadTalker模型,通過從音頻中學(xué)習(xí)生成3D運動系數(shù),使用全新的3D面部渲染器來生成頭部運動,可以實現(xiàn)圖片+音頻就能生成高質(zhì)量的視頻。內(nèi)含多個踩坑的解決辦法,值得玩一玩。
1、sadtalker安裝
1.1 windows運行環(huán)境構(gòu)建
Install Python 3.10.6
Install git manually
Install ffmpeg
Download our SadTalker repository, git clone https://github.com/Winfredy/SadTalker.git.
Download the checkpoint and gfpgan below,放當前目錄checkpoint下;
Run start.bat from Windows Explorer as normal, non-administrator, user, a gradio WebUI demo will be started.
1.2、Linux安裝,推薦,我就是用的這個環(huán)境
Installing anaconda, python and git.
? 去下載:https://www.anaconda.com/download#downloads
?? ?# 進入當保存文件的目錄,執(zhí)行此指令, 后期由于版本更新,可能會與此文件命名有所不同
?? ?bash Anaconda3-2023.03-1-Linux-x86_64.sh -p /home/program/anaconda3
?? ?source ~/.bashrc
安裝文章來源:http://www.zghlxwxcb.cn/news/detail-501581.html
git文章來源地址http://www.zghlxwxcb.cn/news/detail-501581.html
到了這里,關(guān)于八、讓照片說話之SadTalk的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!