国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<thead id="zgkvy"><div id="zgkvy"><sup id="zgkvy"></sup></div></thead>

<tfoot id="zgkvy"></tfoot>

SadTalker：讓stable diffusion人物說話的創(chuàng)新工具

1年前作者：sawyes分類：Toy博客閱讀(26)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了SadTalker：讓stable diffusion人物說話的創(chuàng)新工具。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

本文詳細(xì)介紹了安裝過程和使用教程。

功能說明

github 項(xiàng)目SadTalker 可以根據(jù)一張圖片、一段音頻，合成面部說這段語音的視頻。圖片需要真人或者接近真人。目前項(xiàng)目已經(jīng)支持stable diffusion webui,可以SD出圖后，結(jié)合一段音頻合成面部說話的視頻（抖音常見的數(shù)字人）

SadTalker安裝過程

內(nèi)訪問速度比較慢，使用ghproxy加速，格式https://ghproxy.com/{github url}

https://ghproxy.com/https://github.com/OpenTalker/SadTalker

如圖在extensions中填入地址，和下載后的目錄名稱，下載的文件將存放在{project你的項(xiàng)目}/stable-diffusion-webui/extensions，并且文件夾的文字和頁面輸入的一致SadTalker

SadTalker,stable diffusion,面部合成,GitHub項(xiàng)目
上一步插件安裝完成后，還需要繼續(xù)補(bǔ)充兩個(gè)壓縮包文件，分別放到對應(yīng)目錄

根據(jù)倉庫代碼 download_models得知下載地址，手動(dòng)下載，主要是兩個(gè)目錄文件checkpoints 和gfpgan
也可以百度云盤:

模型checkpoints, 提取碼: sadt.
gfpgan, 提取碼: sadt.

checkpoints：整個(gè)checkpoints放在 {project}/stable-diffusion-webui/extensions/SadTalker擴(kuò)展目錄下;

gfpgan：解壓搓來的4個(gè)文件alignment_WFLW_4HG.pth detection_Resnet50_Final.pth GFPGANv1.4.pth parsing_parsenet.pth需要放在 {project}/stable-diffusion-webui/models/GFPGAN

繼續(xù)下一步環(huán)境配置
ffmpeg：視頻生成需要用到（根據(jù)環(huán)境不同選擇適合自己的方式）,以下是centos8安裝方式

dnf install epel-release
yum config-manager --set-enabled PowerTools
yum-config-manager --add-repo=https://negativo17.org/repos/epel-multimedia.repo
dnf install ffmpeg ffmpeg
ffmpeg -version

重新啟動(dòng)程序python3 launch.py --enable-insecure-extension-access --xformers --server-name 0.0.0.0

使用教程（一）linux下部署sdwebui，安裝模型和插件的圖片來試試效果，關(guān)于參數(shù)說明

圖片，最好是大頭，不然會(huì)顯得不自然
音頻文件，用SadTalker示例的音頻測試
圖片處理方式氛圍，crop（剪裁）, resize（重置大?。? full(原圖)，其中crop根據(jù)面部關(guān)鍵點(diǎn)生成的表情和動(dòng)畫相對逼真，前提是不要全圖，看起來會(huì)很怪
Remove head motion (works better with preprocess full) 這個(gè)選項(xiàng)在原圖的時(shí)候很有必要，優(yōu)化人物頭部運(yùn)動(dòng)，生成的視頻更加自然；這里因?yàn)橛昧思舨?，所以就不選擇打開了
Face enhancement，勾選上, 可以獲得更好的面部質(zhì)量

SadTalker,stable diffusion,面部合成,GitHub項(xiàng)目

視頻被CSDN處理過，看起來有些不自然，實(shí)際效果還是不錯(cuò)的

SadTalker,stable diffusion,面部合成,GitHub項(xiàng)目

文本生成語音涉及太多非技術(shù)問題，就不展開了，自行看TTS-Vue項(xiàng)目文章來源地址http://www.zghlxwxcb.cn/news/detail-482024.html

到了這里，關(guān)于SadTalker：讓stable diffusion人物說話的創(chuàng)新工具的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

Stable Diffusion SadTalker 面部合成 GitHub項(xiàng)目

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

AI繪圖實(shí)戰(zhàn)（八）：制作游戲人物原稿三視圖 | Stable Diffusion成為設(shè)計(jì)師生產(chǎn)力工具
S：AI能取代設(shè)計(jì)師么？ I ：至少在設(shè)計(jì)行業(yè)，目前AI扮演的主要角色還是超級(jí)工具，要頂替？除非甲方對設(shè)計(jì)效果無所畏懼~~ 預(yù)先學(xué)習(xí) ：安裝及其問題解決參考：《Windows安裝Stable Diffusion WebUI及問題解決記錄》；運(yùn)行使用時(shí)問題《Windows使用Stable Diffusion時(shí)遇到的各種問題整理
2024年02月06日
瀏覽(46)
Stable Diffusion WebUI安裝SadTalker插件
AI繪畫已經(jīng)火了有幾個(gè)月了，不知道大家有沒有去體驗(yàn)一下呢？要說可操作性最強(qiáng)的莫過于Stable Diffusion WebUI，簡稱SD，下面我們就來介紹一下如何給SD安裝上SadTalker插件，記錄一下安裝和使用過程中踩過的坑~ 通過Stable Diffusion WebUI安裝SadTalker插件，有4種方式： 1. web界面通過在
2024年02月10日
瀏覽(23)
Stable Diffusion 使用 SadTalker 生成圖片數(shù)字人
Heygen和D-ID等照片轉(zhuǎn)視頻的工具，都需要在線付費(fèi)使用。本次介紹一個(gè)SadTalker數(shù)字人。SadTalker有多種使用方式，包括完整安裝程序和stable diffusion插件模式。安裝程序操作較繁瑣，因此推薦stable diffusion插件模式。打開SD進(jìn)入擴(kuò)展復(fù)制鏈接 https://github.com/OpenTalker/SadTalker.git 到安裝
2024年02月13日
瀏覽(94)
Stable Diffusion——Adetailer面部處理
下載地址： GitHub - Bing-su/adetailer: Auto detecting, masking and inpainting with detection model.? 修復(fù)介紹：具體的得根據(jù)實(shí)際情況進(jìn)行選擇。? 模型適用對象 face_yolov8n.pt 2D / 真實(shí)人臉 face_yolov8s.pt 2D / 真實(shí)人臉 hand_yolov8n.pt 2D / 真實(shí)人手 person_yolov8n-seg.pt 2D / 真實(shí)全身 person_yolov8s-seg.pt 2D/真實(shí)
2024年02月03日
瀏覽(29)
打造AI虛擬數(shù)字人，Stable Diffusion+Sadtalker教程
站長筆記 2 個(gè)月前 1 1k Stable Diffusion是一個(gè)能夠根據(jù) 文本描述生成高質(zhì)量圖片的深度學(xué)習(xí)模型，它使用了一種叫做潛在擴(kuò)散模型的生成網(wǎng)絡(luò)架構(gòu) ，可以在普通的GPU上運(yùn)行。Sadtalker是一個(gè)能夠根據(jù)圖片和音頻生成視頻的開源項(xiàng)目，它使用了一種叫做 SadNet的神經(jīng)網(wǎng)絡(luò) ，可以
2024年02月11日
瀏覽(23)
基于SadTalker的AI主播，Stable Diffusion也可用
基于之前的AI主播的的學(xué)習(xí)基礎(chǔ) 基于Wav2Lip的AI主播和基于Wav2Lip+GFPGAN的高清版AI主播，這次嘗試一下VideoRetalking生成效果。總體來說，面部處理效果要好于Wav2Lip，而且速度相對于Wav2Lip+GFPGAN也提升很多，也支持自由旋轉(zhuǎn)角度，但是如果不修改源碼的情況下，視頻的部分截取稍
2023年04月23日
瀏覽(16)
嘗試著在Stable Diffusion里邊使用SadTalker進(jìn)行數(shù)字人制作
首先需要標(biāo)明的是，我這里是圖片說話類型，而且是看了知識(shí)星球AI破局俱樂部大航海數(shù)字人手冊進(jìn)行操作的。寫下這篇文章是防止我以后遺忘。我使用的基礎(chǔ)軟件是Stable Diffusion，SadTalker是作為插件放進(jìn)來的，需要注意的是這對自己的電腦GPU要求比較高，至少需要8G，至少我
2024年04月09日
瀏覽(24)
讓圖片說話SadTalker
SadTalker：使用一張圖片和一段語音來生成口型和頭、面部視頻. 西安交通大學(xué)開源了人工智能SadTalker模型，通過從音頻中學(xué)習(xí)生成3D運(yùn)動(dòng)系數(shù)，使用全新的3D面部渲染器來生成頭部運(yùn)動(dòng)，可以實(shí)現(xiàn)圖片+音頻就能生成高質(zhì)量的視頻。論文地址：Learning Realistic 3D Motion Coefficients 整
2024年02月21日
瀏覽(18)
stable diffusion如何確保每張圖的面部一致？
可以使用roop插件，確定好臉部圖片后，使用roop固定，然后生成的所有圖片都使用同一張臉。這款插件的功能簡單粗暴：一鍵換臉。如圖所示：任意上傳一張臉部清晰的圖片，點(diǎn)擊啟用。在其他提示詞不變的情況下，Stable Diffusion會(huì)跑出一張按照提示詞的要求的圖片，但臉部
2024年02月16日
瀏覽(21)
AI數(shù)字人：sadtalker讓照片開口說話
????????西安交通大學(xué)也開源了人工智能SadTalker模型，通過從音頻中學(xué)習(xí)生成3D運(yùn)動(dòng)系數(shù)，使用全新的3D面部渲染器來生成頭部運(yùn)動(dòng)，可以實(shí)現(xiàn)圖片+音頻就能生成高質(zhì)量的視頻。 ??????? 論文地址：Learning Realistic 3D Motion Coefficients ?????? 通過人臉圖像和一段語音音頻
2024年02月13日
瀏覽(16)

<thead id="lv3hq"><div id="lv3hq"><sup id="lv3hq"></sup></div></thead>

<del id="lv3hq"><pre id="lv3hq"></pre></del>

<address id="lv3hq"><var id="lv3hq"></var></address>

<del id="lv3hq"><pre id="lv3hq"><td id="lv3hq"></td></pre></del>