国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

SadTalker:讓stable diffusion人物說話的創(chuàng)新工具

這篇具有很好參考價(jià)值的文章主要介紹了SadTalker:讓stable diffusion人物說話的創(chuàng)新工具。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

本文詳細(xì)介紹了安裝過程和使用教程。

功能說明

github 項(xiàng)目SadTalker 可以根據(jù)一張圖片、一段音頻,合成面部說這段語音的視頻。圖片需要真人或者接近真人。目前項(xiàng)目已經(jīng)支持stable diffusion webui,可以SD出圖后,結(jié)合一段音頻合成面部說話的視頻(抖音常見的數(shù)字人)

SadTalker安裝過程

內(nèi)訪問速度比較慢,使用ghproxy加速,格式https://ghproxy.com/{github url}

https://ghproxy.com/https://github.com/OpenTalker/SadTalker

如圖在extensions中填入地址,和下載后的目錄名稱,下載的文件將存放在{project你的項(xiàng)目}/stable-diffusion-webui/extensions,并且文件夾的文字和頁面輸入的一致SadTalker

SadTalker,stable diffusion,面部合成,GitHub項(xiàng)目
上一步插件安裝完成后,還需要繼續(xù)補(bǔ)充兩個(gè)壓縮包文件,分別放到對應(yīng)目錄

  • 根據(jù)倉庫代碼 download_models得知下載地址,手動(dòng)下載,主要是兩個(gè)目錄文件checkpoints gfpgan

  • 也可以百度云盤:

    • 模型checkpoints, 提取碼: sadt.

    • gfpgan, 提取碼: sadt.

checkpoints:整個(gè)checkpoints放在 {project}/stable-diffusion-webui/extensions/SadTalker擴(kuò)展目錄下;

gfpgan: 解壓搓來的4個(gè)文件alignment_WFLW_4HG.pth detection_Resnet50_Final.pth GFPGANv1.4.pth parsing_parsenet.pth需要放在 {project}/stable-diffusion-webui/models/GFPGAN

繼續(xù)下一步環(huán)境配置
ffmpeg:視頻生成需要用到(根據(jù)環(huán)境不同選擇適合自己的方式),以下是centos8安裝方式

dnf install epel-release
yum config-manager --set-enabled PowerTools
yum-config-manager --add-repo=https://negativo17.org/repos/epel-multimedia.repo
dnf install ffmpeg ffmpeg
ffmpeg -version

重新啟動(dòng)程序python3 launch.py --enable-insecure-extension-access --xformers --server-name 0.0.0.0

使用教程(一)linux下部署sdwebui,安裝模型和插件的圖片來試試效果,關(guān)于參數(shù)說明

  • 圖片,最好是大頭,不然會(huì)顯得不自然

  • 音頻文件,用SadTalker示例的音頻測試

  • 圖片處理方式氛圍,crop(剪裁), resize(重置大?。? full(原圖),其中crop根據(jù)面部關(guān)鍵點(diǎn)生成的表情和動(dòng)畫相對逼真,前提是不要全圖,看起來會(huì)很怪

  • Remove head motion (works better with preprocess full) 這個(gè)選項(xiàng)在原圖的時(shí)候很有必要,優(yōu)化人物頭部運(yùn)動(dòng),生成的視頻更加自然;這里因?yàn)橛昧思舨?,所以就不選擇打開了

  • Face enhancement,勾選上, 可以獲得更好的面部質(zhì)量

SadTalker,stable diffusion,面部合成,GitHub項(xiàng)目

視頻被CSDN處理過,看起來有些不自然,實(shí)際效果還是不錯(cuò)的

SadTalker,stable diffusion,面部合成,GitHub項(xiàng)目

文本生成語音涉及太多非技術(shù)問題,就不展開了,自行看TTS-Vue項(xiàng)目文章來源地址http://www.zghlxwxcb.cn/news/detail-482024.html

到了這里,關(guān)于SadTalker:讓stable diffusion人物說話的創(chuàng)新工具的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • AI繪圖實(shí)戰(zhàn)(八):制作游戲人物原稿三視圖 | Stable Diffusion成為設(shè)計(jì)師生產(chǎn)力工具

    AI繪圖實(shí)戰(zhàn)(八):制作游戲人物原稿三視圖 | Stable Diffusion成為設(shè)計(jì)師生產(chǎn)力工具

    S:AI能取代設(shè)計(jì)師么? I :至少在設(shè)計(jì)行業(yè),目前AI扮演的主要角色還是超級(jí)工具,要頂替?除非甲方對設(shè)計(jì)效果無所畏懼~~ 預(yù)先學(xué)習(xí) : 安裝及其問題解決參考:《Windows安裝Stable Diffusion WebUI及問題解決記錄》; 運(yùn)行使用時(shí)問題《Windows使用Stable Diffusion時(shí)遇到的各種問題整理

    2024年02月06日
    瀏覽(46)
  • Stable Diffusion WebUI安裝SadTalker插件

    Stable Diffusion WebUI安裝SadTalker插件

    AI繪畫已經(jīng)火了有幾個(gè)月了,不知道大家有沒有去體驗(yàn)一下呢? 要說可操作性最強(qiáng)的莫過于Stable Diffusion WebUI,簡稱SD,下面我們就來介紹一下如何給SD安裝上SadTalker插件,記錄一下安裝和使用過程中踩過的坑~ 通過Stable Diffusion WebUI安裝SadTalker插件,有4種方式: 1. web界面通過在

    2024年02月10日
    瀏覽(23)
  • Stable Diffusion 使用 SadTalker 生成圖片數(shù)字人

    Stable Diffusion 使用 SadTalker 生成圖片數(shù)字人

    Heygen和D-ID等照片轉(zhuǎn)視頻的工具,都需要在線付費(fèi)使用。本次介紹一個(gè)SadTalker數(shù)字人。SadTalker有多種使用方式,包括完整安裝程序和stable diffusion插件模式。安裝程序操作較繁瑣,因此推薦stable diffusion插件模式。 打開SD進(jìn)入擴(kuò)展復(fù)制鏈接 https://github.com/OpenTalker/SadTalker.git 到安裝

    2024年02月13日
    瀏覽(94)
  • Stable Diffusion——Adetailer面部處理

    Stable Diffusion——Adetailer面部處理

    下載地址: GitHub - Bing-su/adetailer: Auto detecting, masking and inpainting with detection model.? 修復(fù)介紹: 具體的得根據(jù)實(shí)際情況進(jìn)行選擇。? 模型 適用對象 face_yolov8n.pt 2D / 真實(shí)人臉 face_yolov8s.pt 2D / 真實(shí)人臉 hand_yolov8n.pt 2D / 真實(shí)人手 person_yolov8n-seg.pt 2D / 真實(shí)全身 person_yolov8s-seg.pt 2D/真實(shí)

    2024年02月03日
    瀏覽(29)
  • 打造AI虛擬數(shù)字人,Stable Diffusion+Sadtalker教程

    站長筆記 2 個(gè)月前 1 1k Stable Diffusion是一個(gè)能夠根據(jù) 文本描述生成高質(zhì)量圖片的深度學(xué)習(xí)模型 ,它使用了一種叫做 潛在擴(kuò)散模型的生成網(wǎng)絡(luò)架構(gòu) ,可以在普通的GPU上運(yùn)行。Sadtalker是一個(gè)能夠根 據(jù)圖片和音頻生成 視頻的開源項(xiàng)目 ,它使用了一種叫做 SadNet的神經(jīng)網(wǎng)絡(luò) ,可以

    2024年02月11日
    瀏覽(23)
  • 基于SadTalker的AI主播,Stable Diffusion也可用

    基于SadTalker的AI主播,Stable Diffusion也可用

    基于之前的AI主播的的學(xué)習(xí)基礎(chǔ) 基于Wav2Lip的AI主播 和 基于Wav2Lip+GFPGAN的高清版AI主播,這次嘗試一下VideoRetalking生成效果。 總體來說,面部處理效果要好于Wav2Lip,而且速度相對于Wav2Lip+GFPGAN也提升很多,也支持自由旋轉(zhuǎn)角度,但是如果不修改源碼的情況下,視頻的部分截取稍

    2023年04月23日
    瀏覽(16)
  • 嘗試著在Stable Diffusion里邊使用SadTalker進(jìn)行數(shù)字人制作

    嘗試著在Stable Diffusion里邊使用SadTalker進(jìn)行數(shù)字人制作

    首先需要標(biāo)明的是,我這里是圖片說話類型,而且是看了知識(shí)星球AI破局俱樂部大航海數(shù)字人手冊進(jìn)行操作的。寫下這篇文章是防止我以后遺忘。 我使用的基礎(chǔ)軟件是Stable Diffusion,SadTalker是作為插件放進(jìn)來的,需要注意的是這對自己的電腦GPU要求比較高,至少需要8G,至少我

    2024年04月09日
    瀏覽(24)
  • 讓圖片說話SadTalker

    SadTalker:使用一張圖片和一段語音來生成口型和頭、面部視頻. 西安交通大學(xué)開源了人工智能SadTalker模型,通過從音頻中學(xué)習(xí)生成3D運(yùn)動(dòng)系數(shù),使用全新的3D面部渲染器來生成頭部運(yùn)動(dòng),可以實(shí)現(xiàn)圖片+音頻就能生成高質(zhì)量的視頻。 論文地址:Learning Realistic 3D Motion Coefficients 整

    2024年02月21日
    瀏覽(18)
  • stable diffusion如何確保每張圖的面部一致?

    stable diffusion如何確保每張圖的面部一致?

    可以使用roop插件,確定好臉部圖片后,使用roop固定,然后生成的所有圖片都使用同一張臉。 這款插件的功能簡單粗暴:一鍵換臉。 如圖所示: 任意上傳一張臉部清晰的圖片,點(diǎn)擊啟用。 在其他提示詞不變的情況下,Stable Diffusion會(huì)跑出一張按照提示詞的要求的圖片,但臉部

    2024年02月16日
    瀏覽(21)
  • AI數(shù)字人:sadtalker讓照片開口說話

    AI數(shù)字人:sadtalker讓照片開口說話

    ????????西安交通大學(xué)也開源了人工智能SadTalker模型,通過從音頻中學(xué)習(xí)生成3D運(yùn)動(dòng)系數(shù),使用全新的3D面部渲染器來生成頭部運(yùn)動(dòng),可以實(shí)現(xiàn)圖片+音頻就能生成高質(zhì)量的視頻。 ??????? 論文地址:Learning Realistic 3D Motion Coefficients ?????? 通過人臉圖像和一段語音音頻

    2024年02月13日
    瀏覽(16)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包