国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

給數(shù)字人生成加上界面,基于ER-NeRF/RAD-NeRF/AD-NeRF,Gradio框架構(gòu)建WEBUI,使用HLS流媒體,實現(xiàn)邊推理邊播放——之一:在WEBUI中實時輸出服務(wù)器控制臺日志

這篇具有很好參考價值的文章主要介紹了給數(shù)字人生成加上界面,基于ER-NeRF/RAD-NeRF/AD-NeRF,Gradio框架構(gòu)建WEBUI,使用HLS流媒體,實現(xiàn)邊推理邊播放——之一:在WEBUI中實時輸出服務(wù)器控制臺日志。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

前言

  • 目前數(shù)字人實現(xiàn)技術(shù)眾多,我這里采用基于ER-NeRF,在這里可以看到其介紹:ICCV 2023 | ER-NeRF: 用于合成高保真Talking Portrait的高效區(qū)域感知神經(jīng)輻射場-https://zhuanlan.zhihu.com/p/644520609
  • ER-NeRF的項目地址:https://github.com/Fictionarry/ER-NeRF
  • ER-NeRF,RAD-NeRF,他們都繼承自AD-NeRF,都有一個基于dearpygui的GUI界面
  • 但是很遺憾,這個GUI很難跑起來,而且本地一般沒有大GPU的機(jī)器,我們需要一個在云GPU服務(wù)器上能跑的webui
  • ER-NeRF訓(xùn)練很簡單,所需素材也很少,訓(xùn)練的步驟不需要GUI
  • 推理時,需要一個推理界面,方便一般用戶使用的同時,使用UI界面能實現(xiàn)一邊推理一邊播放視頻,優(yōu)化用戶體驗
  • 基于此,在調(diào)研一圈之后,計劃使用Gradio來構(gòu)建webui,改造推理代碼,推理生成的幀圖像直接存儲為ts格式視頻,web前端使用hls協(xié)議來加載m3u8文件,流式的播放推理出的結(jié)果

最終效果

  • 運(yùn)行圖
    給數(shù)字人生成加上界面,基于ER-NeRF/RAD-NeRF/AD-NeRF,Gradio框架構(gòu)建WEBUI,使用HLS流媒體,實現(xiàn)邊推理邊播放——之一:在WEBUI中實時輸出服務(wù)器控制臺日志,數(shù)字人,ER-NeRF,數(shù)字人界面運(yùn)行,gradio界面,webui實時輸出日志
  • 推理圖
    給數(shù)字人生成加上界面,基于ER-NeRF/RAD-NeRF/AD-NeRF,Gradio框架構(gòu)建WEBUI,使用HLS流媒體,實現(xiàn)邊推理邊播放——之一:在WEBUI中實時輸出服務(wù)器控制臺日志,數(shù)字人,ER-NeRF,數(shù)字人界面運(yùn)行,gradio界面,webui實時輸出日志

實現(xiàn)步驟

Gradio

很常規(guī)的操作,一個左右分欄布局:

with gr.Blocks() as page:
    with gr.Row():
        with gr.Column():
            model = gr.Dropdown(
                choices=models, value=models[0], label="選擇模型", elem_id="modelSelectDom"
            )
            audType = gr.Dropdown(
                choices=['deepspeech', 'hubert', 'esperanto'], value='deepspeech', label="模型音頻處理方式"
            )
            with gr.Tab('錄音'):
                audio1 = gr.Audio(source="microphone", label='如果不能正常錄音請直接上傳音頻文件!')
            with gr.Tab('上傳錄音'):
                audio2 = gr.File(label='上傳錄音文件', file_types=['audio'])
            btn = gr.Button("提交", variant="primary", elem_id="submitBtn")
        with gr.Column():
            msg = gr.Label(label='運(yùn)行狀態(tài)', elem_id="logShowDiv", value='')
            gr.Label(label='推理視頻', elem_id="resultVideoDiv", value='')

    btn.click(
        action,
        inputs=[
            model, audType, audio1, audio2
        ],
        outputs=[msg],
    )

可以看到,output配置了一個msg的label組件,就是用來顯示服務(wù)器現(xiàn)在運(yùn)行的日志信息的。
那么本項目第一個問題就是:如何實時的顯示服務(wù)器運(yùn)行日志呢?
看代碼:

def log_out(new_log):
    print(new_log)
    return new_log
    
def action(model, audType, audio1, audio2):
    # 存儲音頻文件
    yield log_out('存儲音頻文件...')
    wavFilePath = os.path.join(modelBasePath, model, str(time.time()).replace('.', '') + '.wav')
    if audio1:
        rate, data = audio1
        write(wavFilePath, rate, data.astype(np.int32))
    elif audio2:
        suffix = audio2.name.split('.')[-1]
        shutil.copy2(audio2.name, wavFilePath.replace('.wav', '.' + suffix))
    if not os.path.exists(wavFilePath):
        yield log_out('存儲音頻文件失?。?)
    else:
        yield log_out('存儲音頻文件完成.')

    # 執(zhí)行音頻預(yù)處理
    yield log_out('音頻預(yù)處理開始...')
    if audType == 'deepspeech':
        cmd = f'python data_utils/deepspeech_features/extract_ds_features.py --input {wavFilePath}'
    elif audType == 'hubert':
        cmd = f'python data_utils/hubert.py --wav {wavFilePath}'
    else:
        cmd = f'python data_utils/wav2vec.py --wav {wavFilePath} --save_feats'
    yield log_out(f'命令:{cmd}')
    process = subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
    while True:
        output = process.stdout.readline()
        if output == b'' and process.poll() is not None:
            break
        if output:
            yield log_out(output.strip().decode('utf-8'))
            time.sleep(0.5)
    process.wait()
    yield log_out(f'音頻預(yù)處理完成.')

    # 確認(rèn)音頻預(yù)處理是否完成
    npyPath = '.'.join(wavFilePath.split('.')[:-1]) + '.npy'
    stop = False
    if not os.path.exists(npyPath):
        yield log_out(f'未找到音頻預(yù)處理后的npy文件,程序?qū)⒁顺觯?)
        stop = True
    if stop:
        return

    # 構(gòu)建推理命令
    yield log_out(f'準(zhǔn)備執(zhí)行推理...')
    cmd = f'python main.py {os.path.join(modelBasePath, model)} --workspace trial_{model}_torso -O --torso --test --test_train --aud {npyPath} --smooth_path --fps 25'
    yield log_out(f'推理命令:{cmd}')
    process = subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
    while True:
        output = process.stdout.readline()
        if output == b'' and process.poll() is not None:
            break
        if output:
            yield log_out(output.strip().decode('utf-8'))
            time.sleep(0.5)
    process.wait()

可以看到,直接使用yield關(guān)鍵字,就可以讓服務(wù)器的輸出多次響應(yīng)。
但是這樣操作最終看到的界面效果就是日志隨著一次yield一次變化,歷史的累計日志信息都被直接覆蓋了。
為了讓輸出能夠累計歷史日志信息一起顯示,我們需要將日志記錄下來,這個也很簡單,增加一個history_log即可:

history_log=''
def log_out(new_log):
	global history_log
	history_log += new_log+'<br>'
   print(new_log)
   return history_log 
   .......

現(xiàn)在看到,日志確實累計輸出了,顯示效果卻不夠好看,而且每次輸出一次日志就會頁面組件就會重繪,日志過多也影響服務(wù)器內(nèi)存。

有沒有辦法做成shell命令窗那種類似效果呢,日志輸出時,滾動條在底部,永遠(yuǎn)保持當(dāng)前輸出的日志能夠可視?
一番艱苦的探尋,終于找到了解決辦法。
核心思路是:yield持續(xù)輸出,頁面中用一個input元素接收,然后重寫input的setvalue的方法,在方法中提取到本次輸出的日志值,然后將值添加到一個div尾部,使用js讓div的滾動條保持在底部。
核心代碼:

_script = '''
   async()=>{
      .......
       //監(jiān)控日志輸出及顯示
               let output = document.querySelector("#logDivText .border-none");
               if(!output){
                   return false;
               }
               let show = document.querySelector('#logShowDiv .container')
               show.style.height='200px'
               show.style.overflowY='scroll'
               show.innerHTML=""
               Object.defineProperty(output, "value", {
                   set:  function (log) {
                       if(log && log!=''){
                           	show.innerHTML = show.innerHTML+'<br>'+log
                               show.scrollTop=show.scrollHeight
                           }
                       }      
                       return this.textContent = log;
                   }
               });
               ......
   }
'''
#在page頁面加載的時候,將自定義的js加載進(jìn)去
page.load(_js=_script)

這樣就實現(xiàn)了監(jiān)控服務(wù)器日志輸出的效果了,效果如下:
給數(shù)字人生成加上界面,基于ER-NeRF/RAD-NeRF/AD-NeRF,Gradio框架構(gòu)建WEBUI,使用HLS流媒體,實現(xiàn)邊推理邊播放——之一:在WEBUI中實時輸出服務(wù)器控制臺日志,數(shù)字人,ER-NeRF,數(shù)字人界面運(yùn)行,gradio界面,webui實時輸出日志
代碼已放在gitee,有不解的可私信。
下一篇講解如何將內(nèi)存中的序列圖通過pipeline寫成hls協(xié)議的ts文件保存。文章來源地址http://www.zghlxwxcb.cn/news/detail-751494.html

到了這里,關(guān)于給數(shù)字人生成加上界面,基于ER-NeRF/RAD-NeRF/AD-NeRF,Gradio框架構(gòu)建WEBUI,使用HLS流媒體,實現(xiàn)邊推理邊播放——之一:在WEBUI中實時輸出服務(wù)器控制臺日志的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • java代碼實現(xiàn)自動生成數(shù)據(jù)庫表er圖

    最近有同事看到字節(jié)跳動產(chǎn)品設(shè)計文檔里有數(shù)據(jù)庫表er圖。就想問問又沒有現(xiàn)成的工具也給直接生成一個er圖,經(jīng)查找驗證發(fā)現(xiàn)并沒有。因為現(xiàn)在表關(guān)系都是用的邏輯外鍵而非物理外鍵約束的,所以像navicat等工具就算生成了也沒有描述關(guān)系的連接線。那么為了滿足需求,這邊

    2024年02月19日
    瀏覽(28)
  • 利用代碼生成工具快速生成基于SqlSugar框架的Winform界面項目

    利用代碼生成工具快速生成基于SqlSugar框架的Winform界面項目

    我們接觸一個新事物的時候,如果一個事物能夠給我們帶來非常直觀的感官認(rèn)識,那么我們就很容易接受,反之可能需要很長時間的潛移默化的了解認(rèn)識才能接受。萬物化繁為簡,透過本質(zhì)看表象,往往也是一個認(rèn)知迭代深入的過程。在我介紹很多篇隨筆《SqlSugar開發(fā)框架》

    2024年02月11日
    瀏覽(19)
  • 一個在線ER模型設(shè)計工具:支持?jǐn)?shù)據(jù)庫設(shè)計、生成、反向工程、優(yōu)化和文檔生成等操作

    一個在線ER模型設(shè)計工具:支持?jǐn)?shù)據(jù)庫設(shè)計、生成、反向工程、優(yōu)化和文檔生成等操作

    ER模型,即實體關(guān)系模型,是數(shù)據(jù)庫建模的一種重要方法。它可以幫助開發(fā)人員更好地理解數(shù)據(jù)庫結(jié)構(gòu),并確定數(shù)據(jù)庫的概念模型。在本文中,我們將詳細(xì)介紹ER模型設(shè)計的基本概念和過程。 首先,我們需要了解ER模型中的兩個基本概念:實體和關(guān)系。實體是數(shù)據(jù)庫中存儲的對

    2024年02月04日
    瀏覽(23)
  • 【3D生成與重建】SSDNeRF:單階段Diffusion NeRF的三維生成和重建

    【3D生成與重建】SSDNeRF:單階段Diffusion NeRF的三維生成和重建

    題目 :Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and Reconstruction 論文 :https://arxiv.org/pdf/2304.06714.pdf 任務(wù) :無條件3D生成(如從噪音中,生成不同的車等)、單視圖3D生成 機(jī)構(gòu) :Hansheng Chen,1,* Jiatao Gu,2 Anpei Chen, 同濟(jì)、蘋果、加利福尼亞大學(xué) 代碼 :https://github.com/Lakon

    2024年02月02日
    瀏覽(18)
  • AI數(shù)字人:基于VITS模型的中文語音生成訓(xùn)練

    AI數(shù)字人:基于VITS模型的中文語音生成訓(xùn)練

    ????????VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)是一種結(jié)合變分推理(variational inference)、標(biāo)準(zhǔn)化流(normalizing flows)和對抗訓(xùn)練的高表現(xiàn)力語音合成模型。 ??????? VITS模型是韓國科學(xué)院在2021年6月提出的,VITS通過隱變量而非頻譜串聯(lián)起來語

    2024年02月11日
    瀏覽(21)
  • IDEA生成ER圖、UML類圖、時序圖、流程圖等的插件推薦或獨立工具推薦

    以下是幾個常用的IDEA插件和獨立工具,可以用于生成ER圖、UML類圖、時序圖、流程圖等: Visual Paradigm (獨立工具) Visual Paradigm是一個強(qiáng)大的建模工具,可以生成UML類圖、時序圖、流程圖等。它支持多種語言和框架,包括Java、Spring等??梢詫⑸傻膱D形導(dǎo)出為多種格式,例如圖

    2024年02月04日
    瀏覽(36)
  • 開源CA搭建-基于openssl實現(xiàn)數(shù)字證書的生成與分發(fā)

    開源CA搭建-基于openssl實現(xiàn)數(shù)字證書的生成與分發(fā)

    目錄 一、前言 二、openssl介紹 三、openssl的常用用法 (一)單向加密 (二)生成隨機(jī)數(shù) (三)生成公鑰,私鑰 1.生成私鑰 2.提取公鑰 四、搭建CA (一)創(chuàng)建根CA私鑰: (二)生成自簽名證書 (三)創(chuàng)建數(shù)據(jù)庫以及新頒發(fā)證書數(shù)字 (四)設(shè)置證書的起始編號 (五)創(chuàng)建文件

    2024年02月06日
    瀏覽(25)
  • 從0開始快速使用StarUml畫ER圖,生成SQL建表代碼,附解決DDL常見報錯方法

    從0開始快速使用StarUml畫ER圖,生成SQL建表代碼,附解決DDL常見報錯方法

    遇到稍微復(fù)雜一些的業(yè)務(wù),先整理需求在下手會使得開發(fā)過程中頭發(fā)少掉一些,尤其是團(tuán)隊合作的項目效果尤為明顯,在整理完業(yè)務(wù)需求后, 從數(shù)據(jù)庫開始下手能讓后端的頭發(fā)掉少一些. 找個好的軟件能在整理數(shù)據(jù)庫的時候再少掉點頭發(fā), 并且減輕簡單重復(fù)的打字工作. 如果圖畫好

    2023年04月16日
    瀏覽(24)
  • 【三維生成】Make-it-3D:diffusion+NeRF從單張圖像生成高保真三維物體(上交&微軟)

    【三維生成】Make-it-3D:diffusion+NeRF從單張圖像生成高保真三維物體(上交&微軟)

    題目 : Make-It-3D: High-Fidelity 3D Creation from A Single Image with Diffusion Prior Paper : https://arxiv.org/pdf/2303.14184.pdf Code : https://make-it-3d.github.io/ 在本文中,研究者的目標(biāo)是: 從一個真實或人工生成的單張圖像中創(chuàng)建高保真度的3D內(nèi)容 。這將為藝術(shù)表達(dá)和創(chuàng)意開辟新的途徑,例如為像Stable

    2024年02月13日
    瀏覽(23)
  • 循序漸進(jìn)介紹基于CommunityToolkit.Mvvm 和HandyControl的WPF應(yīng)用端開發(fā)(12) -- 使用代碼生成工具Database2Sharp生成WPF界面代碼

    循序漸進(jìn)介紹基于CommunityToolkit.Mvvm 和HandyControl的WPF應(yīng)用端開發(fā)(12) -- 使用代碼生成工具Database2Sharp生成WPF界面代碼

    在經(jīng)過基于SqlSugar框架的WPF應(yīng)用端系統(tǒng)界面及模塊的不斷優(yōu)化和重構(gòu)后,視圖界面及視圖模型等代碼已趨穩(wěn)定,因此完成前面的介紹后,現(xiàn)在開始統(tǒng)一基于代碼生成工具Database2Sharp進(jìn)行WPF應(yīng)用端界面代碼的快速生成了,代碼除了和WPF應(yīng)用端的基類保持一致處理外,并添加一些注

    2024年02月08日
    瀏覽(22)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包