国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<p id="fokhs"></p>

給數(shù)字人生成加上界面，基于ER-NeRF/RAD-NeRF/AD-NeRF，Gradio框架構(gòu)建WEBUI，使用HLS流媒體，實現(xiàn)邊推理邊播放——之一：在WEBUI中實時輸出服務(wù)器控制臺日志

2年前作者：Ajian分類：Toy博客閱讀(28)違法舉報

這篇具有很好參考價值的文章主要介紹了給數(shù)字人生成加上界面，基于ER-NeRF/RAD-NeRF/AD-NeRF，Gradio框架構(gòu)建WEBUI，使用HLS流媒體，實現(xiàn)邊推理邊播放——之一：在WEBUI中實時輸出服務(wù)器控制臺日志。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

前言

目前數(shù)字人實現(xiàn)技術(shù)眾多，我這里采用基于ER-NeRF，在這里可以看到其介紹：ICCV 2023 | ER-NeRF: 用于合成高保真Talking Portrait的高效區(qū)域感知神經(jīng)輻射場-https://zhuanlan.zhihu.com/p/644520609
ER-NeRF的項目地址：https://github.com/Fictionarry/ER-NeRF
ER-NeRF,RAD-NeRF,他們都繼承自AD-NeRF，都有一個基于dearpygui的GUI界面
但是很遺憾，這個GUI很難跑起來，而且本地一般沒有大GPU的機(jī)器，我們需要一個在云GPU服務(wù)器上能跑的webui
ER-NeRF訓(xùn)練很簡單，所需素材也很少，訓(xùn)練的步驟不需要GUI
推理時，需要一個推理界面，方便一般用戶使用的同時，使用UI界面能實現(xiàn)一邊推理一邊播放視頻，優(yōu)化用戶體驗
基于此，在調(diào)研一圈之后，計劃使用Gradio來構(gòu)建webui，改造推理代碼，推理生成的幀圖像直接存儲為ts格式視頻，web前端使用hls協(xié)議來加載m3u8文件，流式的播放推理出的結(jié)果

最終效果

運(yùn)行圖
推理圖

實現(xiàn)步驟

Gradio

很常規(guī)的操作，一個左右分欄布局：

with gr.Blocks() as page:
    with gr.Row():
        with gr.Column():
            model = gr.Dropdown(
                choices=models, value=models[0], label="選擇模型", elem_id="modelSelectDom"
            )
            audType = gr.Dropdown(
                choices=['deepspeech', 'hubert', 'esperanto'], value='deepspeech', label="模型音頻處理方式"
            )
            with gr.Tab('錄音'):
                audio1 = gr.Audio(source="microphone", label='如果不能正常錄音請直接上傳音頻文件!')
            with gr.Tab('上傳錄音'):
                audio2 = gr.File(label='上傳錄音文件', file_types=['audio'])
            btn = gr.Button("提交", variant="primary", elem_id="submitBtn")
        with gr.Column():
            msg = gr.Label(label='運(yùn)行狀態(tài)', elem_id="logShowDiv", value='')
            gr.Label(label='推理視頻', elem_id="resultVideoDiv", value='')

    btn.click(
        action,
        inputs=[
            model, audType, audio1, audio2
        ],
        outputs=[msg],
    )

可以看到，output配置了一個msg的label組件，就是用來顯示服務(wù)器現(xiàn)在運(yùn)行的日志信息的。
那么本項目第一個問題就是：如何實時的顯示服務(wù)器運(yùn)行日志呢？
看代碼：

def log_out(new_log):
    print(new_log)
    return new_log
    
def action(model, audType, audio1, audio2):
    # 存儲音頻文件
    yield log_out('存儲音頻文件...')
    wavFilePath = os.path.join(modelBasePath, model, str(time.time()).replace('.', '') + '.wav')
    if audio1:
        rate, data = audio1
        write(wavFilePath, rate, data.astype(np.int32))
    elif audio2:
        suffix = audio2.name.split('.')[-1]
        shutil.copy2(audio2.name, wavFilePath.replace('.wav', '.' + suffix))
    if not os.path.exists(wavFilePath):
        yield log_out('存儲音頻文件失?。?)
    else:
        yield log_out('存儲音頻文件完成.')

    # 執(zhí)行音頻預(yù)處理
    yield log_out('音頻預(yù)處理開始...')
    if audType == 'deepspeech':
        cmd = f'python data_utils/deepspeech_features/extract_ds_features.py --input {wavFilePath}'
    elif audType == 'hubert':
        cmd = f'python data_utils/hubert.py --wav {wavFilePath}'
    else:
        cmd = f'python data_utils/wav2vec.py --wav {wavFilePath} --save_feats'
    yield log_out(f'命令：{cmd}')
    process = subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
    while True:
        output = process.stdout.readline()
        if output == b'' and process.poll() is not None:
            break
        if output:
            yield log_out(output.strip().decode('utf-8'))
            time.sleep(0.5)
    process.wait()
    yield log_out(f'音頻預(yù)處理完成.')

    # 確認(rèn)音頻預(yù)處理是否完成
    npyPath = '.'.join(wavFilePath.split('.')[:-1]) + '.npy'
    stop = False
    if not os.path.exists(npyPath):
        yield log_out(f'未找到音頻預(yù)處理后的npy文件，程序?qū)⒁顺觯?)
        stop = True
    if stop:
        return

    # 構(gòu)建推理命令
    yield log_out(f'準(zhǔn)備執(zhí)行推理...')
    cmd = f'python main.py {os.path.join(modelBasePath, model)} --workspace trial_{model}_torso -O --torso --test --test_train --aud {npyPath} --smooth_path --fps 25'
    yield log_out(f'推理命令：{cmd}')
    process = subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
    while True:
        output = process.stdout.readline()
        if output == b'' and process.poll() is not None:
            break
        if output:
            yield log_out(output.strip().decode('utf-8'))
            time.sleep(0.5)
    process.wait()

可以看到，直接使用yield關(guān)鍵字，就可以讓服務(wù)器的輸出多次響應(yīng)。
但是這樣操作最終看到的界面效果就是日志隨著一次yield一次變化，歷史的累計日志信息都被直接覆蓋了。
為了讓輸出能夠累計歷史日志信息一起顯示，我們需要將日志記錄下來，這個也很簡單，增加一個history_log即可：

history_log=''
def log_out(new_log):
	global history_log
	history_log += new_log+'<br>'
   print(new_log)
   return history_log 
   .......

現(xiàn)在看到，日志確實累計輸出了，顯示效果卻不夠好看，而且每次輸出一次日志就會頁面組件就會重繪，日志過多也影響服務(wù)器內(nèi)存。

有沒有辦法做成shell命令窗那種類似效果呢，日志輸出時，滾動條在底部，永遠(yuǎn)保持當(dāng)前輸出的日志能夠可視？
一番艱苦的探尋，終于找到了解決辦法。
核心思路是：yield持續(xù)輸出，頁面中用一個input元素接收，然后重寫input的setvalue的方法，在方法中提取到本次輸出的日志值，然后將值添加到一個div尾部，使用js讓div的滾動條保持在底部。
核心代碼：

_script = '''
   async()=>{
      .......
       //監(jiān)控日志輸出及顯示
               let output = document.querySelector("#logDivText .border-none");
               if(!output){
                   return false;
               }
               let show = document.querySelector('#logShowDiv .container')
               show.style.height='200px'
               show.style.overflowY='scroll'
               show.innerHTML=""
               Object.defineProperty(output, "value", {
                   set:  function (log) {
                       if(log && log!=''){
                           	show.innerHTML = show.innerHTML+'<br>'+log
                               show.scrollTop=show.scrollHeight
                           }
                       }      
                       return this.textContent = log;
                   }
               });
               ......
   }
'''
#在page頁面加載的時候，將自定義的js加載進(jìn)去
page.load(_js=_script)

這樣就實現(xiàn)了監(jiān)控服務(wù)器日志輸出的效果了，效果如下：
給數(shù)字人生成加上界面，基于ER-NeRF/RAD-NeRF/AD-NeRF，Gradio框架構(gòu)建WEBUI，使用HLS流媒體，實現(xiàn)邊推理邊播放——之一：在WEBUI中實時輸出服務(wù)器控制臺日志,數(shù)字人,ER-NeRF,數(shù)字人界面運(yùn)行,gradio界面,webui實時輸出日志
代碼已放在gitee，有不解的可私信。
下一篇講解如何將內(nèi)存中的序列圖通過pipeline寫成hls協(xié)議的ts文件保存。文章來源地址http://www.zghlxwxcb.cn/news/detail-751494.html

到了這里，關(guān)于給數(shù)字人生成加上界面，基于ER-NeRF/RAD-NeRF/AD-NeRF，Gradio框架構(gòu)建WEBUI，使用HLS流媒體，實現(xiàn)邊推理邊播放——之一：在WEBUI中實時輸出服務(wù)器控制臺日志的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進(jìn)行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

java代碼實現(xiàn)自動生成數(shù)據(jù)庫表er圖
最近有同事看到字節(jié)跳動產(chǎn)品設(shè)計文檔里有數(shù)據(jù)庫表er圖。就想問問又沒有現(xiàn)成的工具也給直接生成一個er圖，經(jīng)查找驗證發(fā)現(xiàn)并沒有。因為現(xiàn)在表關(guān)系都是用的邏輯外鍵而非物理外鍵約束的，所以像navicat等工具就算生成了也沒有描述關(guān)系的連接線。那么為了滿足需求，這邊
2024年02月19日
瀏覽(28)
利用代碼生成工具快速生成基于SqlSugar框架的Winform界面項目
我們接觸一個新事物的時候，如果一個事物能夠給我們帶來非常直觀的感官認(rèn)識，那么我們就很容易接受，反之可能需要很長時間的潛移默化的了解認(rèn)識才能接受。萬物化繁為簡，透過本質(zhì)看表象，往往也是一個認(rèn)知迭代深入的過程。在我介紹很多篇隨筆《SqlSugar開發(fā)框架》
2024年02月11日
瀏覽(19)
一個在線ER模型設(shè)計工具:支持?jǐn)?shù)據(jù)庫設(shè)計、生成、反向工程、優(yōu)化和文檔生成等操作
ER模型，即實體關(guān)系模型，是數(shù)據(jù)庫建模的一種重要方法。它可以幫助開發(fā)人員更好地理解數(shù)據(jù)庫結(jié)構(gòu)，并確定數(shù)據(jù)庫的概念模型。在本文中，我們將詳細(xì)介紹ER模型設(shè)計的基本概念和過程。首先，我們需要了解ER模型中的兩個基本概念：實體和關(guān)系。實體是數(shù)據(jù)庫中存儲的對
2024年02月04日
瀏覽(23)
【3D生成與重建】SSDNeRF：單階段Diffusion NeRF的三維生成和重建
題目：Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and Reconstruction 論文：https://arxiv.org/pdf/2304.06714.pdf 任務(wù) ：無條件3D生成（如從噪音中，生成不同的車等）、單視圖3D生成機(jī)構(gòu) ：Hansheng Chen,1,* Jiatao Gu,2 Anpei Chen, 同濟(jì)、蘋果、加利福尼亞大學(xué) 代碼：https://github.com/Lakon
2024年02月02日
瀏覽(18)
AI數(shù)字人：基于VITS模型的中文語音生成訓(xùn)練
????????VITS（Variational Inference with adversarial learning for end-to-end Text-to-Speech）是一種結(jié)合變分推理（variational inference）、標(biāo)準(zhǔn)化流（normalizing flows）和對抗訓(xùn)練的高表現(xiàn)力語音合成模型。 ??????? VITS模型是韓國科學(xué)院在2021年6月提出的，VITS通過隱變量而非頻譜串聯(lián)起來語
2024年02月11日
瀏覽(21)
IDEA生成ER圖、UML類圖、時序圖、流程圖等的插件推薦或獨立工具推薦
以下是幾個常用的IDEA插件和獨立工具，可以用于生成ER圖、UML類圖、時序圖、流程圖等： Visual Paradigm (獨立工具) Visual Paradigm是一個強(qiáng)大的建模工具，可以生成UML類圖、時序圖、流程圖等。它支持多種語言和框架，包括Java、Spring等?？梢詫⑸傻膱D形導(dǎo)出為多種格式，例如圖
2024年02月04日
瀏覽(36)
開源CA搭建-基于openssl實現(xiàn)數(shù)字證書的生成與分發(fā)
目錄一、前言二、openssl介紹三、openssl的常用用法（一）單向加密（二）生成隨機(jī)數(shù) （三）生成公鑰，私鑰 1.生成私鑰 2.提取公鑰四、搭建CA （一）創(chuàng)建根CA私鑰：（二）生成自簽名證書（三）創(chuàng)建數(shù)據(jù)庫以及新頒發(fā)證書數(shù)字（四）設(shè)置證書的起始編號（五）創(chuàng)建文件
2024年02月06日
瀏覽(25)
從0開始快速使用StarUml畫ER圖,生成SQL建表代碼,附解決DDL常見報錯方法
遇到稍微復(fù)雜一些的業(yè)務(wù),先整理需求在下手會使得開發(fā)過程中頭發(fā)少掉一些,尤其是團(tuán)隊合作的項目效果尤為明顯,在整理完業(yè)務(wù)需求后, 從數(shù)據(jù)庫開始下手能讓后端的頭發(fā)掉少一些. 找個好的軟件能在整理數(shù)據(jù)庫的時候再少掉點頭發(fā), 并且減輕簡單重復(fù)的打字工作. 如果圖畫好
2023年04月16日
瀏覽(24)
【三維生成】Make-it-3D：diffusion+NeRF從單張圖像生成高保真三維物體（上交&微軟）
題目 : Make-It-3D: High-Fidelity 3D Creation from A Single Image with Diffusion Prior Paper : https://arxiv.org/pdf/2303.14184.pdf Code : https://make-it-3d.github.io/ 在本文中，研究者的目標(biāo)是：從一個真實或人工生成的單張圖像中創(chuàng)建高保真度的3D內(nèi)容。這將為藝術(shù)表達(dá)和創(chuàng)意開辟新的途徑，例如為像Stable
2024年02月13日
瀏覽(23)
循序漸進(jìn)介紹基于CommunityToolkit.Mvvm 和HandyControl的WPF應(yīng)用端開發(fā)(12) -- 使用代碼生成工具Database2Sharp生成WPF界面代碼
在經(jīng)過基于SqlSugar框架的WPF應(yīng)用端系統(tǒng)界面及模塊的不斷優(yōu)化和重構(gòu)后，視圖界面及視圖模型等代碼已趨穩(wěn)定，因此完成前面的介紹后，現(xiàn)在開始統(tǒng)一基于代碼生成工具Database2Sharp進(jìn)行WPF應(yīng)用端界面代碼的快速生成了，代碼除了和WPF應(yīng)用端的基類保持一致處理外，并添加一些注
2024年02月08日
瀏覽(22)

<ul id="vkjw6"></ul>

<form id="vkjw6"><em id="vkjw6"></em></form>

<ul id="vkjw6"></ul>

<p id="vkjw6"><blockquote id="vkjw6"><tfoot id="vkjw6"></tfoot></blockquote></p>