国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成

2年前作者：shadowcz007分類：Toy博客閱讀(26)違法舉報

這篇具有很好參考價值的文章主要介紹了實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

社區(qū)分享了不少文本生成圖像的AIGC（AI生成內(nèi)容）應用的突破，圖像類的生成已經(jīng)是“紅?！绷?。

我們需要尋找“藍?！保诔霈F(xiàn)了其他內(nèi)容的突破嗎？

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

Mixlab

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

社區(qū)五月份介紹了?Pollinations.ai?，平臺集成了文本、圖像、音頻、視頻等多種模態(tài)的模型，近期平臺功能也進行了迭代升級，但在模型內(nèi)容質(zhì)量上還是參差不齊。

最近熱度最高的開源模型是? Stable Diffusion，其極為優(yōu)秀的開源生態(tài)也催生了許多模型的整合創(chuàng)新。Stable Diffusion?+ Mubert 就實現(xiàn)了高質(zhì)量的圖像到音樂的生成。尤其是圖片轉(zhuǎn)音樂，不是那種抽象電子風，而是真正具備了應用級配樂的水準?。ㄕ埧聪挛模?br>

speech-to-image

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

img-to-music?

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

speech-to-image?demo 使用預先訓練的 OpenAI whisper-small 與 Stable Diffusion 從音頻樣本生成圖像。img-to-music?則是發(fā)送圖像到剪輯詢問器?CLIP Interrogator?生成文本提示，然后通過 Mubert 識別文本輸出音樂，實現(xiàn)輸入圖像到生成音樂的過程。

帶我們看看測試效果？

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

Mixlab

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

speech-to-image?，我測試了三類聲音到圖像的生成

#?人聲哼唱（小編的瞎哼）

#?流行音樂?（Golden Hour 前奏+一丟丟人聲）

#?環(huán)境自然音（小編嘈雜的居住環(huán)境）

#01?人聲哼唱

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

#02?流行音樂

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

#03?環(huán)境音

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python
......

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

出乎意料的驚喜！對于我們?nèi)祟?，與為文字配插畫相比，為音樂配

圖似乎是件更為困難的事。音樂的抽象特征與AI生成的特質(zhì)意外的契合。

AI給第一個哼唱生成了一幅略顯俏皮的圣誕老人形象，似乎有點在嘲諷我哼唱得五音不全hh。第二個流行歌曲，AI應該是識別出了歌曲的關鍵詞 “Love” ，雖說沒太拼對，但有種為愛情沖昏了頭腦的感覺。第三個環(huán)境音嘈雜而沒有感情色彩，AI也生成了一幅比較契合的黑白色調(diào)的拼貼畫。

反過來，圖像生成音樂是啥效果？

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

Mixlab

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

那可更驚喜了！我找的音頻素材可沒AI生成的驚艷～同樣也測試了三類圖片生成的音樂-#?音頻生成的圖像

#?Stable?Diffusion?文本生成的圖像

# 藝術畫作

#01?音頻生成的圖像

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

#02?文本生成的圖像

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

#03?名畫千里江山圖局部

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

......

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

真是一個比一個驚喜！第一張圖是測試 Golden Hour 音頻轉(zhuǎn)圖像生成的圖，反過來生成了有點迷幻電子風的音樂。第二張是用SD生成的概念汽車場景，AI較為精準地 “理解了” 畫面內(nèi)容，生成了科幻槍戰(zhàn)的配樂。第三個則是震驚到我了，AI盡然為我挑選的千里江山圖生成了有樂章結構的中國風音樂！

Stable Diffusion 的開源生態(tài)已經(jīng)不局限于圖像了。在文本-音樂生成模型 Mubert 實現(xiàn)圖像-音樂的工作流中，文本是在哪一步生成的呢？

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

Mixlab

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

img-to-music?使用了 CLIP Interrogator 來生成圖像的文字，再通過 Mubert 實現(xiàn)文本轉(zhuǎn)音樂。

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

圖像轉(zhuǎn)文本模型demo

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

文本轉(zhuǎn)音頻demo

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

img-to-music?作者 @fffiloni?也展示了他產(chǎn)出的一些輸出探索，非常奇妙～

圖像轉(zhuǎn)音頻 demo

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

以?img-to-music 為線索，我找出了 Stable Diffusion?較完善的擴展應用模型集成，大家感興趣也可以自主嘗試基于SD模型的應用擴展創(chuàng)新哦～

speech-to-image demo：huggingface.co/spaces/fffiloni/speech-to-image

Image to Music demo：huggingface.co/spaces/fffiloni/img-to-music

CLIP Interrogator：huggingface.co/spaces/pharma/CLIP-InterrogatorMubert demo：

huggingface.co/spaces/Mubert/Text-to-Music

Mubert 項目地址：github.com/MubertAI/Mubert-Text-to-Music

SD 擴展模型應用集成：
github.com/huggingface/diffusers/tree/main/examples/community#speech-to-image

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

更多有關AIGC最新突破的知識信息，歡迎查閱社群知識庫哦～

【雙11優(yōu)惠】元宇宙知識庫只需139元

下一期我們再卷卷視頻？來點動態(tài)內(nèi)容，AIGC 啥都玩一遍hhh

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

Mixlab

實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

opus

歡迎留言討論，參與?AIGC??話題的共創(chuàng)共建～

添加請備注AIGC?& 元宇宙

??文章來源地址http://www.zghlxwxcb.cn/news/detail-521233.html

到了這里，關于實測AIGC工作流，Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

云原生離線工作流編排利器 -- 分布式工作流 Argo 集群
作者：莊宇在現(xiàn)代的軟件開發(fā)和數(shù)據(jù)處理領域，批處理作業(yè)（Batch）扮演著重要的角色。它們通常用于數(shù)據(jù)處理，仿真計算，科學計算等領域，往往需要大規(guī)模的計算資源。隨著云計算的興起，阿里云批量計算和 AWS Batch 等云服務提供了管理和運行這些批處理作業(yè)的平臺。隨
2024年01月24日
瀏覽(28)
Camunda 7工作流引擎 API 以及與Springboot集成實現(xiàn)工作流配置全紀錄
項目中需要用到工作流引擎來設計部分業(yè)務流程，框架選型最終選擇了 Camunda7，關于 Camunda以及 Activity 等其他工作流引擎的介紹及對比不再介紹，這里只介紹與現(xiàn)有Springboot項目的集成以及具體使用及配置流程（PROCESS）: 通過工具建模最終生成的BPMN文件，里面有整個流程的定
2024年02月10日
瀏覽(47)
Git 工作流設計
前言常用的工作流有四種集中式工作流功能分支流 git flow 工作流 forking 工作流集中式工作流集中式工作流，多個功能(feat)，bug修復(fix) 在一個分支上開發(fā)，極容易出現(xiàn)代碼從沖突功能分支流新的功能或者bug fork出一個新的分支，在該分支上開發(fā) 功能在分支開發(fā)完后再合
2024年02月05日
瀏覽(26)
Git工作流
main：生產(chǎn)環(huán)境，也就是你們在網(wǎng)上可以下載到的版本，是經(jīng)過了很多輪測試得到的穩(wěn)定版本。 release：開發(fā)內(nèi)部發(fā)版，也就是測試環(huán)境。 dev：所有的feature都要從dev上checkout。 feature：每個需求新創(chuàng)建的分支。下面介紹一下一個新需求過來的git操作流程： 1.從dev分支上checkou
2024年02月10日
瀏覽(41)
云計算工作流調(diào)度
閱讀筆記首先，我們提出了一個更實用的混合云服務流程成本驅(qū)動調(diào)度模型，該模型在不降低VM部署彈性的情況下更精確地定義資源約束，并考慮了基于間隔的綜合收費，包括計費周期和持續(xù)使用折扣。其次，提出了一種改進的基于FWA（煙花算法）的方法來解決這一問題。在
2024年02月02日
瀏覽(49)
Activity工作流引擎
目錄一、了解工作流 1、什么是工作流 2、工作流引擎 3、常見工作流引擎 4、Activiti7概述 4.1、Activiti介紹 4.2、建模語言BPMN 4.3、Activiti使用流程二、Activiti7 1、Activiti使用 1.1、數(shù)據(jù)庫支持 1.2、Activiti環(huán)境 1.3、Activiti常用Service服務接口 1.4、流程設計工具 2、Activiti流程操作 2.1、
2024年02月13日
瀏覽(22)
工作流引擎Flowable
官方手冊一、依賴二、demo 三、日志文件在resources中添加日志文件log4j.properties Flowable流程圖 Eclipse Designer, 一款Eclipse插件, 用于圖形化建模, 測試與部署B(yǎng)PMN2.0流程 FlowableUI Flowable BPMN visualizer, 一款idea插件從官網(wǎng)下載flowable-6.7.2.zip解壓后, 可以看到如下兩個文件將這兩個文件
2024年02月09日
瀏覽(28)
Docker工作流
開發(fā)應用編寫Dockerfile 構建Docker鏡像運行Docker容器測試應用發(fā)布鏡像到Hub 迭代更新鏡像首先你需要創(chuàng)建一個應用，這個應用可以是后端應用或者前端應用，任何語言都可以。比如：我使用IDEA 創(chuàng)建一個Java后端應用，基于Maven構建，工程結構如下：基于自己的工程來編寫
2024年04月29日
瀏覽(23)
Git工作流（隨筆）
目錄前言一、工作流概述 1、概念 2、分類二、集中式工作流 1、概述 2、介紹 3、操作過程三、功能分支工作流 1、概述 2、介紹 3、操作過程 1）創(chuàng)建遠程分支 2）刪除遠程分支四、GitFlow工作流 1、概述 2、介紹 ? 3、操作過程五、Forking工作流 1、概述 2、介紹 3、操作過程
2024年02月09日
瀏覽(22)
GitFlow工作流
基于 Git 這一版本控制系統(tǒng)，通過定義不同的分支，探索合適的工作流程來完成開發(fā)、測試、修改等方面的需求。例如：在開發(fā)階段，創(chuàng)建 feature 分支，完成需求后，將此分支合并到 develop 分支上；在發(fā)布階段，創(chuàng)建 release 分支，完成階段開發(fā)任務后，將分支合并到 develop 和
2024年02月22日
瀏覽(23)