国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成

這篇具有很好參考價值的文章主要介紹了實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

社區(qū)分享了不少文本生成圖像的AIGC(AI生成內(nèi)容)應用的突破,圖像類的生成已經(jīng)是“紅?!绷?。

我們需要尋找“藍?!保诔霈F(xiàn)了其他內(nèi)容的突破嗎?

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

Mixlab

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

社區(qū)五月份介紹了?Pollinations.ai?,平臺集成了文本、圖像、音頻、視頻等多種模態(tài)的模型,近期平臺功能也進行了迭代升級,但在模型內(nèi)容質(zhì)量上還是參差不齊。

最近熱度最高的開源模型是? Stable Diffusion,其極為優(yōu)秀的開源生態(tài)也催生了許多模型的整合創(chuàng)新。Stable Diffusion?+ Mubert 就實現(xiàn)了高質(zhì)量的圖像到音樂的生成。尤其是圖片轉(zhuǎn)音樂,不是那種抽象電子風,而是真正具備了應用級配樂的水準?。ㄕ埧聪挛模?br>

speech-to-image

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

img-to-music?

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

speech-to-image?demo 使用預先訓練的 OpenAI whisper-small 與 Stable Diffusion 從音頻樣本生成圖像。img-to-music?則是發(fā)送圖像到剪輯詢問器?CLIP Interrogator?生成文本提示,然后通過 Mubert 識別文本輸出音樂,實現(xiàn)輸入圖像到生成音樂的過程。

帶我們看看測試效果?

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

Mixlab

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

speech-to-image?,我測試了三類聲音到圖像的生成

#?人聲哼唱(小編的瞎哼)

#?流行音樂?(Golden Hour 前奏+一丟丟人聲)

#?環(huán)境自然音(小編嘈雜的居住環(huán)境)

#01?人聲哼唱

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

#02?流行音樂

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

#03?環(huán)境音

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python
......

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

出乎意料的驚喜!對于我們?nèi)祟?,與為文字配插畫相比,為音樂配

圖似乎是件更為困難的事。音樂的抽象特征與AI生成的特質(zhì)意外的契合。

AI給第一個哼唱生成了一幅略顯俏皮的圣誕老人形象,似乎有點在嘲諷我哼唱得五音不全hh。第二個流行歌曲,AI應該是識別出了歌曲的關鍵詞 “Love” ,雖說沒太拼對,但有種為愛情沖昏了頭腦的感覺。第三個環(huán)境音嘈雜而沒有感情色彩,AI也生成了一幅比較契合的黑白色調(diào)的拼貼畫。

反過來,圖像生成音樂是啥效果?

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

Mixlab

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

那可更驚喜了!我找的音頻素材可沒AI生成的驚艷~同樣也測試了三類圖片生成的音樂-#?音頻生成的圖像

#?Stable?Diffusion?文本生成的圖像

# 藝術畫作


#01
?音頻生成的圖像

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python


#02?文本生成的圖像

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python


#03
?名畫千里江山圖局部

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

......

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

真是一個比一個驚喜!第一張圖是測試 Golden Hour 音頻轉(zhuǎn)圖像生成的圖,反過來生成了有點迷幻電子風的音樂。第二張是用SD生成的概念汽車場景,AI較為精準地 “理解了” 畫面內(nèi)容,生成了科幻槍戰(zhàn)的配樂。第三個則是震驚到我了,AI盡然為我挑選的千里江山圖生成了有樂章結構的中國風音樂!

Stable Diffusion 的開源生態(tài)已經(jīng)不局限于圖像了。在文本-音樂生成模型 Mubert 實現(xiàn)圖像-音樂的工作流中,文本是在哪一步生成的呢?

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

Mixlab

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

img-to-music?使用了 CLIP Interrogator 來生成圖像的文字,再通過 Mubert 實現(xiàn)文本轉(zhuǎn)音樂。

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

圖像轉(zhuǎn)文本模型demo

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

文本轉(zhuǎn)音頻demo

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

img-to-music?作者 @fffiloni?也展示了他產(chǎn)出的一些輸出探索,非常奇妙~

圖像轉(zhuǎn)音頻 demo

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

以?img-to-music 為線索,我找出了 Stable Diffusion?較完善的擴展應用模型集成,大家感興趣也可以自主嘗試基于SD模型的應用擴展創(chuàng)新哦~

speech-to-image demo:huggingface.co/spaces/fffiloni/speech-to-image

Image to Music demo:huggingface.co/spaces/fffiloni/img-to-music

CLIP Interrogator:huggingface.co/spaces/pharma/CLIP-InterrogatorMubert demo:

huggingface.co/spaces/Mubert/Text-to-Music

Mubert 項目地址:github.com/MubertAI/Mubert-Text-to-Music

SD 擴展模型應用集成:
github.com/huggingface/diffusers/tree/main/examples/community#speech-to-image

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

小杜

更多有關AIGC最新突破的知識信息,歡迎查閱社群知識庫哦~

【雙11優(yōu)惠】元宇宙知識庫只需139元

下一期我們再卷卷視頻?來點動態(tài)內(nèi)容,AIGC 啥都玩一遍hhh

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

Mixlab

實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成,人工智能,機器學習,計算機視覺,深度學習,python

opus

歡迎留言討論,參與?AIGC??話題的共創(chuàng)共建~

添加請備注AIGC?& 元宇宙

??文章來源地址http://www.zghlxwxcb.cn/news/detail-521233.html

到了這里,關于實測AIGC工作流,Stable Diffusion + Mubert 實現(xiàn)圖片與音樂的轉(zhuǎn)換生成的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 云原生離線工作流編排利器 -- 分布式工作流 Argo 集群

    云原生離線工作流編排利器 -- 分布式工作流 Argo 集群

    作者:莊宇 在現(xiàn)代的軟件開發(fā)和數(shù)據(jù)處理領域,批處理作業(yè)(Batch)扮演著重要的角色。它們通常用于數(shù)據(jù)處理,仿真計算,科學計算等領域,往往需要大規(guī)模的計算資源。隨著云計算的興起,阿里云批量計算和 AWS Batch 等云服務提供了管理和運行這些批處理作業(yè)的平臺。 隨

    2024年01月24日
    瀏覽(28)
  • Camunda 7工作流引擎 API 以及與Springboot集成實現(xiàn)工作流配置全紀錄

    Camunda 7工作流引擎 API 以及與Springboot集成實現(xiàn)工作流配置全紀錄

    項目中需要用到工作流引擎來設計部分業(yè)務流程,框架選型最終選擇了 Camunda7,關于 Camunda以及 Activity 等其他工作流 引擎的介紹及對比不再介紹,這里只介紹與現(xiàn)有Springboot項目的集成以及具體使用及配置 流程(PROCESS): 通過工具建模最終生成的BPMN文件,里面有整個流程的定

    2024年02月10日
    瀏覽(47)
  • Git 工作流設計

    Git 工作流設計

    前言 常用的工作流有四種 集中式工作流 功能分支流 git flow 工作流 forking 工作流 集中式工作流 集中式工作流,多個功能(feat),bug修復(fix) 在一個分支上開發(fā),極容易出現(xiàn)代碼從沖突 功能分支流 新的功能或者bug fork出一個新的分支,在該分支上開發(fā) 功能在分支開發(fā)完后再合

    2024年02月05日
    瀏覽(26)
  • Git工作流

    Git工作流

    main:生產(chǎn)環(huán)境,也就是你們在網(wǎng)上可以下載到的版本,是經(jīng)過了很多輪測試得到的穩(wěn)定版本。 release: 開發(fā)內(nèi)部發(fā)版,也就是測試環(huán)境。 dev:所有的feature都要從dev上checkout。 feature:每個需求新創(chuàng)建的分支。 下面介紹一下一個新需求過來的git操作流程: 1.從dev分支上checkou

    2024年02月10日
    瀏覽(41)
  • 云計算工作流調(diào)度

    云計算工作流調(diào)度

    閱讀筆記 首先,我們提出了一個更實用的混合云服務流程成本驅(qū)動調(diào)度模型,該模型在不降低VM部署彈性的情況下更精確地定義資源約束,并考慮了基于間隔的綜合收費,包括計費周期和持續(xù)使用折扣。 其次,提出了一種改進的基于FWA(煙花算法)的方法來解決這一問題。在

    2024年02月02日
    瀏覽(49)
  • Activity工作流引擎

    Activity工作流引擎

    目錄 一、了解工作流 1、什么是工作流 2、工作流引擎 3、常見工作流引擎 4、Activiti7概述 4.1、Activiti介紹 4.2、建模語言BPMN 4.3、Activiti使用流程 二、Activiti7 1、Activiti使用 1.1、數(shù)據(jù)庫支持 1.2、Activiti環(huán)境 1.3、Activiti常用Service服務接口 1.4、流程設計工具 2、Activiti流程操作 2.1、

    2024年02月13日
    瀏覽(22)
  • 工作流引擎Flowable

    工作流引擎Flowable

    官方手冊 一、依賴 二、demo 三、日志文件 在resources中添加日志文件log4j.properties Flowable流程圖 Eclipse Designer, 一款Eclipse插件, 用于圖形化建模, 測試與部署B(yǎng)PMN2.0流程 FlowableUI Flowable BPMN visualizer, 一款idea插件 從官網(wǎng)下載flowable-6.7.2.zip解壓后, 可以看到如下兩個文件 將這兩個文件

    2024年02月09日
    瀏覽(28)
  • Docker工作流

    Docker工作流

    開發(fā)應用 編寫Dockerfile 構建Docker鏡像 運行Docker容器 測試應用 發(fā)布鏡像到Hub 迭代更新鏡像 首先你需要創(chuàng)建一個應用,這個應用可以是后端應用或者前端應用,任何語言都可以。 比如:我使用IDEA 創(chuàng)建一個Java后端應用,基于Maven構建,工程結構如下: 基于自己的工程來編寫

    2024年04月29日
    瀏覽(23)
  • Git工作流(隨筆)

    Git工作流(隨筆)

    目錄 前言 一、工作流概述 1、概念 2、分類 二、集中式工作流 1、概述 2、介紹 3、操作過程 三、功能分支工作流 1、概述 2、介紹 3、操作過程 1)創(chuàng)建遠程分支 2)刪除遠程分支 四、GitFlow工作流 1、概述 2、介紹 ? 3、操作過程 五、Forking工作流 1、概述 2、介紹 3、操作過程

    2024年02月09日
    瀏覽(22)
  • GitFlow工作流

    GitFlow工作流

    基于 Git 這一版本控制系統(tǒng),通過定義不同的分支,探索合適的工作流程來完成開發(fā)、測試、修改等方面的需求。 例如:在開發(fā)階段,創(chuàng)建 feature 分支,完成需求后,將此分支合并到 develop 分支上;在發(fā)布階段,創(chuàng)建 release 分支,完成階段開發(fā)任務后,將分支合并到 develop 和

    2024年02月22日
    瀏覽(23)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包