国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

智能存儲:多媒體實驗室AIGC能力助力數據萬象開啟智能剪輯大門

這篇具有很好參考價值的文章主要介紹了智能存儲:多媒體實驗室AIGC能力助力數據萬象開啟智能剪輯大門。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

引言

AIGC正從效率、質量、創(chuàng)意、多樣性各方面革新內容生產流程,伴隨firely、midjourney等現象級的產品出現,AIGC將逐步廣泛服務于內容生產的各類場景與內容生產者,隨著AIGC在內容生產的需求場景不斷增加,多媒體實驗室也在AIGC領域持續(xù)發(fā)力,并通過數據萬象將能力成功應用到傳媒、社交、文娛等多個行業(yè),逐步夯實全場景內容生產力。

1)足球精彩集錦

數據萬象泛互與傳媒客戶擁有不小體量的體育視頻數據處理需求,尤其是賽事期間,足球賽事作為最受歡迎的體育賽事內容消費量一直居高不下,球迷對其內容的可觀賞性要求也頗高,由于時長問題,未經剪輯的足球比賽不能直接投放到體育新聞、短視頻等場景用于賽事宣傳。為此,騰訊多媒體實驗室基于自研的AIGC系列技術,通過騰訊云數據萬象產品為廣大客戶帶來足球比賽的智能剪輯能力,在沒有人工剪輯參與的情況下自動生成賽事高光內容。

技術介紹

數據方面,我們采集了1200多場具有代表性的足球賽事并標注了高精度的數據集。數據集覆蓋各類著名聯賽和杯賽,累計600多個小時。同時,我們設置了19個關鍵事類別,針對每一段視頻準確標注出全部關鍵事件的起始點、結束點和對應類別。關鍵事件分布如下圖,基本可以反映真實比賽的數據分布。

智能存儲:多媒體實驗室AIGC能力助力數據萬象開啟智能剪輯大門

數據集關鍵事件分布

算法方面,我們設計了一個基于智能拆條和進球檢測的多模態(tài)方案來完成智能剪輯。

智能存儲:多媒體實驗室AIGC能力助力數據萬象開啟智能剪輯大門

多模態(tài)智能剪輯方案

智能拆條模塊基于視頻的圖像序列和音頻信息,通過子任務抽取多模態(tài)特征,再由事件檢測模型定位各類關鍵事件。針對單幀圖像、音頻信息、圖像序列,我們基于事件標簽有監(jiān)督地訓練了三個特征提取器,用于提取圖片、聲音、動作等多模態(tài)特征。

子任務

數據

標簽

準確率

圖片分類

80萬

攻門、解圍、任意球、角球、點球、紅黃牌、換人、治療、彈框信息、采訪、比賽開始?、比賽結束、入場、奏國歌?、握手、片頭/片尾、越位、補水、其它

90.8%

聲音分類

7000條

觀眾歡呼、解說平靜、解說激動、哨聲、其它

84.1%

動作識別

3萬

運動戰(zhàn)攻門、運動戰(zhàn)解圍、回放、任意球、角球、點球、紅黃牌、換人、治療、彈框信息、采訪、比賽開始?、比賽結束、入場、奏國歌?、握手、片頭/片尾、越位、補水、其它

87.4%

事件檢測模型接受由時序卷積編碼再拼接的多模態(tài)融合特征作為輸入,評估各個時刻屬于事件開始、結束、過程的概率,并由此構建候選區(qū)間和對應的時序特征。候選區(qū)間評估階段利用時序特征評估對應區(qū)間與真實事件區(qū)間的交并比,進而實現事件定位。最后結合子任務階段獲取的事件標簽以及后處理算法就可以得到準確的事件拆條結果。

智能存儲:多媒體實驗室AIGC能力助力數據萬象開啟智能剪輯大門

事件檢測模型

智能拆條的效果指標mAP達到了82%,其中定位球和回放等事件的對應指標更是達到90%以上。

媒體2.mp4

運動戰(zhàn)精彩集錦示例

進球檢測模塊通過判斷比分變化情況來對進球事件作補充。在上述方案中,進球事件的召回率并不高,原因是我們并沒有充分利用視頻里的比分信息,最直觀的解決辦法是利用比分信息幫助判斷當前的進球情況。在實際應用中,進球檢測模塊針對視頻幀序列檢測出比分牌位置,然后適當擴大邊緣后再做文字檢測獲取當前幀比分數位置,通過多幀聚類得到當前比賽的比分數位置,最后利用文字識別技術獲得比分序列,根據比分單邊遞增規(guī)則確認進球時刻。

智能存儲:多媒體實驗室AIGC能力助力數據萬象開啟智能剪輯大門

進球檢測模塊

進球檢測模塊將進球事件的召回率提高到96%,提高了集錦的完整性和精彩程度。

進球.mp4

進球精彩集錦示例

足球場景的智能剪輯方案中,我們還新增了球星識別模塊,用于剪輯特定球星片段。該模塊通過使用人臉檢測算法定位視頻中的所有人臉,然后使用人臉識別模型編碼人臉特征,通過聚類算法得到相似人臉序列,最后在球星人臉數據庫中查找與之匹配的球星。目前我們的方案可識別500位人氣球星。

現該功能已在數據萬象多個體育客戶案例中落地,日均處理量持續(xù)攀升,大幅提升數據萬象客戶賽事周邊后期生產速率。

2)影視精彩集錦

除了體育,自研的智能剪輯還支持電視劇、動漫等影視場景,可以根據用戶指定的人物、動作、情感、關鍵詞等信息自動生成所需集錦視頻。

以人物向為例,用戶只需要提供2~3張某個人物的照片,系統(tǒng)便可注冊對應人物,剪輯時指定需要剪輯的角色(或列表)即可生成人物集錦。再搭配音樂卡點,上熱門妥妥的!

人物向.mp4

人物向集錦

線索集錦方面,用戶可以根據劇情內容指定某個關鍵詞作為線索,系統(tǒng)將自動檢索劇集中與此相關的內容,并生成關鍵詞集錦,打造全網最清晰的故事線。

藍銀草集錦.mp4

線索詞集錦

現該功能已獲得數據萬象體驗館、智能工具箱、控制臺中超高點擊率,吸引眾多用戶關注使用,此場景能夠根據用戶需求靈活調整集錦所需關鍵動作、人物等,歡迎各位用戶前往測試。

總結

未來,騰訊多媒體實驗室將持續(xù)投入包括智能剪輯在內的AIGC核心能力建設,數據萬象負責人葉嘉梁表示道數據萬象借助多媒體實驗室在底層?AI?算法多年的積累和建設,結合自身對行業(yè)和業(yè)務的理解,快速上線了能夠幫助客戶業(yè)務實現智能內容生產的能力,豐富的算法也讓業(yè)務具備更好的多樣性和靈活性。您可以前往數據萬象進行相關能力體驗,對存儲在對象存儲COS上的數據進行創(chuàng)作。數據萬象將持續(xù)攜手多媒體實驗室為廣大客戶提供視頻自動剪輯、智能作曲、音樂評分等更多智能化服務,提升內容生產和創(chuàng)作效率。文章來源地址http://www.zghlxwxcb.cn/news/detail-497868.html

到了這里,關于智能存儲:多媒體實驗室AIGC能力助力數據萬象開啟智能剪輯大門的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • Web前端技術基礎實驗報告三之超鏈接與多媒體文件應用

    Web前端技術基礎實驗報告三之超鏈接與多媒體文件應用

    目錄 Web前端技術基礎實驗報告 實驗題目:超鏈接與多媒體文件應用 實驗目的:熟悉超鏈接與多媒體文件的插入的相關標簽 實驗內容 : 實驗過程及結果 實驗題目:超鏈接與多媒體文件應用 實驗目的:熟悉超鏈接與多媒體文件的插入的相關標簽 實驗內容 : 項目1? 設計簡易

    2023年04月16日
    瀏覽(294)
  • 軟考:中級軟件設計師:多媒體基礎,音頻,圖像,顏色,多媒體技術的種類,圖像音頻視頻的容量計算,常見的多媒體標準

    軟考:中級軟件設計師:多媒體基礎,音頻,圖像,顏色,多媒體技術的種類,圖像音頻視頻的容量計算,常見的多媒體標準

    提示:系列被面試官問的問題,我自己當時不會,所以下來自己復盤一下,認真學習和總結,以應對未來更多的可能性 關于互聯網大廠的筆試面試,都是需要細心準備的 (1)自己的科研經歷, 科研內容 ,學習的相關領域知識,要熟悉熟透了 (2)自己的實習經歷,做了 什

    2024年02月09日
    瀏覽(37)
  • 多媒體API

    許小墨のBlog —— 菜雞博客直通車 系列文章完整版,配圖更多,CSDN博文圖片需要手動上傳,因此文章配圖較少,看不懂的可以去菜雞博客參考一下配圖! 前端系列文章——傳送門 后端系列文章——傳送門 video 只接受幾種視屏格式:ogg、mp4、avi 基本使用: controls屬性,出現

    2024年02月02日
    瀏覽(29)
  • 多媒體音頻焦點淺析

    多個音源可以同時向同一個輸出流進行播放音頻,如果沒有音頻焦點管控,就會出現多個音源同時播放的現象,給用戶帶來不便;而Android為了避免多個音源同時播放,就引入了音頻焦點的概念,所有音頻應用都統(tǒng)一按照音頻焦點的規(guī)定執(zhí)行,就可以避免該現象發(fā)生。 當應用

    2024年02月13日
    瀏覽(36)
  • 鑒源實驗室丨智能網聯汽車協議模糊測試技術概述

    鑒源實驗室丨智能網聯汽車協議模糊測試技術概述

    作者 |? 喬琪?上??匕部尚跑浖?chuàng)新研究院工控網絡安全組 來源 | ?鑒源實驗室 社群 | ?添加微信號“ TICPShanghai ”加入“上??匕?1fusa安全社區(qū)” 摘要: 隨著智能網聯汽車的快速發(fā)展,其協議安全性和穩(wěn)定性成為了關注焦點。智能網聯汽車協議特點主要表現為:數據格式

    2024年04月23日
    瀏覽(29)
  • AIGC生成多媒體流程

    AIGC生成多媒體流程

    給定 生成多個故事標題 多個故事標題進行反向推導出 再生成標題 直到達到一個相似度 多個標題固定總結合并為一個標題 根據生成故事多個章節(jié)標題 多個章節(jié)標題反向生成一個標題 對比前后兩個標題相似度 不斷重復直到達到一定相似度 第一個章

    2024年02月12日
    瀏覽(94)
  • 多媒體開發(fā)之cgo

    多媒體開發(fā)之cgo

    ???? go語言作為近十年來優(yōu)秀的現代開發(fā)語言的代表,由于繼承了c語言的簡潔和很多現代語言的表達方式,在廣泛的應用場景中得到眾多愛好者的喜愛,如何將go和c、c++進行聯合開發(fā),拓展整個開發(fā)生態(tài),不用重復造輪子,掌握cgo可以讓你得心應手的在c和go之間傳遞信息,

    2024年02月16日
    瀏覽(27)
  • 鴻蒙實戰(zhàn)多媒體運用:【音頻組件】

    鴻蒙實戰(zhàn)多媒體運用:【音頻組件】

    音頻組件用于實現音頻相關的功能,包括音頻播放,錄制,音量管理和設備管理。 圖 1 ?音頻組件架構圖 基本概念 采樣 采樣是指將連續(xù)時域上的模擬信號按照一定的時間間隔采樣,獲取到離散時域上離散信號的過程。 采樣率 采樣率為每秒從連續(xù)信號中提取并組成離散信號

    2024年03月10日
    瀏覽(90)
  • 計算機網絡——多媒體網絡

    計算機網絡——多媒體網絡

    通俗易懂,風趣幽默,忍不住分享一下給大家, 跳轉到網站 我的計算機網絡專欄,是自己在計算機網絡學習過程中的學習筆記與心得,在參考相關教材,網絡搜素的前提下,結合自己過去一段時間筆記整理,而推出的該專欄,整體架構是根據計算機網絡 自頂向下 方法而整理

    2024年02月20日
    瀏覽(21)
  • Java UI組件和多媒體

    Java UI組件和多媒體

    目錄 1、使用單選按鈕 2、選擇幾何圖形 ?3、交通信號燈 ?4、演示TextField的屬性 5、演示TextArea的屬性 6、選擇一種字體 ?7、演示 Label 的屬性 ?8、使?用ComboBox 和 ListView? 9、使?用 ScrollBar 和 Slider ? ?10、模擬:一個轉動的風扇 編寫一個 GUI 程序如圖所示 。 可以使用按鈕將消

    2024年02月09日
    瀏覽(25)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包