每周一期,縱覽音視頻技術(shù)領(lǐng)域的干貨。
新聞投稿:contribute@livevideostack.com。
著名數(shù)據(jù)和AI企業(yè)Databricks,收購類ChatGPT開源平臺MosaicML
6月27日,Databricks在官網(wǎng)宣布,以13億美元(約94億元)價格收購了類ChatGPT開源平臺MosaicML。本次交易是全球生成式AI賽道第一筆超過10億美元的收購。
LangKit:ChatGPT等大語言模型界的“安全管家”開源了
ChatGPT等大語言模型一直有生成虛假信息、數(shù)據(jù)隱私、生成歧視信息等難題,阻礙了業(yè)務(wù)場景化落地。為了解決這些痛點并增強大語言模型的安全性,AI和數(shù)據(jù)監(jiān)控平臺WhyLabs推出了LangKit。
加速大模型應(yīng)用落地,“火山方舟”正式發(fā)布
6月28日,在2023火山引擎V-Tech體驗創(chuàng)新科技峰會上,火山引擎發(fā)布大模型服務(wù)平臺“火山方舟”,面向企業(yè)提供模型精調(diào)、評測、推理等全方位的平臺服務(wù)(MaaS,即Model-as-a-Service)。
理解指向,說出坐標(biāo),Shikra開啟多模態(tài)大模型參考對話新維度
在人類的日常交流中,經(jīng)常會關(guān)注場景中不同的區(qū)域或物體,人們可以通過說話并指向這些區(qū)域來進行高效的信息交換。這種交互模式被稱為參考對話(Referential Dialogue)。如果 MLLM 擅長這項技能,它將帶來許多令人興奮的應(yīng)用。例如,將其應(yīng)用到 Apple Vision Pro 等混合現(xiàn)實 (XR) 眼鏡中,用戶可以使用視線注視指示任何內(nèi)容與 AI 對話。
LinkedIn 將開放 AIGC 輔助撰寫簡歷功能
面向職場的社交平臺LinkedIn, 將生成式 AI 引入帖文寫作中,此項功能在測試完成之后會面向所有用戶開放。
ChatGPT的iPhone應(yīng)用程序更新:添加了Bing搜索引擎
ChatGPT for iOS現(xiàn)在提供與Bing搜索的連接。這意味著AI驅(qū)動的ChatGPT應(yīng)用程序,能夠獲取更近期的信息,而不僅僅使用它在訓(xùn)練過程中所接觸到的舊數(shù)據(jù)(ChatGPT知識庫截至2021年)。
https://www.digitaltrends.com/mobile/chatgpts-iphone-app-now-has-bing-built-in/
字節(jié)跳動服務(wù)器芯片負(fù)責(zé)人創(chuàng)立 RISC-V CPU 公司,估值超 1 億美元
據(jù)獲悉,字節(jié)跳動前 RISC-V 和服務(wù)器芯片項目負(fù)責(zé)人盧山已離職創(chuàng)業(yè),成立藍(lán)芯算力,方向為 RISC-V 數(shù)據(jù)中心 CPU(中央處理器),藍(lán)芯算力正在進行首輪融資,投前估值超過 1 億美元。
芯片工藝決定了未來計算芯片架構(gòu)
論文作者總結(jié)了ISCA(國際計算機架構(gòu)會議)舉辦至今五十年內(nèi),每個十年發(fā)表論文的共性主題,結(jié)合論文主題和半導(dǎo)體芯片工藝兩者的變化進行了脈絡(luò)梳理。在此基礎(chǔ)上,作者提出觀點:未來十年將是計算芯片架構(gòu)領(lǐng)域的黃金十年。
Meta一直在為自主研發(fā)盡可能多的芯片做出努力
本月初,蘋果發(fā)布了其Vision Pro混合現(xiàn)實頭戴設(shè)備,將激化Apple和Meta之間在AR和VR市場的競爭。在過去的五年中,Meta一直在努力自主研發(fā)盡可能多的芯片,以更好地區(qū)分其產(chǎn)品與蘋果的產(chǎn)品。
https://www.theinformation.com/articles/how-meta-stumbled-in-quest-for-chip-independence
COMSOL:基于圖像數(shù)據(jù)生成網(wǎng)格的方法
這篇文章解釋了COMSOL 軟件如何幫助用戶,利用三維成像技術(shù)獲得的數(shù)據(jù)生成仿真網(wǎng)格。
老照片修復(fù)算法:具有細(xì)節(jié)和結(jié)構(gòu)增強的修復(fù)網(wǎng)絡(luò)
論文作者在這篇文章中,提出了一種級聯(lián)的由粗到細(xì)的老照片修復(fù)算法,可以同時恢復(fù)老照片中的結(jié)構(gòu)化和非結(jié)構(gòu)化損傷。
科學(xué)量化的色差值DE不一定能真實反映人眼感受的顏色差異
在工業(yè)界,對于色差公式在人眼可感知閾值或者可接受容限附近色差的預(yù)測性能非常關(guān)注,因為色差公式對于產(chǎn)品顏色質(zhì)量控制的評價主要處于這個色差范圍。但人類對大自然中不同色彩的辨別能力是不一樣的。
綠屏的6種檢測方案
在這篇文章中,作者使用了opencv檢測、圖像全域檢測等六種方案嘗試解決問題,并提出了關(guān)于提高方案效率和健壯性的若干建議。
沉浸式視頻流媒體的Versatile Video Coding(VVC)標(biāo)準(zhǔn)
該論文介紹了VVC(Versatile Video Coding)標(biāo)準(zhǔn)及其在沉浸式視頻流媒體中的應(yīng)用,以及VVC的ISOBMFF存儲格式。
聊聊新一代藍(lán)牙技術(shù):LE Audio橫空出世,無線耳機迎來進化
這篇文章梳理了藍(lán)牙技術(shù)的發(fā)展脈絡(luò),并介紹了常見的藍(lán)牙音頻格式,并詳細(xì)闡述了為何LE Audio能成為未來藍(lán)牙音頻中的主流。
建設(shè)高性能終端平臺——傳音元宇宙的基礎(chǔ)設(shè)施探索
本次分享將分為三個部分,第一部分介紹全球用戶在音視頻業(yè)務(wù)中的痛點;第二部分主要闡述傳音針對不同用戶所研發(fā)的網(wǎng)絡(luò)優(yōu)化,音視頻影像,游戲體驗優(yōu)化等技術(shù)。第三部分詳細(xì)介紹了,為提前布局元宇宙,并在AIGC時代迎來新的機遇,傳音針對不同地區(qū)的人群研發(fā)了AI語音,虛擬人等技術(shù);在未來也將在終端平臺搭建異構(gòu)計算,交互體驗預(yù)測等新的技術(shù)平臺。
華科開源:半直接法視覺-激光雷達(dá)里程計 SDV-LOAM
在這篇文章中,作者提出了SDV-LOAM,它結(jié)合了半直接視覺里程計和自適應(yīng)掃描到地圖激光雷達(dá)里程計,用于避免跟蹤誤差、實現(xiàn)高跟蹤精度。
遠(yuǎn)程渲染虛擬現(xiàn)實中的眼底部分聚焦空間壓縮技術(shù)
在遠(yuǎn)程渲染的虛擬現(xiàn)實(VR)中,應(yīng)用程序的渲染被移至云端,使得高質(zhì)量實時內(nèi)容可以在低功耗的獨立式頭戴顯示器(HMD)上消費。此篇論文探討了,在遠(yuǎn)程渲染的虛擬現(xiàn)實中應(yīng)用聚焦技術(shù)和超分辨率的策略,以解決延遲和高帶寬要求的挑戰(zhàn),并優(yōu)化傳輸?shù)膱D像質(zhì)量。
https://dl.acm.org/doi/pdf/10.1145/3597063.3597359
Zoom加入AOMedia,雙方的“見面禮”不僅是AV1
6月21日消息,視頻會議軟件Zoom加入了開放媒體聯(lián)盟(AOMedia),成為了該聯(lián)盟組織的其中一員。這意味著,下一代編解碼器AV1有望獲得Zoom公司的支持。
LiveVideoStackCon 2023 上海站日程發(fā)布
LiveVideoStackCon 2023 上海站音視頻技術(shù)大會以「沉浸·新視界」為主題,除了探索音視頻技術(shù)在不同場景下的融合與發(fā)展外,還增添了游戲、AIGC和數(shù)字化行業(yè)案例等新鮮火爆的話題。在這里,你可以感受到多媒體生態(tài)內(nèi)的頭部公司、頂級玩家對行業(yè)當(dāng)前發(fā)展趨勢、瓶頸挑戰(zhàn),與對未來規(guī)劃的深入解讀。
我們將邀請60余位頂級講師聚集一堂,與你共同分享他們的專業(yè)見解。這是一個與業(yè)內(nèi)頂尖專家進行深入交流的絕佳機會,你將有機會親自與他們面對面,從他們豐富的經(jīng)驗中獲得寶貴的技術(shù)心得。
AIGC產(chǎn)業(yè)研究報告 2023
AIGC產(chǎn)業(yè)研究報告系列共分為六個部分,包括語言生成篇、圖像生成篇、音頻生成篇、視頻生成篇、三維生成篇、分子發(fā)現(xiàn)與電路設(shè)計篇,目前已經(jīng)全部發(fā)布,歡迎關(guān)注收藏并與我們共同探討AIGC產(chǎn)業(yè)發(fā)展。
B站改革:將以視頻播放分鐘數(shù)代替播放次數(shù)
在B站14周年慶之際,董事長兼CEO陳睿進行了以“很高興遇見你”為主題的演講。該演講分享了B站過去14年專注的三件事以及B站在UP主內(nèi)容創(chuàng)作生態(tài)、商業(yè)收入等方面的發(fā)展。同時,B站將以播放分鐘數(shù)替代目前外顯的播放次數(shù),以更好地挖掘B站的優(yōu)質(zhì)內(nèi)容。
IBM擴大與Adobe合作,推進生成式AI應(yīng)用
IBM在官網(wǎng)宣布擴大與Adobe的合作伙伴關(guān)系,幫助其生成式AI產(chǎn)品Adobe Sensei GenAI和 Adobe Firefly加速場景化落地和應(yīng)用進程。
《時代》專訪ChatGPT之父:人工智能影響經(jīng)濟還需要很多年
奧特曼的公司OpenAI,通過其病毒式產(chǎn)品ChatGPT,將人工智能帶入公眾的視野。幾乎沒有人質(zhì)疑OpenAI是這場革命的先鋒。最終,這場革命將改變世界,不管是好是壞,兩者都有可能。
華創(chuàng)資本熊偉銘:不著急投資AIGC應(yīng)用,真正的風(fēng)口還沒到來文章來源:http://www.zghlxwxcb.cn/news/detail-521620.html
ChatGPT爆火之后,大模型成為創(chuàng)投“新寵”,但也有一些長期布局AI賽道的投資人并沒有出手。文章來源地址http://www.zghlxwxcb.cn/news/detail-521620.html
到了這里,關(guān)于音視頻技術(shù)開發(fā)周刊 | 300的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!