国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

阿里云通義千問開源第二波！大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū)

2年前作者：光錐智能分類：Toy博客閱讀(26)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了阿里云通義千問開源第二波！大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

通義千問開源第二波！8月25日消息，阿里云推出大規(guī)模視覺語言模型Qwen-VL，一步到位、直接開源。Qwen-VL以通義千問70億參數(shù)模型Qwen-7B為基座語言模型研發(fā)，支持圖文輸入，具備多模態(tài)信息理解能力。在主流的多模態(tài)任務(wù)評(píng)測(cè)和多模態(tài)聊天能力評(píng)測(cè)中，Qwen-VL取得了遠(yuǎn)超同等規(guī)模通用模型的表現(xiàn)。

Qwen-VL是支持中英文等多種語言的視覺語言（Vision Language，VL）模型，相較于此前的VL模型，Qwen-VL除了具備基本的圖文識(shí)別、描述、問答及對(duì)話能力之外，還新增了視覺定位、圖像中文字理解等能力。

阿里云通義千問開源第二波！大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū),阿里云,語言模型,云計(jì)算

多模態(tài)是通用人工智能的重要技術(shù)演進(jìn)方向之一。業(yè)界普遍認(rèn)為，從單一感官的、僅支持文本輸入的語言模型，到“五官全開”的，支持文本、圖像、音頻等多種信息輸入的多模態(tài)模型，蘊(yùn)含著大模型智能躍升的巨大可能。多模態(tài)能夠提升大模型對(duì)世界的理解程度，充分拓展大模型的使用場(chǎng)景。

視覺是人類的第一感官能力，也是研究者首先想賦予大模型的多模態(tài)能力。繼此前推出M6、OFA系列多模態(tài)模型之后，阿里云通義千問團(tuán)隊(duì)又開源了基于Qwen-7B的大規(guī)模視覺語言模型（Large Vision Language Model, LVLM）Qwen-VL。Qwen-VL及其視覺AI助手Qwen-VL-Chat均已上線ModelScope魔搭社區(qū)，開源、免費(fèi)、可商用。

用戶可從魔搭社區(qū)直接下載模型，也可通過阿里云靈積平臺(tái)訪問調(diào)用Qwen-VL和Qwen-VL-Chat，阿里云為用戶提供包括模型訓(xùn)練、推理、部署、精調(diào)等在內(nèi)的全方位服務(wù)。

阿里云通義千問開源第二波！大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū),阿里云,語言模型,云計(jì)算

Qwen-VL可用于知識(shí)問答、圖像標(biāo)題生成、圖像問答、文檔問答、細(xì)粒度視覺定位等場(chǎng)景。

比如，一位不懂中文的外國游客到醫(yī)院看病，不知怎么去往對(duì)應(yīng)科室，他拍下樓層導(dǎo)覽圖問Qwen-VL“骨科在哪層”“耳鼻喉科去哪層”，Qwen-VL會(huì)根據(jù)圖片信息給出文字回復(fù)，這是圖像問答能力；再比如，輸入一張上海外灘的照片，讓Qwen-VL找出東方明珠，Qwen-VL能用檢測(cè)框準(zhǔn)確圈出對(duì)應(yīng)建筑，這是視覺定位能力。

Qwen-VL是業(yè)界首個(gè)支持中文開放域定位的通用模型，開放域視覺定位能力決定了大模型“視力”的精準(zhǔn)度，也即，能否在畫面中精準(zhǔn)地找出想找的事物，這對(duì)于VL模型在機(jī)器人操控等真實(shí)應(yīng)用場(chǎng)景的落地至關(guān)重要。

阿里云通義千問開源第二波！大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū),阿里云,語言模型,云計(jì)算

阿里云通義千問開源第二波！大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū),阿里云,語言模型,云計(jì)算

Qwen-VL以Qwen-7B為基座語言模型，在模型架構(gòu)上引入視覺編碼器，使得模型支持視覺信號(hào)輸入，并通過設(shè)計(jì)訓(xùn)練過程，讓模型具備對(duì)視覺信號(hào)的細(xì)粒度感知和理解能力。Qwen-VL支持的圖像輸入分辨率為448，此前開源的LVLM模型通常僅支持224分辨率。在Qwen-VL 的基礎(chǔ)上，通義千問團(tuán)隊(duì)使用對(duì)齊機(jī)制，打造了基于LLM的視覺AI助手Qwen-VL-Chat，可讓開發(fā)者快速搭建具備多模態(tài)能力的對(duì)話應(yīng)用。

在四大類多模態(tài)任務(wù)（Zero-shot Caption/VQA/DocVQA/Grounding）的標(biāo)準(zhǔn)英文測(cè)評(píng)中，Qwen-VL取得了同等尺寸開源LVLM的最好效果。為了測(cè)試模型的多模態(tài)對(duì)話能力，通義千問團(tuán)隊(duì)構(gòu)建了一套基于GPT-4打分機(jī)制的測(cè)試集“試金石”，對(duì)Qwen-VL-Chat及其他模型進(jìn)行對(duì)比測(cè)試，Qwen-VL-Chat在中英文的對(duì)齊評(píng)測(cè)中均取得了開源LVLM最好結(jié)果。

8月初，阿里云開源通義千問70億參數(shù)通用模型Qwen-7B和對(duì)話模型Qwen-7B-Chat，成為國內(nèi)首個(gè)加入大模型開源行列的大型科技企業(yè)。通義千問開源模型剛一上線就廣受關(guān)注，當(dāng)周沖上HuggingFace趨勢(shì)榜單，不到一個(gè)月在GitHub收獲3400多星，模型累計(jì)下載量已突破40萬。

開源地址：

ModelScope魔搭社區(qū)：

Qwen-VL ???通義千問-VL-預(yù)訓(xùn)練

Qwen-VL-Chat ???通義千問-VL-Chat

模型體驗(yàn)：通義千問-多模態(tài)對(duì)話-Demo

HuggingFace：

Qwen-VL ??Qwen/Qwen-VL · Hugging Face

Qwen-VL-Chat ??Qwen/Qwen-VL-Chat · Hugging Face

GitHub：

GitHub - QwenLM/Qwen-VL: The official repo of Qwen-VL (通義千問-VL) chat & pretrained large vision language model proposed by Alibaba Cloud.

技術(shù)論文地址：

https://arxiv.org/abs/2308.12966文章來源地址http://www.zghlxwxcb.cn/news/detail-672481.html

到了這里，關(guān)于阿里云通義千問開源第二波！大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū)的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

LightFM：一款開源推薦系統(tǒng)框架，可以輕松實(shí)現(xiàn)大規(guī)模矩陣分解，快速、高效地處理大型矩陣
作者：禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) LightFM 是由 Yelp 開發(fā)的一款開源推薦系統(tǒng)框架，可以輕松實(shí)現(xiàn)大規(guī)模矩陣分解。該項(xiàng)目基于 TensorFlow 和 Keras 框架，可以快速、高效地處理大型矩陣。它具有以下特點(diǎn): 提供了一種簡(jiǎn)單的方法來訓(xùn)練矩陣分解模型，即通過定義項(xiàng)間的交互矩陣和用
2024年02月10日
瀏覽(19)
阿里云“通義千問”開源，可免費(fèi)商用
我是盧松松，點(diǎn)點(diǎn)上面的頭像，歡迎關(guān)注我哦！阿里云成為國內(nèi)首個(gè)加入大模型開源行列的大型科技企業(yè)。就在昨天，阿里云公開表態(tài)，把自家的通義千問大模型開源。阿里云把通用70億參數(shù)模型，包括Qwen-7B和對(duì)話模型Qwen-7B-Chat這兩款大模型產(chǎn)品給開源了。需要注意的是，
2024年02月13日
瀏覽(24)
本地構(gòu)建自己的chatgpt已成為可能，國外團(tuán)隊(duì)從GPT3.5提取大規(guī)模數(shù)據(jù)完成本地機(jī)器人訓(xùn)練，并開源項(xiàng)目源碼和模型支持普通在筆記上運(yùn)行chatgpt
國外團(tuán)隊(duì)從GPT3.5提取大規(guī)模數(shù)據(jù)完成本地機(jī)器人訓(xùn)練，并開源項(xiàng)目源碼和模型支持,普通在筆記上運(yùn)行chatgpt。下面是他們分享的：收集到的數(shù)據(jù)、數(shù)據(jù)管理程序、訓(xùn)練代碼和最終模型，以促進(jìn)開放研究和可重復(fù)性。在 2023 年 3 月 20 日至 2023 年 3 月 26 日期間，該團(tuán)隊(duì)使用 GPT
2023年04月21日
瀏覽(99)
解讀 | 阿里通義千問模型全尺寸開源 “誠意滿滿“背后的名與利
大家好，我是極智視界，歡迎關(guān)注我的公眾號(hào)，獲取我的更多前沿科技分享邀您加入我的知識(shí)星球「極智視界」，星球內(nèi)有超多好玩的項(xiàng)目實(shí)戰(zhàn)源碼和資源下載，鏈接：https://t.zsxq.com/0aiNxERDq 12 月 1 日阿里開源了 72B 和 18B 大模型以及音頻大模型 Qwen-Audio，再加上之前八月份、
2024年02月03日
瀏覽(20)
大規(guī)模語言模型--LLaMA 家族
LLaMA 模型集合由 Meta AI 于 2023 年 2 月推出，包括四種尺寸(7B 、13B 、30B 和 65B)。由于 LLaMA 的開放性和有效性，自從 LLaMA 一經(jīng)發(fā)布，就受到了研究界和工業(yè)界的廣泛關(guān)注。LLaMA 模型在開放基準(zhǔn)的各種方面都取得了非常出色的表現(xiàn)，已成為迄今為止最流行的開放語言模型。大
2024年04月25日
瀏覽(23)
基于Spark的大規(guī)模日志分析
摘要：本篇文章將從一個(gè)實(shí)際項(xiàng)目出發(fā)，分享如何使用 Spark 進(jìn)行大規(guī)模日志分析，并通過代碼演示加深讀者的理解。本文分享自華為云社區(qū)《【實(shí)戰(zhàn)經(jīng)驗(yàn)分享】基于Spark的大規(guī)模日志分析【上進(jìn)小菜豬大數(shù)據(jù)系列】》，作者：上進(jìn)小菜豬。隨著互聯(lián)網(wǎng)的普及和應(yīng)用范圍的擴(kuò)
2024年02月09日
瀏覽(22)
LLaMA(大規(guī)模機(jī)器學(xué)習(xí)和分析)
LLaMA(大規(guī)模機(jī)器學(xué)習(xí)和分析)是一個(gè)先進(jìn)的軟件平臺(tái)，是Meta 推出 AI 語言模型 LLaMA，一個(gè)有著上百億數(shù)量級(jí)參數(shù)的大語言模型用于大規(guī)模部署和管理機(jī)器學(xué)習(xí)模型。借助LLaMA，組織可以高效地在大型數(shù)據(jù)集上訓(xùn)練和部署模型，縮短投放市場(chǎng)的時(shí)間，并提高預(yù)測(cè)模型的準(zhǔn)確性。
2024年02月11日
瀏覽(20)
云計(jì)算：如何訪問和分析大規(guī)模數(shù)據(jù)
作者：禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 隨著云計(jì)算平臺(tái)的不斷發(fā)展，越來越多的企業(yè)將他們的數(shù)據(jù)、應(yīng)用和服務(wù)部署在云端，希望借助云計(jì)算的能力來提升效率、降低成本、提高競(jìng)爭(zhēng)力。但是同時(shí)也帶來了數(shù)據(jù)安全、隱私保護(hù)、數(shù)據(jù)可靠性等方面的挑戰(zhàn)。對(duì)于企業(yè)而言，如何更好地
2024年02月15日
瀏覽(21)
etcd實(shí)現(xiàn)大規(guī)模服務(wù)治理應(yīng)用實(shí)戰(zhàn)
???? 導(dǎo)讀：服務(wù)治理目前越來越被企業(yè)建設(shè)所重視，特別現(xiàn)在云原生，微服務(wù)等各種技術(shù)被更多的企業(yè)所應(yīng)用，本文內(nèi)容是百度小程序團(tuán)隊(duì)基于大模型服務(wù)治理實(shí)戰(zhàn)經(jīng)驗(yàn)的一些總結(jié)，同時(shí)結(jié)合當(dāng)前較火的分布式開源kv產(chǎn)品etcd，不僅會(huì)深入剖析ectd兩大核心技術(shù)Raft與boltdb的實(shí)
2024年02月12日
瀏覽(20)
利用Python進(jìn)行大規(guī)模數(shù)據(jù)處理
前些天發(fā)現(xiàn)了一個(gè)巨牛的人工智能學(xué)習(xí)網(wǎng)站，通俗易懂，風(fēng)趣幽默，忍不住分享一下給大家?！军c(diǎn)擊進(jìn)入巨牛的人工智能學(xué)習(xí)網(wǎng)站】。隨著數(shù)據(jù)量的不斷增長(zhǎng)，大規(guī)模數(shù)據(jù)處理變得越來越重要。在這個(gè)領(lǐng)域，Hadoop和Spark是兩個(gè)備受關(guān)注的技術(shù)。本文將介紹如何利用Python編程語
2024年04月24日
瀏覽(24)