国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

阿里云通義千問開源第二波!大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū)

這篇具有很好參考價(jià)值的文章主要介紹了阿里云通義千問開源第二波!大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

通義千問開源第二波!8月25日消息,阿里云推出大規(guī)模視覺語言模型Qwen-VL,一步到位、直接開源。Qwen-VL以通義千問70億參數(shù)模型Qwen-7B為基座語言模型研發(fā),支持圖文輸入,具備多模態(tài)信息理解能力。在主流的多模態(tài)任務(wù)評(píng)測(cè)和多模態(tài)聊天能力評(píng)測(cè)中,Qwen-VL取得了遠(yuǎn)超同等規(guī)模通用模型的表現(xiàn)。

Qwen-VL是支持中英文等多種語言的視覺語言(Vision Language,VL)模型,相較于此前的VL模型,Qwen-VL除了具備基本的圖文識(shí)別、描述、問答及對(duì)話能力之外,還新增了視覺定位、圖像中文字理解等能力。

阿里云通義千問開源第二波!大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū),阿里云,語言模型,云計(jì)算

多模態(tài)是通用人工智能的重要技術(shù)演進(jìn)方向之一。業(yè)界普遍認(rèn)為,從單一感官的、僅支持文本輸入的語言模型,到“五官全開”的,支持文本、圖像、音頻等多種信息輸入的多模態(tài)模型,蘊(yùn)含著大模型智能躍升的巨大可能。多模態(tài)能夠提升大模型對(duì)世界的理解程度,充分拓展大模型的使用場(chǎng)景。

視覺是人類的第一感官能力,也是研究者首先想賦予大模型的多模態(tài)能力。繼此前推出M6、OFA系列多模態(tài)模型之后,阿里云通義千問團(tuán)隊(duì)又開源了基于Qwen-7B的大規(guī)模視覺語言模型(Large Vision Language Model, LVLM)Qwen-VL。Qwen-VL及其視覺AI助手Qwen-VL-Chat均已上線ModelScope魔搭社區(qū),開源、免費(fèi)、可商用。

用戶可從魔搭社區(qū)直接下載模型,也可通過阿里云靈積平臺(tái)訪問調(diào)用Qwen-VL和Qwen-VL-Chat,阿里云為用戶提供包括模型訓(xùn)練、推理、部署、精調(diào)等在內(nèi)的全方位服務(wù)。

阿里云通義千問開源第二波!大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū),阿里云,語言模型,云計(jì)算

Qwen-VL可用于知識(shí)問答、圖像標(biāo)題生成、圖像問答、文檔問答、細(xì)粒度視覺定位等場(chǎng)景。

比如,一位不懂中文的外國游客到醫(yī)院看病,不知怎么去往對(duì)應(yīng)科室,他拍下樓層導(dǎo)覽圖問Qwen-VL“骨科在哪層”“耳鼻喉科去哪層”,Qwen-VL會(huì)根據(jù)圖片信息給出文字回復(fù),這是圖像問答能力;再比如,輸入一張上海外灘的照片,讓Qwen-VL找出東方明珠,Qwen-VL能用檢測(cè)框準(zhǔn)確圈出對(duì)應(yīng)建筑,這是視覺定位能力。

Qwen-VL是業(yè)界首個(gè)支持中文開放域定位的通用模型,開放域視覺定位能力決定了大模型“視力”的精準(zhǔn)度,也即,能否在畫面中精準(zhǔn)地找出想找的事物,這對(duì)于VL模型在機(jī)器人操控等真實(shí)應(yīng)用場(chǎng)景的落地至關(guān)重要。

阿里云通義千問開源第二波!大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū),阿里云,語言模型,云計(jì)算

阿里云通義千問開源第二波!大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū),阿里云,語言模型,云計(jì)算

Qwen-VL以Qwen-7B為基座語言模型,在模型架構(gòu)上引入視覺編碼器,使得模型支持視覺信號(hào)輸入,并通過設(shè)計(jì)訓(xùn)練過程,讓模型具備對(duì)視覺信號(hào)的細(xì)粒度感知和理解能力。Qwen-VL支持的圖像輸入分辨率為448,此前開源的LVLM模型通常僅支持224分辨率。在Qwen-VL 的基礎(chǔ)上,通義千問團(tuán)隊(duì)使用對(duì)齊機(jī)制,打造了基于LLM的視覺AI助手Qwen-VL-Chat,可讓開發(fā)者快速搭建具備多模態(tài)能力的對(duì)話應(yīng)用。

在四大類多模態(tài)任務(wù)(Zero-shot Caption/VQA/DocVQA/Grounding)的標(biāo)準(zhǔn)英文測(cè)評(píng)中,Qwen-VL取得了同等尺寸開源LVLM的最好效果。為了測(cè)試模型的多模態(tài)對(duì)話能力,通義千問團(tuán)隊(duì)構(gòu)建了一套基于GPT-4打分機(jī)制的測(cè)試集“試金石”,對(duì)Qwen-VL-Chat及其他模型進(jìn)行對(duì)比測(cè)試,Qwen-VL-Chat在中英文的對(duì)齊評(píng)測(cè)中均取得了開源LVLM最好結(jié)果。

8月初,阿里云開源通義千問70億參數(shù)通用模型Qwen-7B和對(duì)話模型Qwen-7B-Chat,成為國內(nèi)首個(gè)加入大模型開源行列的大型科技企業(yè)。通義千問開源模型剛一上線就廣受關(guān)注,當(dāng)周沖上HuggingFace趨勢(shì)榜單,不到一個(gè)月在GitHub收獲3400多星,模型累計(jì)下載量已突破40萬。

開源地址:

ModelScope魔搭社區(qū):

Qwen-VL ???通義千問-VL-預(yù)訓(xùn)練

Qwen-VL-Chat ???通義千問-VL-Chat

模型體驗(yàn):通義千問-多模態(tài)對(duì)話-Demo

HuggingFace

Qwen-VL ??Qwen/Qwen-VL · Hugging Face

Qwen-VL-Chat ??Qwen/Qwen-VL-Chat · Hugging Face

GitHub

GitHub - QwenLM/Qwen-VL: The official repo of Qwen-VL (通義千問-VL) chat & pretrained large vision language model proposed by Alibaba Cloud.

技術(shù)論文地址:

https://arxiv.org/abs/2308.12966文章來源地址http://www.zghlxwxcb.cn/news/detail-672481.html

到了這里,關(guān)于阿里云通義千問開源第二波!大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • LightFM:一款開源推薦系統(tǒng)框架,可以輕松實(shí)現(xiàn)大規(guī)模矩陣分解,快速、高效地處理大型矩陣

    作者:禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) LightFM 是由 Yelp 開發(fā)的一款開源推薦系統(tǒng)框架,可以輕松實(shí)現(xiàn)大規(guī)模矩陣分解。該項(xiàng)目基于 TensorFlow 和 Keras 框架,可以快速、高效地處理大型矩陣。它具有以下特點(diǎn): 提供了一種簡(jiǎn)單的方法來訓(xùn)練矩陣分解模型,即通過定義項(xiàng)間的交互矩陣和用

    2024年02月10日
    瀏覽(19)
  • 阿里云“通義千問”開源,可免費(fèi)商用

    阿里云“通義千問”開源,可免費(fèi)商用

    我是盧松松,點(diǎn)點(diǎn)上面的頭像,歡迎關(guān)注我哦! 阿里云成為國內(nèi)首個(gè)加入大模型開源行列的大型科技企業(yè)。就在昨天,阿里云公開表態(tài),把自家的通義千問大模型開源。 阿里云把通用70億參數(shù)模型,包括Qwen-7B和對(duì)話模型Qwen-7B-Chat這兩款大模型產(chǎn)品給開源了。需要注意的是,

    2024年02月13日
    瀏覽(24)
  • 本地構(gòu)建自己的chatgpt已成為可能,國外團(tuán)隊(duì)從GPT3.5提取大規(guī)模數(shù)據(jù)完成本地機(jī)器人訓(xùn)練,并開源項(xiàng)目源碼和模型支持普通在筆記上運(yùn)行chatgpt

    本地構(gòu)建自己的chatgpt已成為可能,國外團(tuán)隊(duì)從GPT3.5提取大規(guī)模數(shù)據(jù)完成本地機(jī)器人訓(xùn)練,并開源項(xiàng)目源碼和模型支持普通在筆記上運(yùn)行chatgpt

    國外團(tuán)隊(duì)從GPT3.5提取大規(guī)模數(shù)據(jù)完成本地機(jī)器人訓(xùn)練,并開源項(xiàng)目源碼和模型支持,普通在筆記上運(yùn)行chatgpt。下面是他們分享的:收集到的數(shù)據(jù)、數(shù)據(jù)管理程序、訓(xùn)練代碼和最終模型,以促進(jìn)開放研究和可重復(fù)性。 在 2023 年 3 月 20 日至 2023 年 3 月 26 日期間,該團(tuán)隊(duì)使用 GPT

    2023年04月21日
    瀏覽(99)
  • 解讀 | 阿里通義千問模型全尺寸開源 “誠意滿滿“背后的名與利

    解讀 | 阿里通義千問模型全尺寸開源 “誠意滿滿“背后的名與利

    大家好,我是極智視界,歡迎關(guān)注我的公眾號(hào),獲取我的更多前沿科技分享 邀您加入我的知識(shí)星球「極智視界」,星球內(nèi)有超多好玩的項(xiàng)目實(shí)戰(zhàn)源碼和資源下載,鏈接:https://t.zsxq.com/0aiNxERDq 12 月 1 日阿里開源了 72B 和 18B 大模型以及音頻大模型 Qwen-Audio,再加上之前八月份、

    2024年02月03日
    瀏覽(20)
  • 大規(guī)模語言模型--LLaMA 家族

    大規(guī)模語言模型--LLaMA 家族

    LLaMA 模型集合由 Meta AI 于 2023 年 2 月推出, 包括四種尺寸(7B 、13B 、30B 和 65B)。由于 LLaMA 的 開放性和有效性, 自從 LLaMA 一經(jīng)發(fā)布, 就受到了研究界和工業(yè)界的廣泛關(guān)注。LLaMA 模型在開放基準(zhǔn)的各 種方面都取得了非常出色的表現(xiàn), 已成為迄今為止最流行的開放語言模型。大

    2024年04月25日
    瀏覽(23)
  • 基于Spark的大規(guī)模日志分析

    摘要: 本篇文章將從一個(gè)實(shí)際項(xiàng)目出發(fā),分享如何使用 Spark 進(jìn)行大規(guī)模日志分析,并通過代碼演示加深讀者的理解。 本文分享自華為云社區(qū)《【實(shí)戰(zhàn)經(jīng)驗(yàn)分享】基于Spark的大規(guī)模日志分析【上進(jìn)小菜豬大數(shù)據(jù)系列】》,作者:上進(jìn)小菜豬。 隨著互聯(lián)網(wǎng)的普及和應(yīng)用范圍的擴(kuò)

    2024年02月09日
    瀏覽(22)
  • LLaMA(大規(guī)模機(jī)器學(xué)習(xí)和分析)

    LLaMA(大規(guī)模機(jī)器學(xué)習(xí)和分析)是一個(gè)先進(jìn)的軟件平臺(tái),是Meta 推出 AI 語言模型 LLaMA,一個(gè)有著 上百億數(shù)量級(jí)參數(shù)的大語言模型用于大規(guī)模部署和管理機(jī)器學(xué)習(xí)模型。借助LLaMA,組織可以高效地在大型數(shù)據(jù)集上訓(xùn)練和部署模型,縮短投放市場(chǎng)的時(shí)間,并提高預(yù)測(cè)模型的準(zhǔn)確性。

    2024年02月11日
    瀏覽(20)
  • 云計(jì)算:如何訪問和分析大規(guī)模數(shù)據(jù)

    作者:禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 隨著云計(jì)算平臺(tái)的不斷發(fā)展,越來越多的企業(yè)將他們的數(shù)據(jù)、應(yīng)用和服務(wù)部署在云端,希望借助云計(jì)算的能力來提升效率、降低成本、提高競(jìng)爭(zhēng)力。但是同時(shí)也帶來了數(shù)據(jù)安全、隱私保護(hù)、數(shù)據(jù)可靠性等方面的挑戰(zhàn)。對(duì)于企業(yè)而言,如何更好地

    2024年02月15日
    瀏覽(21)
  • etcd實(shí)現(xiàn)大規(guī)模服務(wù)治理應(yīng)用實(shí)戰(zhàn)

    etcd實(shí)現(xiàn)大規(guī)模服務(wù)治理應(yīng)用實(shí)戰(zhàn)

    ???? 導(dǎo)讀 :服務(wù)治理目前越來越被企業(yè)建設(shè)所重視,特別現(xiàn)在云原生,微服務(wù)等各種技術(shù)被更多的企業(yè)所應(yīng)用,本文內(nèi)容是百度小程序團(tuán)隊(duì)基于大模型服務(wù)治理實(shí)戰(zhàn)經(jīng)驗(yàn)的一些總結(jié),同時(shí)結(jié)合當(dāng)前較火的分布式開源kv產(chǎn)品etcd,不僅會(huì)深入剖析ectd兩大核心技術(shù)Raft與boltdb的實(shí)

    2024年02月12日
    瀏覽(20)
  • 利用Python進(jìn)行大規(guī)模數(shù)據(jù)處理

    利用Python進(jìn)行大規(guī)模數(shù)據(jù)處理

    前些天發(fā)現(xiàn)了一個(gè)巨牛的人工智能學(xué)習(xí)網(wǎng)站,通俗易懂,風(fēng)趣幽默,忍不住分享一下給大家?!军c(diǎn)擊進(jìn)入巨牛的人工智能學(xué)習(xí)網(wǎng)站】。 隨著數(shù)據(jù)量的不斷增長(zhǎng),大規(guī)模數(shù)據(jù)處理變得越來越重要。在這個(gè)領(lǐng)域,Hadoop和Spark是兩個(gè)備受關(guān)注的技術(shù)。本文將介紹如何利用Python編程語

    2024年04月24日
    瀏覽(24)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包