国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

阿里云通義千問14B模型開源!性能超越Llama2等同等尺寸模型

這篇具有很好參考價(jià)值的文章主要介紹了阿里云通義千問14B模型開源!性能超越Llama2等同等尺寸模型。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

9月25日,阿里云開源通義千問140億參數(shù)模型Qwen-14B及其對(duì)話模型Qwen-14B-Chat,免費(fèi)可商用。Qwen-14B在多個(gè)權(quán)威評(píng)測(cè)中超越同等規(guī)模模型,部分指標(biāo)甚至接近Llama2-70B。阿里云此前開源了70億參數(shù)模型Qwen-7B等,一個(gè)多月下載量破100萬,成為開源社區(qū)的口碑之作。

Qwen-14B是一款支持多種語言的高性能開源模型,相比同類模型使用了更多的高質(zhì)量數(shù)據(jù),整體訓(xùn)練數(shù)據(jù)超過3萬億Token,使得模型具備更強(qiáng)大的推理、認(rèn)知、規(guī)劃和記憶能力。Qwen-14B最大支持8k的上下文窗口長度。

阿里云通義千問14B模型開源!性能超越Llama2等同等尺寸模型,阿里云,開源,云計(jì)算

圖1:Qwen-14B在十二個(gè)權(quán)威測(cè)評(píng)中全方位超越同規(guī)模SOTA大模型

Qwen-14B-Chat是在基座模型上經(jīng)過精細(xì)SFT得到的對(duì)話模型。借助基座模型強(qiáng)大性能,Qwen-14B-Chat生成內(nèi)容的準(zhǔn)確度大幅提升,也更符合人類偏好,內(nèi)容創(chuàng)作上的想象力和豐富度也有顯著擴(kuò)展。

Qwen擁有出色的工具調(diào)用能力,能讓開發(fā)者更快地構(gòu)建基于Qwen的Agent(智能體)。開發(fā)者可用簡單指令教會(huì)Qwen使用復(fù)雜工具,比如使用Code Interpreter工具執(zhí)行Python代碼以進(jìn)行復(fù)雜的數(shù)學(xué)計(jì)算、數(shù)據(jù)分析、圖表繪制等;還能開發(fā)具有多文檔問答、長文寫作等能力的“高級(jí)數(shù)字助理”。

百億以內(nèi)參數(shù)級(jí)別大語言模型是目前開發(fā)者進(jìn)行應(yīng)用開發(fā)和迭代的主流選擇, Qwen-14B進(jìn)一步提高了小尺寸模型的性能上限,從眾多同尺寸模型中沖出重圍,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12個(gè)權(quán)威測(cè)評(píng)中取得最優(yōu)成績,超越所有測(cè)評(píng)中的SOTA(State-Of-The-Art)大模型,也全面超越Llama-2-13B,比起Llama 2的34B、70B模型也并不遜色。與此同時(shí),Qwen-7B也全新升級(jí),核心指標(biāo)最高提升22.5%。

阿里云通義千問14B模型開源!性能超越Llama2等同等尺寸模型,阿里云,開源,云計(jì)算

圖2:Qwen-14B性能超越同尺寸模型

用戶可從魔搭社區(qū)直接下載模型,也可通過阿里云靈積平臺(tái)訪問和調(diào)用Qwen-14B和Qwen-14B-Chat。阿里云為用戶提供包括模型訓(xùn)練、推理、部署、精調(diào)等在內(nèi)的全方位服務(wù)。

8月,阿里云開源通義千問70億參數(shù)基座模型Qwen-7B,先后沖上HuggingFace、Github的trending榜單。短短一個(gè)多月,累計(jì)下載量突破100萬。開源社區(qū)出現(xiàn)了50多個(gè)基于Qwen的模型,社區(qū)多個(gè)知名的工具和框架都集成了Qwen。

阿里云通義千問14B模型開源!性能超越Llama2等同等尺寸模型,阿里云,開源,云計(jì)算

通義千問是落地最深、應(yīng)用最廣的中國大模型,國內(nèi)已有多個(gè)月活過億的應(yīng)用接入通義千問,大量中小企業(yè)、科研機(jī)構(gòu)和個(gè)人開發(fā)者都在基于通義千問開發(fā)專屬大模型或應(yīng)用產(chǎn)品,如阿里系的淘寶、釘釘、未來精靈,以及外部的科研機(jī)構(gòu)、創(chuàng)業(yè)企業(yè)。

浙江大學(xué)聯(lián)合高等教育出版社基于Qwen-7B開發(fā)了智海-三樂教育垂直大模型,已在全國12所高校應(yīng)用,可提供智能問答、試題生成、學(xué)習(xí)導(dǎo)航、教學(xué)評(píng)估等能力,模型已在阿里云靈積平臺(tái)對(duì)外提供服務(wù),一行代碼即可調(diào)用;浙江有鹿機(jī)器人科技有限公司在路面清潔機(jī)器人中集成了Qwen-7B,使機(jī)器人能以自然語言與用戶進(jìn)行實(shí)時(shí)交互,理解用戶提出的需求,將用戶的高層指令進(jìn)行分析和拆解,做高層的邏輯分析和任務(wù)規(guī)劃,完成清潔任務(wù)。

阿里云CTO周靖人表示,阿里云將持續(xù)擁抱開源開放,推動(dòng)中國大模型生態(tài)建設(shè)。阿里云篤信開源開放的力量,率先開源自研大模型,希望讓大模型技術(shù)更快觸達(dá)中小企業(yè)和個(gè)人開發(fā)者。

阿里云還牽頭建設(shè)了中國最大的AI模型開源社區(qū)魔搭ModelScope,團(tuán)結(jié)全行業(yè)的力量,共同推動(dòng)大模型技術(shù)普惠和應(yīng)用落地。過去兩個(gè)月內(nèi),魔搭社區(qū)的模型下載量從4500萬飆升到8500萬,增幅接近100%。

附:

魔搭社區(qū)模型地址:

https://www.modelscope.cn/models/qwen/Qwen-14B-Chat/summary

https://www.modelscope.cn/models/qwen/Qwen-14B/summary

魔搭社區(qū)模型體驗(yàn):

https://modelscope.cn/studios/qwen/Qwen-14B-Chat-Demo/summary

阿里云靈積平臺(tái)地址:

https://help.aliyun.com/zh/dashscope/developer-reference/tongyi-qianwen-7b-14b-api-detailes

https://dashscope.console.aliyun.com/model

Qwen論文地址:

https://qianwen-res.oss-cn-beijing.aliyuncs.com/QWEN_TECHNICAL_REPORT.pdf

Github:

https://github.com/QwenLM/Qwen

HuggingFace:

https://huggingface.co/Qwen/Qwen-14B

https://huggingface.co/Qwen/Qwen-14B-Chat文章來源地址http://www.zghlxwxcb.cn/news/detail-714099.html

到了這里,關(guān)于阿里云通義千問14B模型開源!性能超越Llama2等同等尺寸模型的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 一周 AIGC 丨蘋果下架多款 AIGC 應(yīng)用,阿里云開源通義千問 70 億參數(shù)模型

    一周 AIGC 丨蘋果下架多款 AIGC 應(yīng)用,阿里云開源通義千問 70 億參數(shù)模型

    多個(gè) AIGC 應(yīng)用在蘋果應(yīng)用商店下架,包含數(shù)據(jù)采集和使用不夠規(guī)范等問題。阿里云開源通義千問 70 億參數(shù)模型,包括通用模型 Qwen-7 B 和對(duì)話模型 Qwen-7 B-Chat。騰訊混元大模型開始應(yīng)用內(nèi)測(cè),內(nèi)部多個(gè)業(yè)務(wù)線接入測(cè)試。百度智能云“千帆大模型平臺(tái)”升級(jí),接入 LLaMA2 等 33 個(gè)模

    2024年02月14日
    瀏覽(20)
  • 阿里云通義千問開源第二波!大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū)

    阿里云通義千問開源第二波!大規(guī)模視覺語言模型Qwen-VL上線魔搭社區(qū)

    通義千問開源第二波!8月25日消息,阿里云推出大規(guī)模視覺語言模型Qwen-VL,一步到位、直接開源。Qwen-VL以通義千問70億參數(shù)模型Qwen-7B為基座語言模型研發(fā),支持圖文輸入,具備多模態(tài)信息理解能力。在主流的多模態(tài)任務(wù)評(píng)測(cè)和多模態(tài)聊天能力評(píng)測(cè)中,Qwen-VL取得了遠(yuǎn)超同等規(guī)

    2024年02月11日
    瀏覽(26)
  • 阿里通義千問開源 320 億參數(shù)模型;文字和音頻自動(dòng)翻譯成手語Hand Talk拉近人與人的距離

    阿里通義千問開源 320 億參數(shù)模型;文字和音頻自動(dòng)翻譯成手語Hand Talk拉近人與人的距離

    ? 1: Qwen1.5-32B Qwen1.5-32B是Qwen1.5系列中性能與效率兼顧的最新語言模型,內(nèi)存占用低,運(yùn)行速度快。 Qwen1.5-32B是Qwen1.5語言模型系列的最新成員,這個(gè)模型是基于先進(jìn)的技術(shù)研發(fā)的,旨在提供一種既高效又經(jīng)濟(jì)的AI語言理解和生成工具。 Qwen1.5-32B是一款既高效又經(jīng)濟(jì)實(shí)惠的語言模

    2024年04月12日
    瀏覽(28)
  • 阿里云“通義千問”開源,可免費(fèi)商用

    阿里云“通義千問”開源,可免費(fèi)商用

    我是盧松松,點(diǎn)點(diǎn)上面的頭像,歡迎關(guān)注我哦! 阿里云成為國內(nèi)首個(gè)加入大模型開源行列的大型科技企業(yè)。就在昨天,阿里云公開表態(tài),把自家的通義千問大模型開源。 阿里云把通用70億參數(shù)模型,包括Qwen-7B和對(duì)話模型Qwen-7B-Chat這兩款大模型產(chǎn)品給開源了。需要注意的是,

    2024年02月13日
    瀏覽(22)
  • 【通義千問】繼ChatGPT爆火后,阿里云的大模型“通義千問”它終于來了

    【通義千問】繼ChatGPT爆火后,阿里云的大模型“通義千問”它終于來了

    通義千問 顧名思義,通順流暢的語句可以回答成千上萬的問題。這個(gè)名字來源于兩個(gè)方面: “ 通義 ”意味著該模型具有廣泛的知識(shí)和普適性,可以理解和回答各種領(lǐng)域的問題。作為一個(gè)大型預(yù)訓(xùn)練語言模型,“通義千問”在訓(xùn)練過程中學(xué)習(xí)了大量的文本數(shù)據(jù),從而具備了跨

    2023年04月13日
    瀏覽(52)
  • 阿里云發(fā)布通義千問2.0,性能超GPT-3.5,加速追趕GPT-4

    阿里云發(fā)布通義千問2.0,性能超GPT-3.5,加速追趕GPT-4

    10月31日,阿里云正式發(fā)布千億級(jí)參數(shù)大模型通義千問2.0 。 在 10 個(gè)權(quán)威測(cè)評(píng)中, 通義千問2.0綜合性能 超過GPT-3.5,正在加速追趕GPT-4。當(dāng)天,通義千問APP在各大手機(jī)應(yīng)用市場(chǎng)正式上線,所有人都可通過APP直接體驗(yàn)最新模型能力。 過去6個(gè)月, 通義千問2.0在性能上取得巨大飛躍

    2024年02月06日
    瀏覽(11)
  • 提前預(yù)體驗(yàn)阿里大模型“通義千問”的方法來了!

    提前預(yù)體驗(yàn)阿里大模型“通義千問”的方法來了!

    隨著AI大模型的浪潮席卷全球,如今的AI技術(shù)已經(jīng)顛覆了大家對(duì)傳統(tǒng)AI的認(rèn)識(shí),微軟更是用瀏覽器與搜索引擎上的實(shí)踐,證明了當(dāng)今的AI技術(shù)具備打破行業(yè)格局的能力。 對(duì)于我們應(yīng)用開發(fā)者來說,AI基建的建設(shè)與競爭是無法參與的,但在AI的應(yīng)用領(lǐng)域依然大有可為!目前,國內(nèi)各

    2024年02月09日
    瀏覽(27)
  • 阿里發(fā)布通義千問!1行代碼,免費(fèi)對(duì)話GPT大模型

    阿里發(fā)布通義千問!1行代碼,免費(fèi)對(duì)話GPT大模型

    大家好,這里是程序員晚?xiàng)?,今天給大家分享一個(gè)好用的東西??1行代碼,使用阿里的GPT聊天大模型:通義千問。 GPT剛推出的時(shí)候,百度推出了文心一言、騰訊推出了混元大模型,阿里一直沒動(dòng)靜。 自從馬云回歸,阿里的大模型也開始發(fā)力了,推出了自己的大模型:通義千問

    2024年01月22日
    瀏覽(26)
  • 使用開源通義千問模型(Qwen)搭建自己的大模型服務(wù)

    使用開源通義千問模型(Qwen)搭建自己的大模型服務(wù)

    1、使用開源的大模型服務(wù)搭建屬于自己的模型服務(wù); 2、調(diào)優(yōu)自己的大模型; 采用通義千問模型,https://github.com/QwenLM/Qwen 1、下載模型文件 開源模型庫:https://www.modelscope.cn/models 2、下載使用docker 鏡像 3、啟動(dòng)腳本 https://github.com/QwenLM/Qwen/blob/main/docker/docker_web_demo.sh 4、運(yùn)行 訪

    2024年02月01日
    瀏覽(30)
  • 最強(qiáng)開源中英雙語大模型發(fā)布,340億參數(shù)超越Llama2-70B !

    最強(qiáng)開源中英雙語大模型發(fā)布,340億參數(shù)超越Llama2-70B !

    ? ? Aquila2模型全系開源地址: https://github.com/FlagAI-Open/Aquila2 https://model.baai.ac.cn/ https://huggingface.co/BAAI Aquila2-34B在代碼生成、考試、理解、推理、語言四個(gè)維度的22個(gè)評(píng)測(cè)基準(zhǔn)上,霸占了多個(gè)榜單TOP 1。 ?相較于大模型榜單分?jǐn)?shù),業(yè)內(nèi)更看重對(duì)推理、泛化等重要模型實(shí)際能力的

    2024年01月24日
    瀏覽(36)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包