国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

阿里云推出第八代企業(yè)級(jí)實(shí)例 g8i:AI 推理性能最高提升 7 倍、可支持 72B 大語(yǔ)言模型

這篇具有很好參考價(jià)值的文章主要介紹了阿里云推出第八代企業(yè)級(jí)實(shí)例 g8i:AI 推理性能最高提升 7 倍、可支持 72B 大語(yǔ)言模型。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

云布道師

1 月 11 日,全球領(lǐng)先的云計(jì)算廠商阿里云宣布推出第八代企業(yè)級(jí)通用計(jì)算實(shí)例 ECS g8i,這也是國(guó)內(nèi)首款搭載第五代英特爾至強(qiáng)可擴(kuò)展處理器(代號(hào) EMR)的云計(jì)算產(chǎn)品。依托阿里云自研的「飛天+CIPU」架構(gòu)體系,ECS g8i 實(shí)例的整機(jī)性能最高提升 85%,AI 推理性能最高提升 7 倍,可支撐高達(dá) 72B 參數(shù)的大語(yǔ)言模型,為 AI 提速,同時(shí)新實(shí)例還提供了端到端安全防護(hù),為企業(yè)構(gòu)建可信 AI 應(yīng)用提供強(qiáng)有力的隱私增強(qiáng)算力支撐。

通用算力再提升,整機(jī)性能提升 85%

作為企業(yè)級(jí)通用計(jì)算實(shí)例,ECS g8i 實(shí)例在計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)和安全等能力得到了全方位提升。從關(guān)鍵參數(shù)上看,ECS g8i 實(shí)例的 L3 緩存容量提升到 320MB,內(nèi)存速率高達(dá) 5600MT/s,整機(jī)性能提升 85%,單核性能提升 25%;存儲(chǔ)方面,ESSD 云盤提供 100萬(wàn) IOPS,全面搭載 NVMe,存儲(chǔ)延遲低至百微秒;網(wǎng)絡(luò)方面,PPS 高達(dá) 3000 萬(wàn),標(biāo)配阿里云自研 eRDMA 大規(guī)模加速能力,時(shí)延低至 8 微秒;安全方面,ECS g8i 實(shí)例支持可信計(jì)算與加密計(jì)算等特性,全球率先支持機(jī)密虛擬機(jī) TDX 技術(shù),構(gòu)建了全面的安全防護(hù)。阿里云推出第八代企業(yè)級(jí)實(shí)例 g8i:AI 推理性能最高提升 7 倍、可支持 72B 大語(yǔ)言模型,阿里云
在 E2E 場(chǎng)景下,ECS g8i 實(shí)例可將 MySQL 性能提升最高達(dá) 60%,Redis 和 Nginx 的性能分別提升 40% 和 24%,面向游戲、視頻直播、電商、金融、醫(yī)療、企業(yè)服務(wù)等行業(yè)提供強(qiáng)勁的算力支持,滿足其在數(shù)據(jù)庫(kù)、大數(shù)據(jù)、AI 推理等應(yīng)用場(chǎng)景下對(duì)性能的嚴(yán)苛要求。

此外,ECS g8i 實(shí)例還提供了多種硬件原生加速能力,包括 QAT 和 IAA 等加速器。阿里云通過(guò)自研技術(shù),將硬件加速能力更細(xì)顆粒度透?jìng)髦翆?shí)例虛擬機(jī),小規(guī)格的 ECS g8i 實(shí)例也同樣具備加速能力。其中,依托于 QAT 原生加解密加速器,ECS g8i 實(shí)例在壓縮/解壓縮場(chǎng)景下性能最大可提升 70 倍,加解密性能提升 4 倍以上。

為 AI 提速,可支撐 72B 參數(shù)的大語(yǔ)言模型

生成式 AI 掀起的技術(shù)革命,正在推動(dòng)計(jì)算范式發(fā)生根本性的變化。當(dāng)前,AI 大模型推理在算力上依然面臨諸多挑戰(zhàn),例如首包延遲受限于并行處理能力與浮點(diǎn)運(yùn)算能力,吞吐性能則受限于內(nèi)存帶寬和網(wǎng)絡(luò)延遲。

阿里云 ECS g8i 實(shí)例針對(duì)這些難題都進(jìn)行了相當(dāng)程度的優(yōu)化,包括內(nèi)置指令集從AVX512 升級(jí)到了 Intel AMX 高級(jí)矩陣擴(kuò)展加速技術(shù),可讓生成式 AI 更快地運(yùn)行。相對(duì)于 AVX512 指令集,啟用 AMX AI 加速后,ECS g8i 實(shí)例在 int 8 矩陣計(jì)算的性能最高提升 7 倍。
阿里云推出第八代企業(yè)級(jí)實(shí)例 g8i:AI 推理性能最高提升 7 倍、可支持 72B 大語(yǔ)言模型,阿里云
基于 AMX AI 加速能力,g8i 可更迅速地響應(yīng)中小規(guī)模參數(shù)模型,運(yùn)行知識(shí)檢索、問(wèn)答系統(tǒng)及摘要生成等 AI 工作負(fù)載時(shí),起建成本相比 A10 GPU 云服務(wù)器下降50%。此外,配合阿里云平臺(tái)的 Spot 搶占式實(shí)例,成本優(yōu)勢(shì)將進(jìn)一步凸顯,進(jìn)一步降低 AI 推理成本。

對(duì)于超大規(guī)模參數(shù)的模型來(lái)講,通常會(huì)通過(guò)模型并行、流水線并行切分到 AI 集群,這個(gè)時(shí)候網(wǎng)絡(luò)通訊成了主要的性能瓶頸。基于阿里云自研的 eRDMA 超低延時(shí)彈性網(wǎng)絡(luò),ECS g8i 實(shí)例集群擁有超低延時(shí)網(wǎng)絡(luò)和高彈性優(yōu)勢(shì),可輕松支撐 72B 參數(shù)級(jí)別的大語(yǔ)言模型分布式推理,推理性能隨集群規(guī)模接近線性加速,并可支持超過(guò)32batchsize 的超大參數(shù)規(guī)模的 AI 模型負(fù)載,運(yùn)行文生圖、AI 生成代碼、虛擬助手以及創(chuàng)意輔助工具等 AI 工作負(fù)載。
阿里云推出第八代企業(yè)級(jí)實(shí)例 g8i:AI 推理性能最高提升 7 倍、可支持 72B 大語(yǔ)言模型,阿里云
以阿里云開源的 Qwen-72B 大模型為例,可在 g8i 實(shí)例 eRDMA 網(wǎng)絡(luò)構(gòu)建的集群實(shí)現(xiàn)高效運(yùn)行,在輸入小于 500 字情況下,首包延時(shí)小于 3 秒,每秒可生成 7 個(gè)Token。

為安全加碼,助力企業(yè)構(gòu)建可信 AI 應(yīng)用

長(zhǎng)久以來(lái),云廠商一直在不遺余力提升數(shù)據(jù)的隱私保護(hù)和安全性,AI 時(shí)代尤為明顯?;谧匝械?CIPU,阿里云在全產(chǎn)品線構(gòu)建了端到端的安全防護(hù),可保障數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)傳輸、數(shù)據(jù)計(jì)算的全流程安全。在最底層,基于 CIPU 的安全架構(gòu)搭載安全芯片 TPM 作為硬件可信根,實(shí)現(xiàn)服務(wù)器的可信啟動(dòng),確保零篡改;虛擬化層面,支持虛擬可信能力 vTPM,提供實(shí)例啟動(dòng)過(guò)程核心組件的校驗(yàn)?zāi)芰?;在?shí)例可信的基礎(chǔ)上支持不同平臺(tái)的機(jī)密計(jì)算能力,實(shí)現(xiàn)了運(yùn)行態(tài)的內(nèi)存數(shù)據(jù)隔離和加密的保護(hù)。
阿里云推出第八代企業(yè)級(jí)實(shí)例 g8i:AI 推理性能最高提升 7 倍、可支持 72B 大語(yǔ)言模型,阿里云
值得一提的是,此次升級(jí)的 ECS g8i 實(shí)例全量支持 Trust Domain Extension TDX 技術(shù)能力,業(yè)務(wù)應(yīng)用無(wú)需更改,即可部署到 TEE 之中,極大降低了技術(shù)門檻,并以極低的性能損耗為大模型等 AI 應(yīng)用提供隱私增強(qiáng)算力,護(hù)航大模型的云上數(shù)據(jù)安全。
阿里云推出第八代企業(yè)級(jí)實(shí)例 g8i:AI 推理性能最高提升 7 倍、可支持 72B 大語(yǔ)言模型,阿里云
以 Qwen-Chat-7B 模型為例,啟用 TDX 后,既確保了模型推理的安全可信,也保護(hù)了數(shù)據(jù)的機(jī)密性和完整性。
阿里云推出第八代企業(yè)級(jí)實(shí)例 g8i:AI 推理性能最高提升 7 倍、可支持 72B 大語(yǔ)言模型,阿里云文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-823294.html

到了這里,關(guān)于阿里云推出第八代企業(yè)級(jí)實(shí)例 g8i:AI 推理性能最高提升 7 倍、可支持 72B 大語(yǔ)言模型的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 阿里云實(shí)時(shí)計(jì)算企業(yè)級(jí)狀態(tài)存儲(chǔ)引擎 Gemini 技術(shù)解讀

    阿里云實(shí)時(shí)計(jì)算企業(yè)級(jí)狀態(tài)存儲(chǔ)引擎 Gemini 技術(shù)解讀

    本文整理自阿里云 Flink 存儲(chǔ)引擎團(tuán)隊(duì)李晉忠,蘭兆千,梅源關(guān)于阿里云實(shí)時(shí)計(jì)算企業(yè)級(jí)狀態(tài)存儲(chǔ)引擎 Gemini 的研究,內(nèi)容主要分為以下五部分: 流計(jì)算狀態(tài)訪問(wèn)的痛點(diǎn) 企業(yè)級(jí)狀態(tài)存儲(chǔ)引擎 GeminiGemini 性能評(píng)測(cè)線上表現(xiàn) 結(jié)語(yǔ) 參考 Flink 作為有狀態(tài)的流計(jì)算系統(tǒng),狀態(tài)存儲(chǔ)引擎在

    2024年02月03日
    瀏覽(60)
  • 阿里云的云存儲(chǔ)服務(wù)OSS可以支持哪些企業(yè)級(jí)存儲(chǔ)需求?如何操作和管理?

    ?阿里云OSS滿足企業(yè)級(jí)存儲(chǔ)需求 阿里云對(duì)象存儲(chǔ)服務(wù)(Object Storage Service, OSS)為企業(yè)提供高效、可靠且安全的云端存儲(chǔ)解決方案。以下是阿里云OSS能夠支持的一些關(guān)鍵企業(yè)級(jí)存儲(chǔ)需求: ?1. 數(shù)據(jù)備份與歸檔 阿里云OSS通過(guò)自動(dòng)化的備份策略,確保數(shù)據(jù)上傳、更新及刪除時(shí)始終有

    2024年02月09日
    瀏覽(31)
  • 企業(yè)級(jí)DevOps實(shí)戰(zhàn)

    Zookeeper(動(dòng)物管理員)是一個(gè)開源的分布式協(xié)調(diào)服務(wù),目前由Apache進(jìn)行維護(hù)。 MQ概念 MQ(消息隊(duì)列)是一種應(yīng)用程序之間的通信方法,應(yīng)用程序通過(guò)讀寫出入隊(duì)列的消息(針對(duì)應(yīng)用程序的數(shù)據(jù))通信,而無(wú)須專用連接。 MQ是一種先進(jìn)先出的數(shù)據(jù)結(jié)構(gòu),是指把要傳輸?shù)臄?shù)據(jù)(消

    2024年02月20日
    瀏覽(24)
  • git企業(yè)級(jí)使用

    git企業(yè)級(jí)使用

    1.初始Git 1.1創(chuàng)建Git倉(cāng)庫(kù) 要提前說(shuō)的是,倉(cāng)庫(kù)是進(jìn)?版本控制的?個(gè)?件?錄。我們要想對(duì)?件進(jìn)?版本控制,就必須先創(chuàng)建?個(gè)倉(cāng)庫(kù)出來(lái)。創(chuàng)建?個(gè)Git本地倉(cāng)庫(kù)對(duì)應(yīng)的命令為 git init ,注意命令要在?件?錄下執(zhí)?,例如: 剛創(chuàng)建的git倉(cāng)庫(kù)會(huì)有一個(gè)隱藏文件? .git這個(gè)文件不能

    2024年02月10日
    瀏覽(25)
  • 企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)-理論知識(shí)

    企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)-理論知識(shí)

    大數(shù)據(jù)中間件 Hive:將SQL轉(zhuǎn)化成分布式Map/Reduce進(jìn)行運(yùn)算,也支持轉(zhuǎn)換成Spark,需要單獨(dú)安裝Hive集群才能訪問(wèn)Spark,支持60%的SQL,延遲比較大。 SparkSQL:屬于Spark生態(tài)圈,Hive on Sqark。 HBase: NoSQL,高并發(fā)讀,適合表結(jié)構(gòu)頻繁變動(dòng)。 Impala: MPP架構(gòu)的數(shù)據(jù)查詢引擎,低層兼容Hive、Spark SQL,

    2024年02月07日
    瀏覽(28)
  • SpringMVC:企業(yè)級(jí)解讀(一)

    ? 此文章意在為大家更加深入的了解SpringMVC,但是沒有涉及到源碼層面,如果大家想要觀看這部分的文章,希望大家能夠給我點(diǎn)贊、收藏加關(guān)注,我們繼續(xù)加更源碼級(jí)別的SpringMVC文章 如果沒有了解SpringMVC框架的朋友,建議大家觀看我的上一篇文章 SpringMVC框架:基礎(chǔ)萬(wàn)字詳解

    2024年01月23日
    瀏覽(36)
  • 詳述Hive企業(yè)級(jí)優(yōu)化

    一、問(wèn)題背景 hive離線數(shù)倉(cāng)開發(fā),一個(gè)良好的數(shù)據(jù)任務(wù),它的運(yùn)行時(shí)長(zhǎng)一般是在合理范圍內(nèi)的,當(dāng)發(fā)現(xiàn)報(bào)表應(yīng)用層的指標(biāo)數(shù)據(jù)總是產(chǎn)出延遲,排查定位發(fā)現(xiàn)是有些任務(wù)執(zhí)行了超10小時(shí)這樣肯定是不合理的,此時(shí)就該想想如何優(yōu)化數(shù)據(jù)任務(wù)鏈路, 主要從以下幾個(gè)角度來(lái)考慮問(wèn)題

    2024年02月16日
    瀏覽(22)
  • Git---企業(yè)級(jí)開發(fā)模型

    Git---企業(yè)級(jí)開發(fā)模型

    我們知道,一個(gè)軟件從零開始到最終交付,大概包括一下幾個(gè)階段 : 規(guī)劃、編碼、構(gòu)建、測(cè)試、發(fā)布、部署和維護(hù). 最初程序比較簡(jiǎn)單,工作量也不大.程序猿一個(gè)人可以完成所有階段的工作.但隨著軟件產(chǎn)業(yè)的日益發(fā)展壯大,軟件的規(guī)模也在逐漸變得龐大.軟件的復(fù)雜度不斷攀升,一個(gè)

    2024年02月13日
    瀏覽(17)
  • Go 企業(yè)級(jí)gRPC原理

    Go 企業(yè)級(jí)gRPC, 又名:Go企業(yè)級(jí)應(yīng)用到底層開發(fā)(第5天) 這個(gè)系列是準(zhǔn)備做從go基礎(chǔ)到Web開發(fā),系統(tǒng)編程,云原生應(yīng)用, 網(wǎng)絡(luò)編程, 工具和腳本開發(fā), 機(jī)器學(xué)習(xí),CGo編程, 還有最后的編譯器層級(jí)底層的分析,點(diǎn)上關(guān)注,方便每天閱讀 一鍵三連是我最大的動(dòng)力。謝謝~~ gRPC簡(jiǎn)介

    2024年01月24日
    瀏覽(16)
  • ELK 企業(yè)級(jí)日志分析系統(tǒng)

    ELK 企業(yè)級(jí)日志分析系統(tǒng)

    ELK平臺(tái)是一套完整的日志集中處理解決方案,將 ElasticSearch、Logstash 和 Kiabana 三個(gè)開源工具配合使用, 完成更強(qiáng)大的用戶對(duì)日志的查詢、排序、統(tǒng)計(jì)需求。 ●ElasticSearch:是基于Lucene(一個(gè)全文檢索引擎的架構(gòu))開發(fā)的分布式存儲(chǔ)檢索引擎,用來(lái)存儲(chǔ)各類日志。 Elasticsearch 是

    2024年02月07日
    瀏覽(24)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包