国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520

這篇具有很好參考價值的文章主要介紹了2023年Arm最新處理器架構(gòu)分析——X4、A720和A520。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

1、引言

上一篇文章我們介紹了Arm的Cortex-X1至Cortex-X3系列處理器,2023年的5月底,Arm如期發(fā)布了新一年的處理器架構(gòu),分別為超級大核心Cortex-X4,大核心A720和小核心A520。在智能手機行業(yè),Arm始終保持每年一迭代的處理器架構(gòu)升級節(jié)奏,讓用戶可以不斷體驗到最先進的產(chǎn)品設(shè)計。本文主要介紹了2023年的新處理器架構(gòu)的變化,重點分析變化較大的Cortex-X4核心,并探討今年核心處理器架構(gòu)有哪些值得關(guān)注的改變。

2、整體介紹

從Arm的宣傳數(shù)據(jù)可以看出,今年的三款處理機架構(gòu)側(cè)重點有所不同,Cortex-X4主打性能提升,相比上一代Cortex-X3提升15%的性能,A720和A520則偏重能效改善,相比上一代A715和A520分別改善20%和22%的能效。值得注意的是今年的處理器沒有升級工藝,這些數(shù)據(jù)應(yīng)該是基于相同工藝計算而來的(例如TSMC 4nm)。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

除了新的處理機架構(gòu),Arm在今年還帶來了全新的Armv9.2指令集,包括新的QARMA3 PAC算法、浮點能力增加和PMU增強等,最關(guān)鍵的變化是今年Arm計劃完全拋棄32bit應(yīng)用的支持,三個新的核心均不兼容32bit應(yīng)用。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

今年Arm還更新了DSU120模塊,用來更好管理處理器核心之間的數(shù)據(jù),并支持最多達14核心和最多32MB的L3緩存設(shè)計。從下面這張圖可以看出來,今年的處理器設(shè)計也有明顯變化,去年高通8Gen2處理器采用了1+4+3架構(gòu),今年我們會看到更少小核心的1+5+2架構(gòu)(參考鏈接3,高通8Gen3處理器),多核心性能有大幅度提升。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

3、Cortex-X4微架構(gòu)分析

Cortex-X4的代號是Hunter-ELP,下圖是X4的微架構(gòu)圖,第一感覺是變“大”了,X4的核心變得越來越大,如果大家看過前幾篇文章,應(yīng)該可以感覺到這個微架構(gòu)設(shè)計越來越像另外一款行業(yè)領(lǐng)先處理器,殊途同歸,最優(yōu)秀的設(shè)計往往只有一個選擇,下面我們會詳分析今年的核心改變。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

在前端設(shè)計上,X4取消了L0級別的MOP Cache,注意這個變化從大核心A715就開始了,這是一個大的改變,也側(cè)面說明MOP Cache的成本可能真的很高,在先進工藝中不經(jīng)濟。為了彌補取消MOP Cache的影響,X4這次將Decoder的數(shù)量從6個增加到了10個。上一代X3,如果從MOP Cache取數(shù)據(jù)是8-wide,從L1取數(shù)據(jù)是6-wide,這次的X4則統(tǒng)一是10-wide。在流水線長度上,X3如果從L1取數(shù)據(jù)是11級,從MOP取數(shù)據(jù)是9級,這次由于取消了MOP,X4特意優(yōu)化了流水線,從L1取數(shù)據(jù)從11級降到了10級。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

在后端設(shè)計上這次X4同樣變化不少,特別是運算單元,增加了1個新的Branch單元,2個新的ALU單元,并且提供了第二個完整的 MAC ALU單元,這些對于整體性能的提升都有顯著幫助。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

為了支撐新增的10個decoder和運算單元,X4的重排序緩沖(ROB)的尺寸也從320提升到384,提升了20%。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

在存儲模塊方面,Arm重新調(diào)整了Load和Store單元的數(shù)量,X3有個LS AGU和1個LD AGU,X4則調(diào)整為1個 LS AGU,2個LD AGU和1個ST AGU。從3個AGU提升到4個AGU,但是功能稍有差異。此外,像L1的d-TLB,也從48提升到了96,增強了數(shù)據(jù)的處理能力。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

這次X4核心還有一個特點是支持更大的L2緩存,從X3的最大支持1MB提升到X4最大支持2MB,根據(jù)Arm給出的數(shù)據(jù)顯示,2MB的L2緩存可以有效降低每千條指令的重填充和寫回率,不過由于增加緩存會增加成本,不一定所有廠商都愿意增加到最大的緩存尺寸。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

從X4的整體性能數(shù)據(jù)看,Sepcint2K7提升達到了2位數(shù),Geekbench系列的提升在6-8%之間,只有個位數(shù)的提升,推測Geekbench對于L2不是很敏感,而對于L2緩存依賴的Sppdometer2這個benchmark提升比較明顯,注意這里面的測試數(shù)據(jù)使用2MB的L2測試得出的。

此外Arm資料顯示X4的典型CPU頻率可以跑到3.4G左右,雖然廠商實際處理器頻率還沒有確認,但是從上一代天璣9200+運行在3.35G推測,3.4G應(yīng)該是4nm能達到的一個比較高的頻率水平。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

總結(jié)下Cortex-X4的關(guān)鍵改變:

1、取消了MOP Cache;

2、Decoder數(shù)量從6個提升到10個;

3、流水線統(tǒng)一為10級;

4、Branch單元從2個提升到3個;

5、ALU單元從6個提升到8個;

6、AGU單元增加了一個且功能有調(diào)整;

7、ROB尺寸從320提升到384;

8、L1的d-TLB從48提升到96;

9、最大支持的L2緩存從1MB提升到2MB;

10、不支持32bit。

整體性能上Sepcint2K7參數(shù)有13%-14%的提升。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

?資料直通車:Linux內(nèi)核源碼技術(shù)學習路線+視頻教程內(nèi)核源碼

學習直通車:Linux內(nèi)核源碼內(nèi)存調(diào)優(yōu)文件系統(tǒng)進程管理設(shè)備驅(qū)動/網(wǎng)絡(luò)協(xié)議棧

4、A720微架構(gòu)分析

上一節(jié)我們列舉了10條X4內(nèi)核的微架構(gòu)變化,相比X4的大動作,A720和A520的變化則沒有那么大,但也有些值得我們研究和探討。

首先我們來看下A720,A720的代號叫做Hunter,A720的設(shè)計目標是比A715提升20%的能效,在同樣的功耗下,A720可以提供更強的性能。

A720的的微架構(gòu)整體和A715差異不大,Arm并沒有增加fetch-decode寬度,也沒有增加諸如ROB尺寸之類的優(yōu)化,而是進一步深入到微架構(gòu)的細節(jié)調(diào)整以優(yōu)化能效。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

在前端設(shè)計上,A720持續(xù)優(yōu)化分支預(yù)測能力,通俗的說就是走一步看兩步的能力。A720的分支預(yù)測錯誤的恢復(fù)周期從12降低到11周期,這個優(yōu)化對于實際用戶場景中無法準確預(yù)測的案例很有幫助。在分支預(yù)測能力上,A710的大核心每周期可以預(yù)測2個unconditional分支,A715額外支持了conditional分支,A720則進一步進行了優(yōu)化了功耗,Arm宣稱可以在不影響性能的情況下降低功耗。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

在后端設(shè)計上,A720通過管線化排序FDIV\FSQRT單元(除法和開方),提升指令執(zhí)行能效。同時,A720優(yōu)化了數(shù)據(jù)在整型和浮點單元的傳輸效率,降低數(shù)據(jù)傳輸?shù)难舆t和存儲數(shù)據(jù)的延遲。A720還改進了發(fā)射隊列和執(zhí)行單元,簡化網(wǎng)點到AGU的數(shù)據(jù)傳輸?shù)取?/p>

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

A720在存儲模塊上有一個較為明顯的優(yōu)化是降低了L2訪問的延遲,從10個周期降低為9個周期,對于訪存多的場景會比較有幫助。另外A720支持的最大L2緩存數(shù)量還是512KB。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

最后介紹一個A720在今年最大的變化,今年Arm的A720不是一個人,是一對雙胞胎,Arm提供了另外一個A720min(暫時這樣叫)的核心。這個核心和A720不同,在面積上做了一定的削減,整體核心面積大小和A78接近,性能上也弱于A720,但是比A78強10%左右。總結(jié),A720min的面積和A78接近(耗電也應(yīng)該接近),性能比A78強10%,屬于A720的一個分支。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

最后簡單總結(jié)下A720的關(guān)鍵改變:

1、分支預(yù)測錯誤的恢復(fù)周期從12降低到11周期;

2、L2訪問延遲從10個周期降低為9個周期;

3、提供了一個A720min的選擇,面積和A78接近,性能比A78強10%。

5、A520微架構(gòu)分析

我們來看一下小核心A520,A520小核心的代號叫做Hayes,依然不支持亂序執(zhí)行,設(shè)計相對簡單,主打能效改善。A520依然繼承了A510的2個小核心拼接在一起共享SIMD單元的設(shè)計,這次的A520也是僅支持64bit,不再支持32bit。A520提供了新的QARMA3 PAC算法,旨在將PAC的影響降低到1%以內(nèi)。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

相比A510,A520為了提升能效還做了減法,主要的變化是減少了一個執(zhí)行單元的ALU。A510有3個ALU,A520只有2個。當然,Arm說通過全局的優(yōu)化有將性能的損失彌補回來,從Arm提供的數(shù)據(jù)上看,A520在相同的性能下,功耗可以降低22%;在相同的功耗下,性能可以提升約8%,我們也會實際測試看看。

可惜,8%的性能提升相比旗艦處理器的需求還是有一定差距,我們看到在今年的旗艦處理器設(shè)計上,芯片廠商在繼續(xù)減少使用A520小核心,甚至有的廠商完全沒有使用A520小核心。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

6、DSU120分析

最后我們來看一下用于協(xié)調(diào)處理器核心和緩存的DSU模塊,Arm升級了最新的DSU120模塊,可以在一個Cluster內(nèi)支持最多14個核心,并且支持最多32MB的L3緩存管理。

DSU120提供了一個有價值的功能,隨著L3緩存越來越大,靜態(tài)漏電也成為一個需要考慮的影響因素,會影響手機的待機耗電場景。DSU120提供了一個L3部分關(guān)閉的功能,在一些不需要使用那么大緩存的場景,關(guān)閉部分L3緩存,可以減少靜態(tài)漏電。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

7、總結(jié)

本文主要分析了Arm公司于2023年最新發(fā)布的Cortex-X4、A720和A520等處理器架構(gòu)。今年是Arm公司發(fā)布的第四代X系列處理器,通過前面的分析,我們可以看到Arm在不斷提升其核心處理器的計算性能,挑戰(zhàn)業(yè)內(nèi)最先進的架構(gòu)設(shè)計。同時,Arm也通過優(yōu)化A720、A520的能效,給用戶提供在芯片能效上更有競爭力的產(chǎn)品組合。

2023年,芯片廠商也不滿足傳統(tǒng)的核心搭配,開始了減少小核心,增加大核心的架構(gòu)升級。我們今年可以看到更多的多大核心SOC設(shè)計,在多核心性能上有了進一步的提升。無疑,2023年的處理器競爭會更加激烈,多大核心的引入也需要警惕功耗和發(fā)熱增加的風險,作為芯片和智能設(shè)備終端的開發(fā)者,需要充分了解處理器架構(gòu),通過合理的軟硬件調(diào)度設(shè)計,將芯片的能效優(yōu)化到最佳,給用戶提供最佳且可持續(xù)的性能表現(xiàn)。

2023年Arm最新處理器架構(gòu)分析——X4、A720和A520,arm開發(fā),Linux內(nèi)核,Arm

?文章來源地址http://www.zghlxwxcb.cn/news/detail-595371.html

到了這里,關(guān)于2023年Arm最新處理器架構(gòu)分析——X4、A720和A520的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • ARM處理器架構(gòu)的Thumb指令集中關(guān)于IT指令的使用

    在ARMv6T2以及ARMv7架構(gòu)擴展了Thumb指令集,其中加入了 IT 指令,進一步增強了代碼的緊湊性。 Thumb中有一個比較有意思的指令—— IT ,這條指令用于根據(jù)指定的條件來執(zhí)行后面相繼的四條指令。當然,Thumb-2中大部分算術(shù)邏輯指令都含有帶條件執(zhí)行的特征,不過Thumb-2是32位的。

    2024年02月07日
    瀏覽(26)
  • 【架構(gòu)】探索計算機處理器的世界:ARM和x86架構(gòu)解析及指令集

    計算機處理器是數(shù)字化時代的核心引擎,而在眾多處理器架構(gòu)中,ARM和x86是備受關(guān)注的三個。本文將帶您深入探索這三個架構(gòu),介紹它們的特點、公司背景以及應(yīng)用領(lǐng)域。讓我們一起揭開計算機處理器的神秘面紗吧! ARM(Advanced RISC Machines)是一種計算機指令集架構(gòu)(ISA),

    2024年02月11日
    瀏覽(20)
  • 【軟件工具】 Linux 中的 ARM 和 AMD 兩種不同的處理器架構(gòu)簡介

    Linux 中的 ARM 和 AMD 兩種不同的處理器架構(gòu)。ARM 和 AMD 架構(gòu)的主要區(qū)別在于它們的設(shè)計哲學、性能特性、能效和主要應(yīng)用場景。以下是一些關(guān)鍵差異: 架構(gòu)設(shè)計 : ARM(Advanced RISC Machine) :ARM 架構(gòu)基于 RISC(精簡指令集計算)原理。它使用更少的指令和簡化的指令集,這有助

    2024年04月10日
    瀏覽(89)
  • RISC-V架構(gòu)的開源處理器分析

    摘要: RISC-V架構(gòu)本身面積小、性能較高,最為關(guān)鍵的是這一架構(gòu)本身功耗較低且作為全新的開源精簡指令集,無論是技術(shù)還是產(chǎn)品都得到了迅速的發(fā)展,效果突出?;诖耍疚纳钊胙芯縍ISC-V架構(gòu)開源處理器內(nèi)部情況,明確不同模塊的功能以及運行方式,并且圍繞著實際案例

    2024年02月06日
    瀏覽(25)
  • 玩客云裝新版青龍面板方法首發(fā),2023年親測,所有的arm32位處理器終于可以裝新版青龍了

    先把舊版的青龍面板容器和鏡像都刪了,沒裝過的不用刪 ssh連接玩客云或其他arm32位機器,先下載這個文件 重啟docker? 分別一行一行輸入,回車 等待5-10分鐘后 裝青龍最新版

    2024年02月12日
    瀏覽(26)
  • 2023年最新水果DAW編曲軟件fl studio21 macOS - 21.0.3.3036簡體中文版免費下載支持蘋果M1/M2處理器

    2023年最新水果DAW編曲軟件fl studio21 macOS - 21.0.3.3036簡體中文版免費下載支持蘋果M1/M2處理器

    一直夢想制作自己的音樂(無論是作為一名制作人還是藝術(shù)家),你可能會想你出生在這個時代是你的幸運星。這個水果圈工作室和上一版之間的改進水平確實令人欽佩。這僅僅是FL Studio 21所提供的皮毛。你的音樂項目的選擇真的會讓你大吃一驚。你以前從未有過這樣的多才多

    2024年02月03日
    瀏覽(31)
  • ARM處理器概述

    RISC處理器和CISC處理器 首先了解一下兩種處理器名字: RISC(Reduced Instruction Set Computer): 精簡指令集 處理器 與之相對應(yīng)的是: CISC(Complex Instruction Set Computer): 復(fù)雜指令集 處理器 顧名思義,RISC比CISC更加簡單,那么對于處理器來說什么能稱為簡單呢?可以聯(lián)想為生活中可

    2024年02月13日
    瀏覽(92)
  • 除法的效率 arm處理器

    除法的效率 性能結(jié)論: 除法:545ms 乘法:93ms 差了3倍 代碼: 測試結(jié)果 : void fun(Pack1* restrict in, Pack2* restrict out) ; __restrict__ 申明該指針為唯一的訪問該內(nèi)存的指針 優(yōu)化成果: 時間優(yōu)化為原來的82% 指令優(yōu)化為74% cache miss 沒有變化 優(yōu)化對比 測試平臺 MTK arm天機 8000

    2024年02月10日
    瀏覽(85)
  • DP讀書:鯤鵬處理器 架構(gòu)與編程(八)3.1鯤鵬處理器片上系統(tǒng)與Taishan處理器內(nèi)核架構(gòu)

    DP讀書:鯤鵬處理器 架構(gòu)與編程(八)3.1鯤鵬處理器片上系統(tǒng)與Taishan處理器內(nèi)核架構(gòu)

    處理器體系結(jié)構(gòu),是一個偏底層的內(nèi)容,但這是任一計算機系統(tǒng)的底層。 系統(tǒng)的性能、生態(tài)和功能很大程度上都依賴于計算機系統(tǒng)底層——處理器體系結(jié)構(gòu)。任何一個系統(tǒng)程序員、固件設(shè)計者、應(yīng)用程序員 甚至 服務(wù)器管理員,如果想要充分利用現(xiàn)代高性能處理器的硬件性能

    2024年02月12日
    瀏覽(20)
  • [ARM 匯編]進階篇—異常處理與中斷—2.4.2 ARM處理器的異常向量表

    [ARM 匯編]進階篇—異常處理與中斷—2.4.2 ARM處理器的異常向量表

    異常向量表簡介 在ARM架構(gòu)中,異常向量表是一組固定位置的內(nèi)存地址,它們包含了處理器在遇到異常時需要跳轉(zhuǎn)到的處理程序的入口地址。每個異常類型都有一個對應(yīng)的向量地址。當異常發(fā)生時,處理器會自動跳轉(zhuǎn)到對應(yīng)的向量地址,并開始執(zhí)行異常處理程序。 異常向量表

    2024年02月09日
    瀏覽(89)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包