国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

2年前作者：斷水客分類：Toy博客閱讀(87)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

1 有哪些通用評(píng)價(jià)指標(biāo)？

現(xiàn)代處理器內(nèi)核的性能可以從以下幾個(gè)方面進(jìn)行評(píng)估：

時(shí)鐘速度（Clock Speed）：它是CPU內(nèi)部時(shí)鐘發(fā)生器的頻率，以赫茲（Hz）為單位。時(shí)鐘速度越高，每秒鐘內(nèi)執(zhí)行的指令數(shù)就越多，因此性能也會(huì)更好。

指令級(jí)并行性（ILP）：現(xiàn)代處理器采用了一些技術(shù)來提高指令級(jí)并行性，如超標(biāo)量、超線程等。這些技術(shù)可以同時(shí)執(zhí)行多條指令。

流水線（Pipeline）：現(xiàn)代處理器還采用了流水線技術(shù)來提高性能。流水線將指令分成多個(gè)階段，并且同時(shí)執(zhí)行多個(gè)指令，從而使得處理器每個(gè)時(shí)鐘周期可以完成更多的工作。

緩存（Cache）：緩存是一種快速的存儲(chǔ)設(shè)備，用于暫時(shí)存儲(chǔ)處理器需要使用的數(shù)據(jù)和指令?，F(xiàn)代處理器內(nèi)置了多級(jí)緩存系統(tǒng)，從而可以大大降低訪問內(nèi)存的延遲，提高處理器的性能。

向量化（Vectorization）：向量化是一種并行計(jì)算技術(shù)，可以同時(shí)處理一組數(shù)據(jù)?，F(xiàn)代處理器內(nèi)置了向量化指令集，如SSE、AVX等，可以在單個(gè)時(shí)鐘周期內(nèi)執(zhí)行多個(gè)操作。

芯片工藝（Process Technology）：芯片工藝是指用于制造處理器的制造工藝。隨著芯片工藝的不斷進(jìn)步，處理器的晶體管數(shù)量和頻率都有了大幅度提升。

2 為什么不再使用MIPS指標(biāo)？

MIPS代表每秒鐘可以執(zhí)行的百萬條指令數(shù)。具體來說，MIPS值等于 CPU執(zhí)行的指令總數(shù)除以執(zhí)行這些指令所花費(fèi)的時(shí)間（單位為秒），再除以一百萬。

在過去，MIPS評(píng)價(jià)處理器內(nèi)核性能被廣泛使用是因?yàn)樗呛饬坑?jì)算機(jī)性能的一種簡(jiǎn)單而直觀的方式。然而，在現(xiàn)代計(jì)算機(jī)中，MIPS已經(jīng)不再被廣泛使用來評(píng)估處理器的性能，原因如下：

處理器架構(gòu)復(fù)雜：現(xiàn)代處理器的架構(gòu)非常復(fù)雜，包括多級(jí)緩存、預(yù)取和超標(biāo)量執(zhí)行等功能，這些都使得MIPS評(píng)價(jià)成為不夠準(zhǔn)確的性能指標(biāo)。

指令集變化：隨著處理器指令集的變化，MIPS評(píng)價(jià)可能會(huì)失去其原有的意義。例如，現(xiàn)代處理器引入了向量指令，可以實(shí)現(xiàn)并行計(jì)算，但這不會(huì)反映在MIPS評(píng)價(jià)中。

單純指令計(jì)數(shù)難以反映性能提升：現(xiàn)代處理器通常會(huì)使用更短的指令序列來完成相同的操作，從而提高性能，這些性能提升很難通過簡(jiǎn)單的指令計(jì)數(shù)進(jìn)行比較。

不同應(yīng)用場(chǎng)景需要不同指標(biāo): 不同的應(yīng)用場(chǎng)景需要不同的性能指標(biāo)，例如，數(shù)據(jù)庫系統(tǒng)需要高并發(fā)、低延遲的I/O操作，而圖像處理則需要高吞吐量的向量計(jì)算。在這些應(yīng)用場(chǎng)景中，MIPS評(píng)價(jià)可能無法提供有用的信息。

因此，現(xiàn)代計(jì)算機(jī)中常用的處理器性能指標(biāo)包括時(shí)鐘頻率、IPC（每時(shí)鐘周期指令數(shù)）、功耗和浮點(diǎn)運(yùn)算性能等。這些指標(biāo)可以更準(zhǔn)確地衡量處理器性能，并且可以根據(jù)不同的應(yīng)用場(chǎng)景進(jìn)行定制化的性能評(píng)估。

3 主推何種評(píng)價(jià)指標(biāo)？

現(xiàn)代計(jì)算機(jī)中常用的處理器性能指標(biāo)包括時(shí)鐘頻率、IPC（每時(shí)鐘周期指令數(shù)）、功耗和浮點(diǎn)運(yùn)算性能等。這些指標(biāo)可以更準(zhǔn)確地衡量處理器性能，并且可以根據(jù)不同的應(yīng)用場(chǎng)景進(jìn)行定制化的性能評(píng)估。

《計(jì)算機(jī)體系結(jié)構(gòu)量化研究方法》的作者約翰? L.亨尼西（John L. Hennessy）和大衛(wèi)?A.帕特森（David A. Patterson）認(rèn)為時(shí)鐘周期時(shí)間、CPI(1/IPC，執(zhí)行每條指令需要的時(shí)鐘周期數(shù))和指令數(shù)量這三個(gè)評(píng)價(jià)指標(biāo)能夠綜合反映某個(gè)計(jì)算機(jī)系統(tǒng)的性能。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

4 為什么選擇這些指標(biāo)？

究其原因，就是上一節(jié)那張圖里的約束條件了。

emmm首先我們要意識(shí)到，僅僅關(guān)注指令數(shù)量和主頻是不夠的?？蓤?zhí)行文件中的指令數(shù)是受到指令集體系結(jié)構(gòu)和編譯器技術(shù)制約的。對(duì)于同樣的測(cè)試程序/負(fù)載，我們使用不同的編譯器編譯產(chǎn)生的指令數(shù)量可能不同。即使是同樣的編譯器和程序，在目標(biāo)架構(gòu)不同時(shí)，輸出文件的指令數(shù)也可能有差異。

GCC的編譯過程分為四個(gè)階段：預(yù)處理、編譯、匯編和鏈接。在預(yù)處理階段，預(yù)處理器將源代碼轉(zhuǎn)換為一個(gè)更大的、包含了所有頭文件和宏替換的單一文件。在編譯階段，編譯器將這個(gè)單一文件翻譯成匯編代碼。在匯編階段，匯編器將匯編代碼轉(zhuǎn)換成二進(jìn)制目標(biāo)文件。最后，在鏈接階段，鏈接器將多個(gè)目標(biāo)文件組合成一個(gè)可執(zhí)行文件。

LLVM的編譯過程分為三個(gè)主要階段：前端、優(yōu)化和后端。在前端階段，源代碼被翻譯成一個(gè)中間表示（IR），這種表達(dá)方式非常接近于高級(jí)語言的語法。在優(yōu)化階段，LLVM將IR進(jìn)行各種優(yōu)化操作以提高程序性能。在后端階段，IR會(huì)被翻譯成目標(biāo)平臺(tái)的機(jī)器碼。這種模塊化的設(shè)計(jì)使得LLVM更易于擴(kuò)展和定制，因?yàn)橛脩艨梢杂米约旱那岸嘶蚝蠖颂鎿Q默認(rèn)實(shí)現(xiàn)。而且，LLVM還可以生成可重定向的對(duì)象文件，這些對(duì)象文件可以在鏈接時(shí)進(jìn)行優(yōu)化。

其次就是組成與指令集體系結(jié)構(gòu)會(huì)影響CPI，比如總線寬度、主存速率，都會(huì)拖處理核的后腿。對(duì)于支持向量運(yùn)算的處理核，即使每條指令需要的周期數(shù)比不支持向量指令的處理核多3倍，它也可能比后者更快地完成同一個(gè)運(yùn)算任務(wù)。比如下圖所示，armv7支持Dn/Qn寄存器，分別可以存64bits/128bits的數(shù)據(jù)，這樣每次可以運(yùn)算2/4個(gè)32位浮點(diǎn)數(shù)，自然就能更快地做完一批運(yùn)算。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

最后咱也不能迷信主頻，和CPI一樣，處理核周圍的設(shè)備的速率也可能會(huì)制約處理核發(fā)揮真正的實(shí)力。即時(shí)處理核能跑4GHz，cache卻總是miss（cache太?。蛘呖偩€總是處于忙碌狀態(tài)（位寬不夠），這樣系統(tǒng)的吞吐量也是上不去的。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

5 ARM Cortex-A53的性能

我找到有人對(duì)A53的IPC和FOP兩個(gè)參數(shù)做了測(cè)試，結(jié)果貼在這里用作參考。

每周期指令數(shù)（IPC）

32bit浮點(diǎn)類型數(shù)乘/加運(yùn)算任務(wù)，每周期可執(zhí)行兩個(gè)標(biāo)量/SIMD 2（64bits）操作指令，每周期執(zhí)行1個(gè)SIMD 4（128bits）操作指令。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

64bits浮點(diǎn)類型數(shù)乘/加運(yùn)算任務(wù)，每周期可執(zhí)行兩個(gè)標(biāo)量操作指令，每周期執(zhí)行1個(gè)SIMD 2（128bits）操作指令。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

每周期浮點(diǎn)運(yùn)算次數(shù)（FOP）

每周期可執(zhí)行兩次標(biāo)量單/雙精度浮點(diǎn)運(yùn)算。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例
使用SIMD情況下，每周期可執(zhí)行4次單精度浮點(diǎn)運(yùn)算，8次乘積累加運(yùn)算（FMA）。

使用SIMD情況下，每周期可執(zhí)行2條雙精度浮點(diǎn)運(yùn)算，4次乘積累加運(yùn)算（FMA）。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

參考

mips of cortex a53 - Architectures and Processors forum - Support
forums - Arm Community
Why does FPU performance differ in AArch64 and AArch32 with
Cortex-A53? - Architectures and Processors forum - Support forums -
Arm Community
ホイール欲しいハンドル欲しい ? ARM Cortex-A53 の浮動(dòng)小數(shù)點(diǎn)演算速度とコンパイル時(shí)間の比較 (flatlib.jp)
opengl:cpufop [HYPERでんち] (flatlib.jp)
計(jì)算機(jī)體系結(jié)構(gòu)：量化研究方法（第6版） (豆瓣) (douban.com)文章來源地址http://www.zghlxwxcb.cn/news/detail-436685.html

到了這里，關(guān)于如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

一文深入搞懂ARM處理器架構(gòu)
典型的微處理器由控制單元、程序計(jì)數(shù)器（PC）、指令寄存器（IR）、數(shù)據(jù)通道、存儲(chǔ)器等組成。指令執(zhí)行過程一般分為： ? 取指：從存儲(chǔ)器中獲得下一條執(zhí)行的指令讀入指令寄存器； PC: 程序計(jì)數(shù)器, 總是指向下一條將要執(zhí)行的指令； IR: 指令寄存器，用于保持已取得指令
2024年04月28日
瀏覽(90)
ARM架構(gòu)版本及處理器系列詳細(xì)介紹
ARM是一家微處理器行業(yè)的知名企業(yè)，該企業(yè)設(shè)計(jì)了大量高性能、廉價(jià)、耗能低的RISC （精簡(jiǎn)指令集）處理器，它只設(shè)計(jì)芯片而不生產(chǎn)。ARM的經(jīng)營(yíng)模式在于出售其知識(shí)產(chǎn)權(quán)核（IP core），將技術(shù)授權(quán)給世界上許多著名的半導(dǎo)體、軟件和OEM廠商，并提供技術(shù)服務(wù)。 ? ? ? ? ARM的版本
2024年02月16日
瀏覽(91)
[ARM 匯編]進(jìn)階篇—異常處理與中斷—2.4.2 ARM處理器的異常向量表
異常向量表簡(jiǎn)介在ARM架構(gòu)中，異常向量表是一組固定位置的內(nèi)存地址，它們包含了處理器在遇到異常時(shí)需要跳轉(zhuǎn)到的處理程序的入口地址。每個(gè)異常類型都有一個(gè)對(duì)應(yīng)的向量地址。當(dāng)異常發(fā)生時(shí)，處理器會(huì)自動(dòng)跳轉(zhuǎn)到對(duì)應(yīng)的向量地址，并開始執(zhí)行異常處理程序。異常向量表
2024年02月09日
瀏覽(90)
ARM微處理器的指令集概述
ARM處理器是基于精簡(jiǎn)指令集計(jì)算機(jī)（RISC）原理設(shè)計(jì)的，指令集和相關(guān)譯碼機(jī)制較為簡(jiǎn)單。ARM微處理器的指令集是加載（Load）/存儲(chǔ)（Store）型的，也即指令集僅能處理寄存器中的數(shù)據(jù)，而且處理結(jié)果都要放回寄存器中，而對(duì)系統(tǒng)存儲(chǔ)器的訪問則需要通過專門的加載/存儲(chǔ)指令來
2024年02月02日
瀏覽(94)
『ARM』和『x86』處理器架構(gòu)解析指南
如果問大家是否知道 CPU，我相信不會(huì)得到否定的答案，但是如果繼續(xù)問大家是否了解 ARM 和 X86 架構(gòu) ，他們的區(qū)別又是什么，相信可能部分人就會(huì)啞口無言了目前隨著深度學(xué)習(xí)、高性能計(jì)算、NLP、AIGC、GLM、AGI 的技術(shù)迭代，助力大模型快速發(fā)展，對(duì)于多元算力結(jié)合（CPU+GP
2024年02月08日
瀏覽(123)
嵌入式ARM設(shè)計(jì)編程(三) 處理器工作模式
文章和代碼已歸檔至【Github倉庫：hardware-tutorial】，需要的朋友們自取?；蛘吖娞?hào)【AIShareLab】回復(fù) 嵌入式也可獲取。（1）通過實(shí)驗(yàn)掌握學(xué)會(huì)使用msr/mrs 指令實(shí)現(xiàn)ARM 處理器工作模式的切換，觀察不同模式下的寄存器，加深對(duì)CPU 結(jié)構(gòu)的理解；（2）通過實(shí)驗(yàn)掌握ld 中如何使
2024年02月03日
瀏覽(94)
[ARM匯編]ARM體系結(jié)構(gòu)簡(jiǎn)介—1.2.1 ARM處理器的歷史與發(fā)展
ARM（Advanced?RISC?Machine，先進(jìn)的精簡(jiǎn)指令集計(jì)算機(jī)）處理器是一種廣泛應(yīng)用于嵌入式系統(tǒng)的處理器架構(gòu)，具有低功耗、高性能、低成本等特點(diǎn)。接下來，我們將介紹 ARM 處理器的歷史與發(fā)展。 ARM 處理器的歷史 ARM 處理器的歷史可以追溯到 1983 年，當(dāng)時(shí)英國(guó)的 Acorn 電腦公司為了
2024年02月09日
瀏覽(235)
ARM處理器有哪些工作模式和寄存器？各寄存器作用是什么？ARM異常中斷處理流程？
快速學(xué)習(xí)嵌入式開發(fā)其他基礎(chǔ)知識(shí)？返回專欄總目錄《嵌入式工程師自我修養(yǎng)/C語言》 Tip??：鼠標(biāo)懸停雙虛線/句，可獲得更詳細(xì)的描述 ??ARM處理器有多種工作模式，如下表所示。應(yīng)用程序正常運(yùn)行時(shí)，ARM處理器工作在用戶模式（User mode），當(dāng)程序運(yùn)行出錯(cuò)或有中
2024年02月21日
瀏覽(567)
強(qiáng)大的處理器和接口支持BL304ARM控制器
在智慧醫(yī)療領(lǐng)域，BL304可以用于實(shí)現(xiàn)醫(yī)療設(shè)備的智能化、遠(yuǎn)程監(jiān)控和數(shù)據(jù)交換。在智慧電力領(lǐng)域，BL304可以幫助實(shí)現(xiàn)電網(wǎng)的智能化管理，提升電力供應(yīng)的效率。在智慧安防領(lǐng)域，BL304可以實(shí)現(xiàn)智能監(jiān)控、智能門鎖等應(yīng)用，保障安全。搭配四核 Cortex-A53+單核Cortex-M4構(gòu)架，運(yùn)行速度
2024年02月10日
瀏覽(94)
ARM Cortex-M處理器中的SysTick定時(shí)器簡(jiǎn)介
ARM Cortex-M處理器中的SysTick是一個(gè)內(nèi)部的系統(tǒng)定時(shí)器，它提供了一種簡(jiǎn)單而有效的方式來生成定時(shí)的中斷請(qǐng)求。SysTick定時(shí)器是一個(gè)24位的下計(jì)數(shù)定時(shí)器，它可以配置為周期性地產(chǎn)生中斷，這些中斷可以用于操作系統(tǒng)的任務(wù)調(diào)度、性能測(cè)量、時(shí)間延遲等。 SysTick定時(shí)器的主要特點(diǎn)
2024年04月28日
瀏覽(93)

<form id="vcm03"></form>