国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

這篇具有很好參考價(jià)值的文章主要介紹了如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

1 有哪些通用評(píng)價(jià)指標(biāo)?

現(xiàn)代處理器內(nèi)核的性能可以從以下幾個(gè)方面進(jìn)行評(píng)估:

時(shí)鐘速度(Clock Speed):它是CPU內(nèi)部時(shí)鐘發(fā)生器的頻率,以赫茲(Hz)為單位。時(shí)鐘速度越高,每秒鐘內(nèi)執(zhí)行的指令數(shù)就越多,因此性能也會(huì)更好。

指令級(jí)并行性(ILP):現(xiàn)代處理器采用了一些技術(shù)來提高指令級(jí)并行性,如超標(biāo)量、超線程等。這些技術(shù)可以同時(shí)執(zhí)行多條指令。

流水線(Pipeline):現(xiàn)代處理器還采用了流水線技術(shù)來提高性能。流水線將指令分成多個(gè)階段,并且同時(shí)執(zhí)行多個(gè)指令,從而使得處理器每個(gè)時(shí)鐘周期可以完成更多的工作。

緩存(Cache):緩存是一種快速的存儲(chǔ)設(shè)備,用于暫時(shí)存儲(chǔ)處理器需要使用的數(shù)據(jù)和指令?,F(xiàn)代處理器內(nèi)置了多級(jí)緩存系統(tǒng),從而可以大大降低訪問內(nèi)存的延遲,提高處理器的性能。

向量化(Vectorization):向量化是一種并行計(jì)算技術(shù),可以同時(shí)處理一組數(shù)據(jù)?,F(xiàn)代處理器內(nèi)置了向量化指令集,如SSE、AVX等,可以在單個(gè)時(shí)鐘周期內(nèi)執(zhí)行多個(gè)操作。

芯片工藝(Process Technology):芯片工藝是指用于制造處理器的制造工藝。隨著芯片工藝的不斷進(jìn)步,處理器的晶體管數(shù)量和頻率都有了大幅度提升。

2 為什么不再使用MIPS指標(biāo)?

MIPS代表每秒鐘可以執(zhí)行的百萬條指令數(shù)。具體來說,MIPS值等于 CPU執(zhí)行的指令總數(shù)除以執(zhí)行這些指令所花費(fèi)的時(shí)間(單位為秒),再除以一百萬。

在過去,MIPS評(píng)價(jià)處理器內(nèi)核性能被廣泛使用是因?yàn)樗呛饬坑?jì)算機(jī)性能的一種簡(jiǎn)單而直觀的方式。然而,在現(xiàn)代計(jì)算機(jī)中,MIPS已經(jīng)不再被廣泛使用來評(píng)估處理器的性能,原因如下:

處理器架構(gòu)復(fù)雜:現(xiàn)代處理器的架構(gòu)非常復(fù)雜,包括多級(jí)緩存、預(yù)取和超標(biāo)量執(zhí)行等功能,這些都使得MIPS評(píng)價(jià)成為不夠準(zhǔn)確的性能指標(biāo)。

指令集變化:隨著處理器指令集的變化,MIPS評(píng)價(jià)可能會(huì)失去其原有的意義。例如,現(xiàn)代處理器引入了向量指令,可以實(shí)現(xiàn)并行計(jì)算,但這不會(huì)反映在MIPS評(píng)價(jià)中。

單純指令計(jì)數(shù)難以反映性能提升: 現(xiàn)代處理器通常會(huì)使用更短的指令序列來完成相同的操作,從而提高性能,這些性能提升很難通過簡(jiǎn)單的指令計(jì)數(shù)進(jìn)行比較。

不同應(yīng)用場(chǎng)景需要不同指標(biāo): 不同的應(yīng)用場(chǎng)景需要不同的性能指標(biāo),例如,數(shù)據(jù)庫系統(tǒng)需要高并發(fā)、低延遲的I/O操作,而圖像處理則需要高吞吐量的向量計(jì)算。在這些應(yīng)用場(chǎng)景中,MIPS評(píng)價(jià)可能無法提供有用的信息。

因此,現(xiàn)代計(jì)算機(jī)中常用的處理器性能指標(biāo)包括時(shí)鐘頻率、IPC(每時(shí)鐘周期指令數(shù))、功耗和浮點(diǎn)運(yùn)算性能等。這些指標(biāo)可以更準(zhǔn)確地衡量處理器性能,并且可以根據(jù)不同的應(yīng)用場(chǎng)景進(jìn)行定制化的性能評(píng)估。

3 主推何種評(píng)價(jià)指標(biāo)?

現(xiàn)代計(jì)算機(jī)中常用的處理器性能指標(biāo)包括時(shí)鐘頻率、IPC(每時(shí)鐘周期指令數(shù))、功耗和浮點(diǎn)運(yùn)算性能等。這些指標(biāo)可以更準(zhǔn)確地衡量處理器性能,并且可以根據(jù)不同的應(yīng)用場(chǎng)景進(jìn)行定制化的性能評(píng)估。

《計(jì)算機(jī)體系結(jié)構(gòu)量化研究方法》的作者約翰? L.亨尼西(John L. Hennessy) 和大衛(wèi)?A.帕特森(David A. Patterson)認(rèn)為時(shí)鐘周期時(shí)間、CPI(1/IPC,執(zhí)行每條指令需要的時(shí)鐘周期數(shù))和指令數(shù)量這三個(gè)評(píng)價(jià)指標(biāo)能夠綜合反映某個(gè)計(jì)算機(jī)系統(tǒng)的性能。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

4 為什么選擇這些指標(biāo)?

究其原因,就是上一節(jié)那張圖里的約束條件了。

emmm首先我們要意識(shí)到,僅僅關(guān)注指令數(shù)量和主頻是不夠的??蓤?zhí)行文件中的指令數(shù)是受到指令集體系結(jié)構(gòu)和編譯器技術(shù)制約的。對(duì)于同樣的測(cè)試程序/負(fù)載,我們使用不同的編譯器編譯產(chǎn)生的指令數(shù)量可能不同。即使是同樣的編譯器和程序,在目標(biāo)架構(gòu)不同時(shí),輸出文件的指令數(shù)也可能有差異。

GCC的編譯過程分為四個(gè)階段:預(yù)處理、編譯、匯編和鏈接。在預(yù)處理階段,預(yù)處理器將源代碼轉(zhuǎn)換為一個(gè)更大的、包含了所有頭文件和宏替換的單一文件。在編譯階段,編譯器將這個(gè)單一文件翻譯成匯編代碼。在匯編階段,匯編器將匯編代碼轉(zhuǎn)換成二進(jìn)制目標(biāo)文件。最后,在鏈接階段,鏈接器將多個(gè)目標(biāo)文件組合成一個(gè)可執(zhí)行文件。

LLVM的編譯過程分為三個(gè)主要階段:前端、優(yōu)化和后端。在前端階段,源代碼被翻譯成一個(gè)中間表示(IR),這種表達(dá)方式非常接近于高級(jí)語言的語法。在優(yōu)化階段,LLVM將IR進(jìn)行各種優(yōu)化操作以提高程序性能。在后端階段,IR會(huì)被翻譯成目標(biāo)平臺(tái)的機(jī)器碼。這種模塊化的設(shè)計(jì)使得LLVM更易于擴(kuò)展和定制,因?yàn)橛脩艨梢杂米约旱那岸嘶蚝蠖颂鎿Q默認(rèn)實(shí)現(xiàn)。而且,LLVM還可以生成可重定向的對(duì)象文件,這些對(duì)象文件可以在鏈接時(shí)進(jìn)行優(yōu)化。

其次就是組成與指令集體系結(jié)構(gòu)會(huì)影響CPI,比如總線寬度、主存速率,都會(huì)拖處理核的后腿。對(duì)于支持向量運(yùn)算的處理核,即使每條指令需要的周期數(shù)比不支持向量指令的處理核多3倍,它也可能比后者更快地完成同一個(gè)運(yùn)算任務(wù)。比如下圖所示,armv7支持Dn/Qn寄存器,分別可以存64bits/128bits的數(shù)據(jù),這樣每次可以運(yùn)算2/4個(gè)32位浮點(diǎn)數(shù),自然就能更快地做完一批運(yùn)算。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

最后咱也不能迷信主頻,和CPI一樣,處理核周圍的設(shè)備的速率也可能會(huì)制約處理核發(fā)揮真正的實(shí)力。即時(shí)處理核能跑4GHz,cache卻總是miss(cache太?。蛘呖偩€總是處于忙碌狀態(tài)(位寬不夠),這樣系統(tǒng)的吞吐量也是上不去的。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

5 ARM Cortex-A53的性能

我找到有人對(duì)A53的IPC和FOP兩個(gè)參數(shù)做了測(cè)試,結(jié)果貼在這里用作參考。

每周期指令數(shù)(IPC)

32bit浮點(diǎn)類型數(shù)乘/加運(yùn)算任務(wù),每周期可執(zhí)行兩個(gè)標(biāo)量/SIMD 2(64bits)操作指令,每周期執(zhí)行1個(gè)SIMD 4(128bits) 操作指令。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

64bits浮點(diǎn)類型數(shù)乘/加運(yùn)算任務(wù),每周期可執(zhí)行兩個(gè)標(biāo)量操作指令,每周期執(zhí)行1個(gè)SIMD 2(128bits) 操作指令。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

每周期浮點(diǎn)運(yùn)算次數(shù)(FOP)

每周期可執(zhí)行兩次標(biāo)量單/雙精度浮點(diǎn)運(yùn)算。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例
使用SIMD情況下,每周期可執(zhí)行4次單精度浮點(diǎn)運(yùn)算,8次乘積累加運(yùn)算(FMA)。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例
使用SIMD情況下,每周期可執(zhí)行2條雙精度浮點(diǎn)運(yùn)算,4次乘積累加運(yùn)算(FMA)。
如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例

參考

  1. mips of cortex a53 - Architectures and Processors forum - Support
    forums - Arm Community

  2. Why does FPU performance differ in AArch64 and AArch32 with
    Cortex-A53? - Architectures and Processors forum - Support forums -
    Arm Community

  3. ホイール欲しい ハンドル欲しい ? ARM Cortex-A53 の浮動(dòng)小數(shù)點(diǎn)演算速度とコンパイル時(shí)間の比較 (flatlib.jp)

  4. opengl:cpufop [HYPERでんち] (flatlib.jp)

  5. 計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法(第6版) (豆瓣) (douban.com)文章來源地址http://www.zghlxwxcb.cn/news/detail-436685.html

到了這里,關(guān)于如何評(píng)估現(xiàn)代處理器的性能——以ARM Cortex-A53為例的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 一文深入搞懂ARM處理器架構(gòu)

    一文深入搞懂ARM處理器架構(gòu)

    典型的微處理器由控制單元、程序計(jì)數(shù)器(PC)、指令寄存器(IR)、數(shù)據(jù)通道、存儲(chǔ)器等組成 。 指令執(zhí)行過程一般分為: ? 取指: 從存儲(chǔ)器中獲得下一條執(zhí)行的指令讀入指令寄存器; PC: 程序計(jì)數(shù)器, 總是指向下一條將要執(zhí)行的指令; IR: 指令寄存器,用于保持已取得指令

    2024年04月28日
    瀏覽(90)
  • ARM架構(gòu)版本及處理器系列詳細(xì)介紹

    ARM是一家微處理器行業(yè)的知名企業(yè),該企業(yè)設(shè)計(jì)了大量高性能、廉價(jià)、耗能低的RISC (精簡(jiǎn)指令集)處理器,它只設(shè)計(jì)芯片而不生產(chǎn)。ARM的經(jīng)營(yíng)模式在于出售其知識(shí)產(chǎn)權(quán)核(IP core),將技術(shù)授權(quán)給世界上許多著名的半導(dǎo)體、軟件和OEM廠商,并提供技術(shù)服務(wù)。 ? ? ? ? ARM的版本

    2024年02月16日
    瀏覽(91)
  • [ARM 匯編]進(jìn)階篇—異常處理與中斷—2.4.2 ARM處理器的異常向量表

    [ARM 匯編]進(jìn)階篇—異常處理與中斷—2.4.2 ARM處理器的異常向量表

    異常向量表簡(jiǎn)介 在ARM架構(gòu)中,異常向量表是一組固定位置的內(nèi)存地址,它們包含了處理器在遇到異常時(shí)需要跳轉(zhuǎn)到的處理程序的入口地址。每個(gè)異常類型都有一個(gè)對(duì)應(yīng)的向量地址。當(dāng)異常發(fā)生時(shí),處理器會(huì)自動(dòng)跳轉(zhuǎn)到對(duì)應(yīng)的向量地址,并開始執(zhí)行異常處理程序。 異常向量表

    2024年02月09日
    瀏覽(90)
  • ARM微處理器的指令集概述

    ARM微處理器的指令集概述

    ARM處理器是基于精簡(jiǎn)指令集計(jì)算機(jī)(RISC)原理設(shè)計(jì)的 ,指令集和相關(guān)譯碼機(jī)制較為簡(jiǎn)單。ARM微處理器的指令集是加載(Load)/存儲(chǔ)(Store)型的,也即指令集僅能處理寄存器中的數(shù)據(jù),而且處理結(jié)果都要放回寄存器中,而對(duì)系統(tǒng)存儲(chǔ)器的訪問則需要通過專門的加載/存儲(chǔ)指令來

    2024年02月02日
    瀏覽(94)
  • 『ARM』和『x86』處理器架構(gòu)解析指南

    『ARM』和『x86』處理器架構(gòu)解析指南

    如果問大家是否知道 CPU,我相信不會(huì)得到否定的答案,但是如果繼續(xù)問大家是否了解 ARM 和 X86 架構(gòu) ,他們的區(qū)別又是什么,相信 可能部分人就會(huì)啞口無言 了 目前隨著深度學(xué)習(xí)、高性能計(jì)算、NLP、AIGC、GLM、AGI 的技術(shù)迭代,助力大模型快速發(fā)展,對(duì)于 多元算力結(jié)合(CPU+GP

    2024年02月08日
    瀏覽(123)
  • 嵌入式ARM設(shè)計(jì)編程(三) 處理器工作模式

    嵌入式ARM設(shè)計(jì)編程(三) 處理器工作模式

    文章和代碼已歸檔至【Github倉庫:hardware-tutorial】,需要的朋友們自取?;蛘吖娞?hào)【AIShareLab】回復(fù) 嵌入式 也可獲取。 (1) 通過實(shí)驗(yàn)掌握學(xué)會(huì)使用msr/mrs 指令實(shí)現(xiàn)ARM 處理器工作模式的切換,觀察不同模式下的寄存器,加深對(duì)CPU 結(jié)構(gòu)的理解; (2) 通過實(shí)驗(yàn)掌握ld 中如何使

    2024年02月03日
    瀏覽(94)
  • [ARM匯編]ARM體系結(jié)構(gòu)簡(jiǎn)介—1.2.1 ARM處理器的歷史與發(fā)展

    [ARM匯編]ARM體系結(jié)構(gòu)簡(jiǎn)介—1.2.1 ARM處理器的歷史與發(fā)展

    ARM(Advanced?RISC?Machine,先進(jìn)的精簡(jiǎn)指令集計(jì)算機(jī))處理器是一種廣泛應(yīng)用于嵌入式系統(tǒng)的處理器架構(gòu),具有低功耗、高性能、低成本等特點(diǎn)。接下來,我們將介紹 ARM 處理器的歷史與發(fā)展。 ARM 處理器的歷史 ARM 處理器的歷史可以追溯到 1983 年,當(dāng)時(shí)英國(guó)的 Acorn 電腦公司為了

    2024年02月09日
    瀏覽(235)
  • ARM處理器有哪些工作模式和寄存器?各寄存器作用是什么?ARM異常中斷處理流程?

    ARM處理器有哪些工作模式和寄存器?各寄存器作用是什么?ARM異常中斷處理流程?

    快速學(xué)習(xí)嵌入式開發(fā)其他基礎(chǔ)知識(shí)? 返回專欄總目錄 《嵌入式工程師自我修養(yǎng)/C語言》 Tip??:鼠標(biāo)懸停雙虛線/句,可獲得更詳細(xì)的描述 ??ARM處理器有多種工作模式,如下表所示。應(yīng)用程序正常運(yùn)行時(shí),ARM處理器工作在 用戶模式(User mode) ,當(dāng)程序運(yùn)行出錯(cuò)或有中

    2024年02月21日
    瀏覽(567)
  • 強(qiáng)大的處理器和接口支持BL304ARM控制器

    強(qiáng)大的處理器和接口支持BL304ARM控制器

    在智慧醫(yī)療領(lǐng)域,BL304可以用于實(shí)現(xiàn)醫(yī)療設(shè)備的智能化、遠(yuǎn)程監(jiān)控和數(shù)據(jù)交換。在智慧電力領(lǐng)域,BL304可以幫助實(shí)現(xiàn)電網(wǎng)的智能化管理,提升電力供應(yīng)的效率。在智慧安防領(lǐng)域,BL304可以實(shí)現(xiàn)智能監(jiān)控、智能門鎖等應(yīng)用,保障安全。 搭配四核 Cortex-A53+單核Cortex-M4構(gòu)架,運(yùn)行速度

    2024年02月10日
    瀏覽(94)
  • ARM Cortex-M處理器中的SysTick定時(shí)器簡(jiǎn)介

    ARM Cortex-M處理器中的SysTick是一個(gè)內(nèi)部的系統(tǒng)定時(shí)器,它提供了一種簡(jiǎn)單而有效的方式來生成定時(shí)的中斷請(qǐng)求。SysTick定時(shí)器是一個(gè)24位的下計(jì)數(shù)定時(shí)器,它可以配置為周期性地產(chǎn)生中斷,這些中斷可以用于操作系統(tǒng)的任務(wù)調(diào)度、性能測(cè)量、時(shí)間延遲等。 SysTick定時(shí)器的主要特點(diǎn)

    2024年04月28日
    瀏覽(93)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包