縱觀人類歷史,從結(jié)繩計(jì)數(shù)、木制計(jì)數(shù)到巴比倫的粘土板上的刻痕,再到中國(guó)古代的算盤,社會(huì)生產(chǎn)力的提高與當(dāng)時(shí)所采用的計(jì)算工具密切相關(guān)。計(jì)算工具能力越強(qiáng),就能大幅縮短人類解決復(fù)雜問(wèn)題的時(shí)間,社會(huì)生產(chǎn)力水平自然就會(huì)越高。
CPU
CPU,全稱Central Processing Unit,即中央處理器?,F(xiàn)代電子計(jì)算機(jī)的發(fā)明是基于1940年代誕生的馮·諾依曼架構(gòu),這個(gè)架構(gòu)主要由運(yùn)算器、控制器、存儲(chǔ)器、輸入設(shè)備、輸出設(shè)備等五個(gè)主要部分組成。
- 特點(diǎn):CPU具有通用性和靈活性,能夠執(zhí)行各種任務(wù),如操作系統(tǒng)管理、軟件運(yùn)行和數(shù)據(jù)處理等。它擅長(zhǎng)串行計(jì)算,即按照指定順序執(zhí)行任務(wù)。
- 應(yīng)用:廣泛應(yīng)用于個(gè)人電腦、服務(wù)器、移動(dòng)設(shè)備等各種計(jì)算設(shè)備中。
按照馮·諾依曼架構(gòu),數(shù)據(jù)來(lái)了會(huì)先放到存儲(chǔ)器。然后,控制器會(huì)從存儲(chǔ)器拿到相應(yīng)數(shù)據(jù),再交給運(yùn)算器進(jìn)行運(yùn)算。運(yùn)算完成后,再把結(jié)果返回到存儲(chǔ)器。大致的架構(gòu)如圖1所示,其中運(yùn)算器和控制器兩個(gè)部分組成了CPU的主要功能。
上面的計(jì)算方式,從數(shù)據(jù)輸入到輸出算一個(gè)完整的處理流程,馮·諾依曼體系采用的就是串行運(yùn)算方式。即一次只能進(jìn)行一項(xiàng)計(jì)算任務(wù),只有上一個(gè)計(jì)算指令完成了,數(shù)據(jù)存儲(chǔ)了,才能開(kāi)啟下一個(gè)指令。
這就是CPU所采用的先進(jìn)先出運(yùn)算模式。從個(gè)人計(jì)算機(jī)誕生起,CPU的硬件架構(gòu)到指令集都是基于串行運(yùn)算模式設(shè)計(jì),其優(yōu)勢(shì)是邏輯控制力好,即計(jì)算通用性很好,為的就是能應(yīng)付各種復(fù)雜的計(jì)算需求,在軟件對(duì)計(jì)算性能要求不高的時(shí)代,這種設(shè)計(jì)是有優(yōu)勢(shì)的。
GPU
GPU,全程Graphics Processing Unit,又稱圖像處理器(顯示核心、視覺(jué)處理器、顯示芯片),是一種專門用于處理圖形和圖像計(jì)算任務(wù)的處理器。
- 特點(diǎn):GPU擁有大量的小型處理核心,可同時(shí)處理多個(gè)任務(wù),能夠高效地執(zhí)行并行計(jì)算。它在處理復(fù)雜圖像、視頻和3D圖形等方面表現(xiàn)出色。但值得注意的是,GPU無(wú)法單獨(dú)工作,必須由CPU進(jìn)行控制調(diào)用才能工作。
- 應(yīng)用:基于它的特點(diǎn),GPU不僅可以在圖像處理領(lǐng)域大顯身手,如游戲產(chǎn)業(yè)、動(dòng)畫制作;它還被用來(lái)科學(xué)計(jì)算、數(shù)值分析、海量數(shù)據(jù)處理、金融分析等需要大規(guī)模并行計(jì)算的領(lǐng)域。
GPU除作為獨(dú)立顯卡的核心用于個(gè)人電腦,為高清視頻、大型游戲提供高質(zhì)量3D圖形渲染,基于GPU構(gòu)建的專業(yè)顯卡還配置在高端工作站上做復(fù)雜的三維設(shè)計(jì)和工程仿真。但當(dāng)前GPU最重要的應(yīng)用場(chǎng)景還是AI計(jì)算,支撐AI大模型的訓(xùn)練和推理。
Q:那為什么CPU不行,非GPU不可?
A:GPU的推出就是為了接手原本由CPU負(fù)責(zé)的圖形顯示處理工作。因而GPU架構(gòu)有其先天的計(jì)算特征,就是完全為3D圖形處理而設(shè)計(jì)。
- CPU指令相對(duì)復(fù)雜,它需要做好資源的調(diào)度和控制,支持操作系統(tǒng)的中斷處理、內(nèi)存管理、I/O處理等,運(yùn)算過(guò)程需要大量的邏輯控制,因此內(nèi)部的控制單元較多,極大擠壓了計(jì)算單元數(shù)量,使計(jì)算性能受到很大限制,還需要預(yù)留空間為數(shù)據(jù)建立多級(jí)緩存;
- GPU運(yùn)算就不需要考慮這些,也無(wú)需太多的控制單元,芯片上大部分空間都留給了計(jì)算單元,因此適合并行計(jì)算任務(wù)和大規(guī)模數(shù)據(jù)訪問(wèn),通常具有更高的帶寬和更低的延遲。
ASIC
ASIC(Application Specific Integrated Circuit)是一種為專門目的而設(shè)計(jì)的集成電路。無(wú)法重新編程,效能高功耗低,但價(jià)格昂貴。近年來(lái)涌現(xiàn)出的類似TPU、NPU、VPU、BPU等各種芯片,本質(zhì)上都屬于ASIC。
ASIC不同于 GPU 和 FPGA 的靈活性,定制化的 ASIC 一旦制造完成將不能更改,所以初期成本高、開(kāi)發(fā)周期長(zhǎng)的使得進(jìn)入門檻高。目前,大多是具備 AI 算法又擅長(zhǎng)芯片研發(fā)的巨頭參與,如 Google 的 TPU。由于完美適用于神經(jīng)網(wǎng)絡(luò)相關(guān)算法,ASIC 在性能和功耗上都要優(yōu)于 GPU 和 FPGA,TPU1 是傳統(tǒng) GPU 性能的 14-16 倍,NPU 是 GPU 的 118 倍。寒武紀(jì)已發(fā)布對(duì)外應(yīng)用指令集,預(yù)計(jì) ASIC 將是未來(lái) AI 芯片的核心。
ASIC芯片的計(jì)算能力和計(jì)算效率都可以根據(jù)算法需要進(jìn)行定制,所以ASIC與通用芯片相比,具有以下幾個(gè)方面的優(yōu)越性:體積小、功耗低、計(jì)算性能高、計(jì)算效率高、芯片出貨量越大成本越低。但ASIC芯片的算法是固定的,一旦算法變化就可能無(wú)法使用。
NPU
NPU(Neural network Processing Unit), 即神經(jīng)網(wǎng)絡(luò)處理器。神經(jīng)網(wǎng)絡(luò)處理器NPU采用“數(shù)據(jù)驅(qū)動(dòng)并行計(jì)算”的架構(gòu),是專門為人工智能應(yīng)用開(kāi)發(fā)的處理器,尤其擅長(zhǎng)進(jìn)行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理計(jì)算,特別是處理視頻、圖像類的海量多媒體數(shù)據(jù)。
- 特點(diǎn):NPU采用了專門的硬件加速技術(shù),能夠高效地進(jìn)行大規(guī)模的矩陣運(yùn)算,解決了傳統(tǒng)芯片在神經(jīng)網(wǎng)絡(luò)運(yùn)算時(shí)效率低下的問(wèn)題。
- 應(yīng)用:NPU主要應(yīng)用于人臉識(shí)別、語(yǔ)音識(shí)別、自動(dòng)駕駛、智能相機(jī)等需要進(jìn)行深度學(xué)習(xí)任務(wù)的領(lǐng)域。
TPU
TPU,全稱Tensor Processing Unit,即張量處理單元,TPU是谷歌開(kāi)發(fā)的一種特殊類型的芯片,專門用于加速人工智能和機(jī)器學(xué)習(xí)工作負(fù)載。(張量(tensor)是一個(gè)包含多個(gè)數(shù)字/多維數(shù)組的數(shù)學(xué)實(shí)體)。
目前,幾乎所有的機(jī)器學(xué)習(xí)系統(tǒng),都使用張量作為基本數(shù)據(jù)結(jié)構(gòu)。所以,張量處理單元,我們可以簡(jiǎn)單理解為“AI處理單元”。TPU主要針對(duì)張量(tensor)操作進(jìn)行了優(yōu)化,提高了機(jī)器學(xué)習(xí)相關(guān)任務(wù)的性能。
- 特點(diǎn):TPU具有卓越的張量計(jì)算能力,能夠高速進(jìn)行大規(guī)模矩陣運(yùn)算,支持高性能的神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理計(jì)算。
- 應(yīng)用:常用于機(jī)器學(xué)習(xí)模型的訓(xùn)練和推理計(jì)算,例如在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)和語(yǔ)音識(shí)別等領(lǐng)域中發(fā)揮重要作用。
BPU
BPU,Brain Processing Unit,大腦處理器。是由地平線科技提出的嵌入式人工智能處理器架構(gòu)。第一代是高斯架構(gòu),第二代是伯努利架構(gòu),第三代是貝葉斯架構(gòu)。目前地平線已經(jīng)設(shè)計(jì)出了第一代高斯架構(gòu),并與英特爾在2017年CES展會(huì)上聯(lián)合推出了ADAS系統(tǒng)(高級(jí)駕駛輔助系統(tǒng))
FPGA
FPGA全稱是可編程邏輯門陣列,內(nèi)部結(jié)構(gòu)由大量的數(shù)字(或模擬)電路組成,可以實(shí)現(xiàn)各種功能。FPGA是ASIC的一種,只是ASIC是全定制電路芯片,F(xiàn)PGA是半定制電路芯片,它解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點(diǎn)。
數(shù)據(jù)計(jì)算包括兩種方式:一種是利用CPU或GPU基于指令的架構(gòu)編寫計(jì)算所需的軟件,另一種是針對(duì)特定計(jì)算需求設(shè)計(jì)制造出一套專用的電路,比如ASIC、FPGA。但不同的是,對(duì)FPGA進(jìn)行編程要使用硬件描述語(yǔ)言,硬件描述語(yǔ)言描述的邏輯可以直接被編譯為晶體管電路的組合。所以FPGA實(shí)際上直接用晶體管電路實(shí)現(xiàn)用戶的算法,沒(méi)有通過(guò)指令系統(tǒng)的翻譯。
相比于CPU 和GPU數(shù)據(jù)處理需先讀取指令和完成指令譯碼,F(xiàn)PGA不采用指令和軟件,是軟硬件合一的器件。因而計(jì)算效率更高、功耗更低,且更接近IO。
總結(jié)
-
功能:CPU具有通用性,適用于各種計(jì)算任務(wù);GPU擅長(zhǎng)圖形渲染和并行計(jì)算;NPU專注于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理計(jì)算;TPU專為機(jī)器學(xué)習(xí)任務(wù)而設(shè)計(jì)。
-
并行能力:GPU和TPU具有更多的處理核心和更高的并行計(jì)算能力,適合處理大規(guī)模并行計(jì)算任務(wù)。
-
硬件加速:NPU和TPU采用專門的硬件加速技術(shù),能夠高效地執(zhí)行特定類型的計(jì)算任務(wù)。
-
應(yīng)用領(lǐng)域:CPU廣泛應(yīng)用于個(gè)人電腦、服務(wù)器等各種設(shè)備;GPU主要應(yīng)用于游戲、動(dòng)畫制作、科學(xué)計(jì)算等領(lǐng)域;NPU常用于人臉識(shí)別、語(yǔ)音識(shí)別等人工智能應(yīng)用;TPU常用于深度學(xué)習(xí)任務(wù)和自然語(yǔ)言處理等領(lǐng)域。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-825930.html
目前主流Al芯片就三類:以GPU為代表的通用芯片、以ASIC定制化為代表的專用芯片以及以FPGA為代表的半定制化芯片,其中GPU市場(chǎng)最為成熟且應(yīng)用最廣。但人工智能產(chǎn)業(yè)發(fā)展除了需要強(qiáng)大的算力,還需要更優(yōu)秀的算法和龐大的數(shù)據(jù)支撐,GPU能否在AI算力競(jìng)爭(zhēng)中持續(xù)保持優(yōu)勢(shì)仍是未知。在我們看來(lái),有谷歌和華為背書的ASIC,以及英特爾和AMD背書的FPGA,未來(lái)都是有很大破局機(jī)會(huì)的。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-825930.html
到了這里,關(guān)于一文讀懂「四大主流計(jì)算芯片 CPU、GPU、ASIC、FPGA」特點(diǎn)和場(chǎng)景的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!