隨著人工智能領(lǐng)域不斷取得突破性進(jìn)展。作為實(shí)現(xiàn)人工智能技術(shù)的重要基石,AI芯片擁有巨大的產(chǎn)業(yè)價(jià)值和戰(zhàn)略地位。作為人工智能產(chǎn)業(yè)鏈的關(guān)鍵環(huán)節(jié)和硬件基礎(chǔ),AI芯片有著極高的技術(shù)研發(fā)和創(chuàng)新的壁壘。從芯片發(fā)展的趨勢來看,現(xiàn)在仍處于AI芯片發(fā)展的初級階段。未來將是AI芯片發(fā)展的重要階段,無論是架構(gòu)還是設(shè)計(jì)理念都存在著巨大的創(chuàng)新空間。
一、芯片的發(fā)展歷史
1956年達(dá)特茅斯會(huì)議上,科學(xué)家約翰·麥卡錫,克勞德·香農(nóng)和馬文·明斯基提出了"人工智能"一詞。50年代末,阿瑟·薩繆爾(ArthurSamuel)提出了"機(jī)器學(xué)習(xí)"這個(gè)術(shù)語,他開發(fā)了一個(gè)西洋跳棋程序,可以從錯(cuò)誤中吸取教訓(xùn),經(jīng)過學(xué)習(xí)后,甚至比編寫程序的人棋力更強(qiáng)。
在這個(gè)計(jì)算機(jī)技術(shù)飛速發(fā)展的時(shí)代,樂觀的環(huán)境讓研究人員相信AI技術(shù)將在短時(shí)間內(nèi)"攻克"。科學(xué)家們研究了基于人腦功能的計(jì)算是否能夠解決現(xiàn)實(shí)生活中的問題,創(chuàng)造了"神經(jīng)網(wǎng)絡(luò)"的概念。1970年,馬文·明斯基在《生活》雜志中講到,"未來3~8年內(nèi),我們將擁有相當(dāng)于普通人智力水平的機(jī)器。"
到了20世紀(jì)80年代,AI走出實(shí)驗(yàn)室,進(jìn)入商業(yè)化,掀起了一股投資熱潮。80年代末,AI技術(shù)泡沫最終破裂,AI又回到了研究領(lǐng)域,科學(xué)家們繼續(xù)開發(fā)AI的潛能。行業(yè)觀察者稱AI是一種超前于時(shí)代的技術(shù),也有人說是未來科技。經(jīng)歷了相當(dāng)長一段時(shí)間的所謂"AI寒冬"之后,商業(yè)開發(fā)再次啟動(dòng)。
1986年,杰弗里·希爾頓(GeoffreyHinton)和他的同事發(fā)表了一篇里程碑式的論文,描述了一種稱為"反向傳播(back-propagation)"的算法,該算法可以顯著提高多層或"深度"神經(jīng)網(wǎng)絡(luò)的性能。1989年,嚴(yán)恩·樂庫(YannLeCun)和貝爾實(shí)驗(yàn)室的其他研究人員創(chuàng)建了一個(gè)可以訓(xùn)練識別手寫的郵政編碼的神經(jīng)網(wǎng)絡(luò),展示了這項(xiàng)新技術(shù)在現(xiàn)實(shí)世界中的重要應(yīng)用。他們訓(xùn)練深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(CNN)只花了3天時(shí)間。時(shí)光飛逝到2009年,斯坦福大學(xué)的RajatRaina、AnandMadhavan和AndrewNg發(fā)表了一篇論文,闡述了現(xiàn)代GPU在深度學(xué)習(xí)領(lǐng)域擁有遠(yuǎn)遠(yuǎn)超過多核CPU的計(jì)算能力。AI已經(jīng)準(zhǔn)備好重新起航。
得益于摩爾定律在最近二十年的發(fā)展,充足的算力使得在可以接受的價(jià)格、功耗和時(shí)間內(nèi)提供人工智能算法所需的計(jì)算性能。根據(jù)英特爾的處理器芯片能力和零售價(jià)格對比測算,單位價(jià)格可以購買到的計(jì)算力提升了1.5萬倍,從而使"通用中央處理器"(CPU)可以支持各種人工智能任務(wù)??梢哉f,通過芯片技術(shù)來大幅增強(qiáng)人工智能研發(fā)的時(shí)機(jī)已經(jīng)非常成熟。然而,由于CPU要面對成百上千種工作任務(wù)來進(jìn)行設(shè)計(jì)和優(yōu)化,因此不可能犧牲靈活性來專門為某一類應(yīng)用做優(yōu)化,因此未必針對所有AI算法都是最優(yōu)的選擇。為此,出現(xiàn)了多種CPU加專用芯片的異構(gòu)計(jì)算方案,以解決計(jì)算資源和內(nèi)存訪問瓶頸的研究。此外,與"腦啟發(fā)式"(brain-inspired)的深度神經(jīng)網(wǎng)絡(luò)不同的"類腦"(brain-like)計(jì)算研究也推出了先進(jìn)的神經(jīng)擬態(tài)芯片來支持超高能效比的自然學(xué)習(xí)方式。
二、AI芯片的發(fā)展階段
人工智能核心計(jì)算芯片也經(jīng)歷了四次大的變化。
2007年以前,人工智能研究和應(yīng)用經(jīng)歷了數(shù)次起伏,一直沒有發(fā)展成為成熟的產(chǎn)業(yè);同時(shí)受限于當(dāng)時(shí)算法、數(shù)據(jù)等因素,這一階段人工智能對于芯片并沒有特別強(qiáng)烈的需求,通用的CPU芯片即可提供足夠的計(jì)算能力。之后,由于高清視頻、游戲等行業(yè)的發(fā)展,GPU產(chǎn)品取得快速的突破;同時(shí)人們發(fā)現(xiàn)GPU的并行計(jì)算特性恰好適應(yīng)人工智能算法大數(shù)據(jù)并行計(jì)算的要求,如GPU比之前傳統(tǒng)的CPU在深度學(xué)習(xí)算法的運(yùn)算上可以提高9倍到72倍的效率,因此開始嘗試使用GPU進(jìn)行人工智能的計(jì)算。進(jìn)入2010年后,云計(jì)算廣泛推廣,人工智能的研究人員可以通過云計(jì)算借助大量CPU和GPU進(jìn)行混合運(yùn)算,事實(shí)上今天人工智能主要的計(jì)算平臺還是云計(jì)算。但人工智能業(yè)界對于計(jì)算能力的要求不斷快速地提升,因此進(jìn)入2015年后,業(yè)界開始研發(fā)針對人工智能的專用芯片,通過更好的硬件和芯片架構(gòu),在計(jì)算效率上進(jìn)一步帶來10倍的提升。
(一)基于FPGA的半定制人工智能芯片
在芯片需求還未成規(guī)模、深度學(xué)習(xí)算法暫未穩(wěn)定需要不斷迭代改進(jìn)的情況下,利用具備可重構(gòu)特性的FPGA芯片來實(shí)現(xiàn)半定制的人工智能芯片是最佳選擇。
這類芯片中的杰出代表是國內(nèi)初創(chuàng)公司深鑒科技,該公司設(shè)計(jì)了"深度學(xué)習(xí)處理單元"(DeepProcessingUnit,DPU)的芯片,希望以ASIC級別的功耗來達(dá)到優(yōu)于GPU的性能,其第一批產(chǎn)品就是基于FPGA平臺。這種半定制芯片雖然依托于FPGA平臺,但是利用抽象出了指令集與編譯器,可以快速開發(fā)、快速迭代,與專用的FPGA加速器產(chǎn)品相比,也具有非常明顯的優(yōu)勢。
(二)針對深度學(xué)習(xí)算法的全定制人工智能芯片
這類芯片是完全采用ASIC設(shè)計(jì)方法全定制,性能、功耗和面積等指標(biāo)面向深度學(xué)習(xí)算法都做到了最優(yōu)。谷歌的TPU芯片、我國中科院計(jì)算所的寒武紀(jì)深度學(xué)習(xí)處理器芯片就是這類芯片的典型代表。
寒武紀(jì)在國際上開創(chuàng)了深度學(xué)習(xí)處理器方向:以寒武紀(jì)處理器為例,目前寒武紀(jì)系列已包含三種原型處理器結(jié)構(gòu):寒武紀(jì)1號(英文名DianNao,面向神經(jīng)網(wǎng)絡(luò)的原型處理器結(jié)構(gòu))、寒武紀(jì)2號(英文名DaDianNao,面向大規(guī)模神經(jīng)網(wǎng)絡(luò))、寒武紀(jì)3號(英文名PuDianNao,面向多種深度學(xué)習(xí)算法)。
寒武紀(jì)芯片計(jì)劃于今年內(nèi)實(shí)現(xiàn)產(chǎn)業(yè)化:其中寒武紀(jì)2號在28nm工藝下主頻為606MHz,面積67.7mm2,功耗約16W。其單芯片性能超過了主流GPU的21倍,而能耗僅為主流GPU的1/330。64芯片組成的高效能計(jì)算系統(tǒng)較主流GPU的性能提升甚至可達(dá)450倍,但總能耗僅為1/150。
(三)類腦計(jì)算芯片
這類芯片的設(shè)計(jì)目的不再局限于僅僅加速深度學(xué)習(xí)算法,而是在芯片基本結(jié)構(gòu)甚至器件層面上希望能夠開發(fā)出新的類腦計(jì)算機(jī)體系結(jié)構(gòu),比如會(huì)采用憶阻器和ReRAM等新器件來提高存儲(chǔ)密度。這類芯片的研究離成為市場上可以大規(guī)模廣泛使用的成熟技術(shù)還有很大的差距,甚至有很大的風(fēng)險(xiǎn),但是長期來看類腦芯片有可能會(huì)帶來計(jì)算體系的革命。
這類芯片的典型代表是IBM的Truenorh芯片。TrueNorth處理器由54億個(gè)連結(jié)晶體管組成,構(gòu)成了包含100萬個(gè)數(shù)字神經(jīng)元陣列,這些神經(jīng)元又可通過2.56億個(gè)電突觸彼此通信。
三、AI的研發(fā)方向
近幾年,AI技術(shù)的應(yīng)用場景開始向移動(dòng)設(shè)備轉(zhuǎn)移,比如汽車上的自動(dòng)駕駛、手機(jī)上的人臉識別等。產(chǎn)業(yè)的需求促成了技術(shù)的進(jìn)步,而AI芯片作為產(chǎn)業(yè)的根基,必須達(dá)到更強(qiáng)的性能、更高的效率、更小的體積,才能完成AI技術(shù)從云端到終端的轉(zhuǎn)移。
目前,AI芯片的研發(fā)方向主要分兩種:一是基于傳統(tǒng)馮·諾依曼架構(gòu)的FPGA(現(xiàn)場可編程門陣列)和ASIC(專用集成電路)芯片,二是模仿人腦神經(jīng)元結(jié)構(gòu)設(shè)計(jì)的類腦芯片。其中FPGA和ASIC芯片不管是研發(fā)還是應(yīng)用,都已經(jīng)形成一定規(guī)模;而類腦芯片雖然還處于研發(fā)初期,但具備很大潛力,可能在未來成為行業(yè)內(nèi)的主流。
這兩條發(fā)展路線的主要區(qū)別在于,前者沿用馮·諾依曼架構(gòu),后者采用類腦架構(gòu)。你看到的每一臺電腦,采用的都是馮·諾依曼架構(gòu)。它的核心思路就是處理器和存儲(chǔ)器要分開,所以才有了CPU(中央處理器)和內(nèi)存。而類腦架構(gòu),顧名思義,模仿人腦神經(jīng)元結(jié)構(gòu),因此CPU、內(nèi)存和通信部件都集成在一起。
四、AI芯片技術(shù)特點(diǎn)和代表性產(chǎn)品
從GPU,到FPGA和ASIC芯片
2007年以前,受限于當(dāng)時(shí)算法和數(shù)據(jù)等因素,AI對芯片還沒有特別強(qiáng)烈的需求,通用的CPU芯片即可提供足夠的計(jì)算能力。
之后由于高清視頻和游戲產(chǎn)業(yè)的快速發(fā)展,GPU(圖形處理器)芯片取得迅速的發(fā)展。因?yàn)镚PU有更多的邏輯運(yùn)算單元用于處理數(shù)據(jù),屬于高并行結(jié)構(gòu),在處理圖形數(shù)據(jù)和復(fù)雜算法方面比CPU更有優(yōu)勢,又因?yàn)锳I深度學(xué)習(xí)的模型參數(shù)多、數(shù)據(jù)規(guī)模大、計(jì)算量大,此后一段時(shí)間內(nèi)GPU代替了CPU,成為當(dāng)時(shí)AI芯片的主流。
GPU比CPU有更多的邏輯運(yùn)算單元(ALU)
然而GPU畢竟只是圖形處理器,不是專門用于AI深度學(xué)習(xí)的芯片,自然存在不足,比如在執(zhí)行AI應(yīng)用時(shí),其并行結(jié)構(gòu)的性能無法充分發(fā)揮,導(dǎo)致能耗高。
與此同時(shí),AI技術(shù)的應(yīng)用日益增長,在教育、醫(yī)療、無人駕駛等領(lǐng)域都能看到AI的身影。然而GPU芯片過高的能耗無法滿足產(chǎn)業(yè)的需求,因此取而代之的是FPGA芯片,和ASIC芯片。
那么這兩種芯片的技術(shù)特點(diǎn)分別是什么呢?又有什么代表性的產(chǎn)品呢?
"萬能芯片"FPGA
FPGA(FIELD-PROGRAMMABLEGATEARRAY),即"現(xiàn)場可編程門陣列",是在PAL、GAL、CPLD等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。
FPGA可以被理解為"萬能芯片"。用戶通過燒入FPGA配置文件,來定義這些門電路以及存儲(chǔ)器之間的連線,用硬件描述語言(HDL)對FPGA的硬件電路進(jìn)行設(shè)計(jì)。每完成一次燒錄,F(xiàn)PGA內(nèi)部的硬件電路就有了確定的連接方式,具有了一定的功能,輸入的數(shù)據(jù)只需要依次經(jīng)過各個(gè)門電路,就可以得到輸出結(jié)果。
用大白話說,"萬能芯片"就是你需要它有哪些功能、它就能有哪些功能的芯片。
盡管叫"萬能芯片",F(xiàn)PGA也不是沒有缺陷。正因?yàn)镕PGA的結(jié)構(gòu)具有較高靈活性,量產(chǎn)中單塊芯片的成本也比ASIC芯片高,并且在性能上,F(xiàn)PGA芯片的速度和能耗相比ASIC芯片也做出了妥協(xié)。
也就是說,"萬能芯片"雖然是個(gè)"多面手",但它的性能比不上ASIC芯片,價(jià)格也比ASIC芯片更高。
但是在芯片需求還未成規(guī)模、深度學(xué)習(xí)算法需要不斷迭代改進(jìn)的情況下,具備可重構(gòu)特性的FPGA芯片適應(yīng)性更強(qiáng)。因此用FPGA來實(shí)現(xiàn)半定制人工智能芯片,毫無疑問是保險(xiǎn)的選擇。
目前,F(xiàn)PGA芯片市場被美國廠商Xilinx和Altera瓜分。據(jù)國外媒體Marketwatch的統(tǒng)計(jì),前者占全球市場份額50%、后者占35%左右,兩家廠商霸占了85%的市場份額,專利達(dá)到6000多項(xiàng),毫無疑問是行業(yè)里的兩座大山。
Xilinx的FPGA芯片從低端到高端,分為四個(gè)系列,分別是Spartan、Artix、Kintex、Vertex,芯片工藝也從45到16納米不等。芯片工藝水平越高,芯片越小。其中Spartan和Artix主要針對民用市場,應(yīng)用包括無人駕駛、智能家居等;Kintex和Vertex主要針對軍用市場,應(yīng)用包括國防、航空航天等。
Xilinx的Spartan系列FPGA芯片
我們再說說Xilinx的老對手Altera。Altera的主流FPGA芯片分為兩大類,一種側(cè)重低成本應(yīng)用,容量中等,性能可以滿足一般的應(yīng)用需求,如Cyclone和MAX系列;還有一種側(cè)重于高性能應(yīng)用,容量大,性能能滿足各類高端應(yīng)用,如Startix和Arria系列。Altera的FPGA芯片主要應(yīng)用在消費(fèi)電子、無線通信、軍事航空等領(lǐng)域。
專用集成電路ASIC
在AI產(chǎn)業(yè)應(yīng)用大規(guī)模興起之前,使用FPGA這類適合并行計(jì)算的通用芯片來實(shí)現(xiàn)加速,可以避免研發(fā)ASIC這種定制芯片的高投入和風(fēng)險(xiǎn)。
但就像我們剛才說到的,由于通用芯片的設(shè)計(jì)初衷并非專門針對深度學(xué)習(xí),因此FPGA難免存在性能、功耗等方面的瓶頸。隨著人工智能應(yīng)用規(guī)模的擴(kuò)大,這類問題將日益突出。換句話說,我們對人工智能所有的美好設(shè)想,都需要芯片追上人工智能迅速發(fā)展的步伐。如果芯片跟不上,就會(huì)成為人工智能發(fā)展的瓶頸。
所以,隨著近幾年人工智能算法和應(yīng)用領(lǐng)域的快速發(fā)展,以及研發(fā)上的成果和工藝上的逐漸成熟,ASIC芯片正在成為人工智能計(jì)算芯片發(fā)展的主流。
ASIC芯片是針對特定需求而定制的專用芯片。雖然犧牲了通用性,但ASIC無論是在性能、功耗還是體積上,都比FPGA和GPU芯片有優(yōu)勢,特別是在需要芯片同時(shí)具備高性能、低功耗、小體積的移動(dòng)端設(shè)備上,比如我們手上的手機(jī)。
但是,因?yàn)槠渫ㄓ眯缘停珹SIC芯片的高研發(fā)成本也可能會(huì)帶來高風(fēng)險(xiǎn)。然而如果考慮市場因素,ASIC芯片其實(shí)是行業(yè)的發(fā)展大趨勢。文章來源:http://www.zghlxwxcb.cn/news/detail-418139.html
為什么這么說呢?因?yàn)閺姆?wù)器、計(jì)算機(jī)到無人駕駛汽車、無人機(jī),再到智能家居的各類家電,海量的設(shè)備需要引入人工智能計(jì)算能力和感知交互能力。出于對實(shí)時(shí)性的要求,以及訓(xùn)練數(shù)據(jù)隱私等考慮,這些能力不可能完全依賴云端,必須要有本地的軟硬件基礎(chǔ)平臺支撐。而ASIC芯片高性能、低功耗、小體積的特點(diǎn)恰好能滿足這些需求。文章來源地址http://www.zghlxwxcb.cn/news/detail-418139.html
到了這里,關(guān)于AI 芯片的簡要發(fā)展歷史的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!