谷歌開(kāi)源了TensorFlow,世界就要馬上被改變了嗎
Google開(kāi)源了其第二代深度學(xué)習(xí)技術(shù)TensorFlow——被使用在Google搜索、圖像識(shí)別以及郵箱的深度學(xué)習(xí)框架。這在相關(guān)媒體圈、工程師圈、人工智能公司、人工智能研究團(tuán)隊(duì)里有了一些討論。
比較有趣的是,微軟亞洲研究院立刻向媒體發(fā)郵件表示,我們發(fā)布了開(kāi)源分布式機(jī)器學(xué)習(xí)工具包(DMTK)。對(duì)于大眾來(lái)說(shuō),這件事讓人“困惑”。
從“深度學(xué)習(xí)”到“分布式系統(tǒng)”,太多概念大眾一知半解,現(xiàn)今給出的資料又讓人難以理解。而對(duì)于“Google開(kāi)源TensorFlow”這一事件,各個(gè)公司、團(tuán)隊(duì)、學(xué)術(shù)權(quán)威也是眾說(shuō)紛紜。
因此,出門問(wèn)問(wèn)為大家“破霧”,并講一講這次開(kāi)源意味著什么。什么是深度學(xué)習(xí)?深度學(xué)習(xí)系統(tǒng)是什么?深度學(xué)習(xí)理論于2006年被提出,它通過(guò)模擬“人腦的神經(jīng)網(wǎng)絡(luò)”來(lái)解釋圖像、聲音和文本等數(shù)據(jù)。
但是目前的計(jì)算機(jī)還達(dá)不到模擬人腦數(shù)量龐大的神經(jīng)元(千億級(jí)),因此便有了用到成千上萬(wàn)大型計(jì)算機(jī)(計(jì)算平臺(tái)集群)來(lái)吸收數(shù)據(jù)對(duì)其進(jìn)行自動(dòng)分類的“分布式深度學(xué)習(xí)系統(tǒng)”。
TensorFlow的起源和此次開(kāi)源事件Google將自家研發(fā)的深度學(xué)習(xí)系統(tǒng)命名為“DistBelief”,它使得Google能夠同時(shí)處理成千上萬(wàn)臺(tái)大型計(jì)算機(jī)的數(shù)據(jù),構(gòu)建更大型的神經(jīng)網(wǎng)絡(luò)和大規(guī)模訓(xùn)練。
Google的搜索、圖像識(shí)別及郵箱等均采用了該技術(shù)。一般情況下,深度學(xué)習(xí)系統(tǒng)都需要先設(shè)定好feature(特征),再學(xué)習(xí)如何分辨。
但GoogleDistBelief神奇的地方在于,“GoogleBrain”開(kāi)發(fā)團(tuán)隊(duì)“XLab”曾用它在未事先獲取“貓的特征描述”信息的情況下,從大量YouTube視頻中區(qū)分出了哪些是貓的視頻。
這意味著深度學(xué)習(xí)系統(tǒng)“DistBelief”自行總結(jié)出了貓的feature(特征)!雖然這個(gè)案例的識(shí)別范圍、識(shí)別率有待提高(81.7%),但作為人工智能最經(jīng)典案例之一,為人工智能翻開(kāi)了新的篇章。
而“貓”的事件,也讓曾經(jīng)的GoogleBrain開(kāi)發(fā)團(tuán)隊(duì)“XLab”的核心人員、現(xiàn)在被李彥宏挖到百度的吳恩達(dá)得到了“GoogleBrain”之父的美譽(yù)。
不過(guò),時(shí)代總是進(jìn)步,而“DistBelief”有缺陷。Google稱,雖然DistBelief非常成功,但它僅僅以神經(jīng)網(wǎng)絡(luò)為目的、十分局限,而且很難進(jìn)行配置。
另外,DistBelief牢牢綁定在Google的內(nèi)部基礎(chǔ)設(shè)施上,幾乎不可能將代碼與外界共享。因此,本文的主角,Google的第二代深度學(xué)習(xí)系統(tǒng)“TensorFlow”橫空出世了。
Google表示,TensorFlow在設(shè)計(jì)上尤其針對(duì)克服DistBelief的短板,靈活、更通用、易使用、更快,而且完全開(kāi)源。
TensorFlow可以被架設(shè)在智能手機(jī)這樣小的設(shè)備上,甚至僅一塊電路板上,更靈活;TensorFlow可以被使用在很多計(jì)算平臺(tái),無(wú)論是智能手機(jī)還是大型計(jì)算機(jī)、單個(gè)CPU/GPU計(jì)算機(jī)還是成百上千GPU卡組成的分布式系統(tǒng),ARM的還是X86的構(gòu)架,更通用;TensorFlow支持多種編程語(yǔ)言,提供了很多深度學(xué)習(xí)模型庫(kù),易使用;在很多指標(biāo)上,TensorFlow要比DistBelief要快一倍,更快。
但是,學(xué)術(shù)界和工程界的一些朋友并不喜歡這個(gè)“剛剛闖入”開(kāi)源界的“小伙子”,判了它“意義不大”的死刑。
“TensorFlow”之所以“開(kāi)源”卻不討好,是因?yàn)門ensorFlow不是第一個(gè)被開(kāi)源的深度學(xué)習(xí)系統(tǒng),并且目前只開(kāi)源了“單機(jī)版”,而非能夠識(shí)別貓的“分布式版本”。
除了并非第一以及只開(kāi)源了單機(jī)版代碼這兩點(diǎn)外,Google開(kāi)源TensorFlow這件事最被人詬病的地方在于,在“用事實(shí)”、“用數(shù)據(jù)”說(shuō)話的學(xué)術(shù)界、工程界,Google并未用“數(shù)據(jù)對(duì)比”證明TensorFlow的“靈活、更通用、易使用”。
對(duì)于TensorFlow,出門問(wèn)問(wèn)的看法是,TensorFlow對(duì)學(xué)術(shù)界意義不大,但是對(duì)工程界意義挺大。
TensorFlow對(duì)工程界有意義:其它開(kāi)源工具雖然眾多但對(duì)工程界很難有效使用Google這次開(kāi)源的TensorFlow是一種人工智能(更具體的說(shuō)是深度學(xué)習(xí))編程語(yǔ)言或計(jì)算框架,學(xué)術(shù)界從來(lái)都不缺少類似的開(kāi)源工具,尤其是“單機(jī)版工具包”有很多。
但是學(xué)術(shù)界的工具往往更多專注在核心算法上,在系統(tǒng)和工程方面比較欠缺,工業(yè)界很難直接有效的使用,而Google的TensorFlow在架構(gòu)設(shè)計(jì),跨平臺(tái)可移植性,算法可擴(kuò)展性等等偏工程方面會(huì)做的比較好。
所以,TensorFlow對(duì)學(xué)術(shù)界的幫助比較小,但對(duì)工業(yè)界的幫助有很大潛在可能性。
比如語(yǔ)音識(shí)別、自然語(yǔ)言理解、計(jì)算機(jī)視覺(jué)、廣告等等都可以應(yīng)用這種深度學(xué)習(xí)算法,Google也因?yàn)樯疃葘W(xué)習(xí)系統(tǒng)的應(yīng)用使得Google語(yǔ)音識(shí)別水平提高25%。
有意義歸有意義,意義的大小是另一回事了。在這個(gè)信息交流頻繁的時(shí)代,沒(méi)有公司能隨便制造一個(gè)具有超大意義的事件或者跨時(shí)代的黑科技產(chǎn)品。
對(duì)于工程界,TensorFlow有意義但又不是神乎其神的東西,尤其是Google目前開(kāi)源的“單機(jī)版”的TensorFlow意義要小一些。
因?yàn)樵诠こ探缋?,若要完成一整件事,如識(shí)別語(yǔ)音,TensorFlow這種通用深度學(xué)習(xí)框架的存在更多是錦上添花,而非決定根本。
比如說(shuō)在一個(gè)可以應(yīng)用的語(yǔ)音識(shí)別系統(tǒng)里,除了深度學(xué)習(xí)算法外,還有很多工作是專業(yè)領(lǐng)域相關(guān)的算法以及海量數(shù)據(jù)收集和工程系統(tǒng)架構(gòu)的搭建。其實(shí),對(duì)于中國(guó)來(lái)說(shuō),TensorFlow還有一個(gè)意義。
在人工智能大潮下許多人和公司想入局,但大都沒(méi)有能力理解并開(kāi)發(fā)一個(gè)與國(guó)際同步的深度學(xué)習(xí)系統(tǒng),而TensorFlow的存在會(huì)大大降低深度學(xué)習(xí)在各個(gè)行業(yè)中的應(yīng)用難度。
至于弄懂TensorFlow要花費(fèi)大量時(shí)間的問(wèn)題,就像很多公司用Linux或者h(yuǎn)adoop(一種分布式系統(tǒng)基礎(chǔ)架構(gòu))但很少有公司弄懂了所有源代碼一樣,可以把TensorFlow當(dāng)成一個(gè)黑盒,先快速用起來(lái),之后再根據(jù)數(shù)據(jù)和專業(yè)領(lǐng)域知識(shí)來(lái)調(diào)整。
總的來(lái)說(shuō),如果Google按照其所說(shuō)的那樣,在未來(lái)完全開(kāi)源TensorFlow——包括其“分布式版本”,那么TensorFlow對(duì)工程界的影響會(huì)更明顯些——尤其對(duì)中國(guó)創(chuàng)業(yè)公司來(lái)說(shuō)。
谷歌人工智能寫作項(xiàng)目:小發(fā)貓
如何選擇深度學(xué)習(xí)框架 TensorFlow/Torch/Mxnet/Theano
深度學(xué)習(xí)目前的應(yīng)用領(lǐng)域很多,主要是計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理,以及各種預(yù)測(cè)等常見(jiàn)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
對(duì)于計(jì)算機(jī)視覺(jué),可以做圖像分類、目標(biāo)檢測(cè)、視頻中的目標(biāo)檢測(cè)等,對(duì)于自然語(yǔ)言處理,可以做語(yǔ)音識(shí)別、語(yǔ)音合成、對(duì)話系統(tǒng)、機(jī)器翻譯、文章摘要、情感分析等。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-485239.html
對(duì)于剛?cè)胄猩疃葘W(xué)習(xí),想從事人工智能工業(yè)應(yīng)用和研發(fā)的小白來(lái)說(shuō),選擇文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-485239.html
到了這里,關(guān)于谷歌云計(jì)算技術(shù)基礎(chǔ)架構(gòu),谷歌卷積神經(jīng)網(wǎng)絡(luò)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!