這一系列開源項(xiàng)目代表著多個(gè)領(lǐng)域的最新技術(shù)成果,包括深度學(xué)習(xí)、自然語言處理、計(jì)算機(jī)視覺和分布式訓(xùn)練。它們共同的特點(diǎn)是致力于教育、資源分享、開源精神、多領(lǐng)域應(yīng)用以及性能和效率的追求,為廣大開發(fā)者、研究者和學(xué)生提供了寶貴的工具和知識,推動(dòng)了人工智能領(lǐng)域的不斷發(fā)展和創(chuàng)新。
d2l-ai/d2l-zh
Stars: 46.5k
License: Apache-2.0
本開源項(xiàng)目代表了我們的一種嘗試:我們將教給讀者概念、背景知識和代碼;我們將在同一個(gè)地方闡述剖析問題所需的批判性思維、解決問題所需的數(shù)學(xué)知識,以及實(shí)現(xiàn)解決方案所需的工程技能。
我們的目標(biāo)是創(chuàng)建一個(gè)為實(shí)現(xiàn)以下目標(biāo)的統(tǒng)一資源:
- 所有人均可在網(wǎng)上免費(fèi)獲??;
- 提供足夠的技術(shù)深度,從而幫助讀者實(shí)際成為深度學(xué)習(xí)應(yīng)用科學(xué)家:既理解數(shù)學(xué)原理,又能夠?qū)崿F(xiàn)并不斷改進(jìn)方法;
- 包含可運(yùn)行的代碼,為讀者展示如何在實(shí)際中解決問題。這樣不僅直接將數(shù)學(xué)公式對應(yīng)成實(shí)際代碼,而且可以修改代碼、觀察結(jié)果并及時(shí)獲取經(jīng)驗(yàn);
- 允許我們和整個(gè)社區(qū)不斷快速迭代內(nèi)容,從而緊跟仍在高速發(fā)展的深度學(xué)習(xí)領(lǐng)域;
- 由包含有關(guān)技術(shù)細(xì)節(jié)問答的論壇作為補(bǔ)充,使大家可以相互答疑并交換經(jīng)驗(yàn)。
openai/whisper
Stars: 36.9k
License: MIT
Whisper是一個(gè)通用的語音識別模型,它通過大規(guī)模弱監(jiān)督訓(xùn)練了多樣化的音頻數(shù)據(jù),并且可以執(zhí)行多語言語音識別、語音翻譯和語種鑒定等任務(wù)。該項(xiàng)目采用Transformer sequence-to-sequence 模型,在各種處理任務(wù)中進(jìn)行訓(xùn)練,使用一組特殊標(biāo)記作為任務(wù)指示器或分類目標(biāo)。這使得單個(gè)模型能夠替代傳統(tǒng)的多階段流程,提高效率并降低成本。
優(yōu)點(diǎn):
- 可以完成多項(xiàng)復(fù)雜的自然語言處理任務(wù)。
- 訓(xùn)練數(shù)據(jù)集廣泛而豐富,具有較高準(zhǔn)確度。
- 使用開源框架PyTorch實(shí)現(xiàn)。
可用性:
- 提供五種不同大小版本的預(yù)訓(xùn)練模型及其對應(yīng)內(nèi)存需求。
- 支持Python 3.8以上版本,并依賴于部分第三方庫(如tokenizers)。
CMU-Perceptual-Computing-Lab/openpose
Stars: 27.9k
License: NOASSERTION
OpenPose 是一個(gè)開源項(xiàng)目,它是第一個(gè)能夠在單個(gè)圖像上聯(lián)合檢測人體、手部、面部和腳步關(guān)鍵點(diǎn) (總共 135 個(gè)關(guān)鍵點(diǎn)) 的實(shí)時(shí)多人系統(tǒng)。該項(xiàng)目具有以下核心優(yōu)勢:
- 2D 實(shí)時(shí)多人關(guān)鍵點(diǎn)檢測功能
- 支持 15,18 或 25 個(gè)身體/足跡關(guān)鍵點(diǎn)估計(jì),并包括 6 個(gè)足跡關(guān)鍵點(diǎn)。運(yùn)行時(shí)間與被檢測到的人數(shù)無關(guān)。
- 支持 2x21 個(gè)手部關(guān)節(jié)點(diǎn)估計(jì),運(yùn)行時(shí)間取決于被檢測到的人數(shù)。
- 支持 70 個(gè)面部特征點(diǎn)估計(jì),運(yùn)行時(shí)間取決于被檢測到的人數(shù)。
- 實(shí)時(shí) 3D 單一用戶骨架姿態(tài)識別:支持從多視角進(jìn)行三維重建;處理 Flir 相機(jī)同步;兼容 Flir / Point Grey 相機(jī);
- 提供校準(zhǔn)工具箱以用來評價(jià)失真度,內(nèi)參和外參等攝像頭參數(shù)。
microsoft/DeepSpeed
Stars: 24.2k
License: Apache-2.0
DeepSpeed是一個(gè)深度學(xué)習(xí)優(yōu)化庫,使分布式訓(xùn)練和推理變得簡單、高效和有效。它能夠在資源受限的GPU系統(tǒng)上進(jìn)行訓(xùn)練/推理,并實(shí)現(xiàn)了模型參數(shù)數(shù)十億或萬億級別的密集或稀疏模型的訓(xùn)練/推理。此外,它還可以以前所未有的低延遲和高吞吐量進(jìn)行推斷,并且具有極端壓縮功能來減少成本并提供無與倫比的推斷速度和模型大小縮小。 DeepSpeed軟件套件包括三個(gè)創(chuàng)新支柱:DeepSpeed-Training、DeepSpeed-Inference 和 DeepSpeed-Compression, 分別用于大規(guī)模DL訓(xùn)練、超大規(guī)模DL預(yù)測及其壓縮技術(shù)等領(lǐng)域。
geohot/tinygrad
Stars: 11.8k
License: MIT
文章來源:http://www.zghlxwxcb.cn/news/detail-721551.html
tinygrad是一個(gè)深度學(xué)習(xí)框架,其核心代碼不足1000行。它的設(shè)計(jì)目標(biāo)是簡單易用,并且容易添加新的加速器支持。雖然功能較少,但支持基本操作和一些SOTA模型(如efficientnet.py和transformer.py)。另外還提供了對Apple Neural Engine和Google TPU等硬件加速器的支持。文章來源地址http://www.zghlxwxcb.cn/news/detail-721551.html
到了這里,關(guān)于AI驅(qū)動(dòng)的未來:探索人工智能的無限潛力 | 開源專題 No.39的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!