隨著以 ChatGPT 為代表的 AIGC(AI-Generated Content)技術(shù)的極速普及、以及 AI4S(AI for Science)從愿景走向流行,不同領(lǐng)域、不同背景的人們以一種前所未有的方式連接在了一起,共同經(jīng)歷著知識結(jié)構(gòu)、技術(shù)體系、產(chǎn)業(yè)格局等方方面面的大重構(gòu)。很多人開始問我們發(fā)起 NBHub 的初衷和整體思考、進而問如何更好地促進合作與碰撞,希望本篇能給出一個系統(tǒng)但依舊初步的答案。
簡短版答案
AI4S 與 AIGC 將給整個人類社會的教學(xué)與科研體系帶來巨大的變革;在這場變革中,知識的承載形式及交流分享方式、技術(shù)從底層算法創(chuàng)新到應(yīng)用落地的過程,都將發(fā)生巨大的改變;進而,AIGC 將深刻影響社會生活的方方面面,而 AI4S 將推動科學(xué)研究與工業(yè)研發(fā)的持續(xù)革新、從而深刻改變世界;在此背景下,NBHub 希望以云上 Notebook 及進一步衍生出來的一系列文中被稱為“代謝通路”的“發(fā)表體系”為載體,推動解決教學(xué)與科研體系革新過程中的瓶頸問題,進而推動形成一個鼓勵開放的技術(shù)交流與分享、將拓展個人能力邊界和人類認(rèn)知邊界融為一體的社區(qū)共同體。
NBHub 的口號是“讓知識跑起來”。這里的“跑”既指知識以云上 Notebook 的形式一鍵運行、快速上手,又指知識在一個跨領(lǐng)域的開放共建的社區(qū)中充分、自由地傳播與分享。
中長版答案
我們將通過以下四個部分進行討論:
- AI4S 與 AIGC 時代,知識體系的更新迭代在加速、從底層創(chuàng)新到應(yīng)用落地的過程在加速;
- 教學(xué)的新痛點、新需求、新實踐——云上 Notebook 如何革新知識的傳播、分享、與學(xué)習(xí)方式;
- 科研的新痛點、新需求、新實踐——云上 Notebook 如何革新跨學(xué)科科研過程及廣義的學(xué)術(shù)發(fā)表體系;
- 綜合上述討論,NBHub 希望做什么。
AI4S 與 AIGC 時代,知識體系的更新迭代在加速、從底層創(chuàng)新到應(yīng)用落地的過程在加速
自工業(yè)革命以來,人類社會已經(jīng)不再擁有所謂的“通才”。進入信息時代,信息爆炸伴隨著知識爆炸,關(guān)于“學(xué)什么、怎么學(xué)、為什么學(xué)”等問題,任何具體的回答似乎都已不再能跟得上時代的節(jié)奏。進入AI時代,這一切又進一步需要被審視。如果說信息時代的“數(shù)字知識體系”尚屬零散的網(wǎng)頁索引和模擬器體系,那么AI時代的“知識體系”將在更大程度上被大模型融會貫通。
知識體系的更新和迭代正不斷加速,而且,知識體系呈現(xiàn)出的是網(wǎng)狀結(jié)構(gòu),而非被學(xué)科門類劃分的樹狀結(jié)構(gòu)。網(wǎng)狀結(jié)構(gòu)的演變有可能是連續(xù)的,但投影到樹狀結(jié)構(gòu)卻充滿著相變。這將帶來哪些變化呢?最突出的變化可能是對許多具體技能的需求迭代速度的顯著提高。試想一下,還有哪些具體學(xué)科專業(yè)能夠保持至少 5-10 年的就業(yè)優(yōu)勢呢?再想一下,我們可以說“ AI 可能是未來最需要學(xué)習(xí)的知識體系”,但關(guān)于“學(xué)什么、怎么學(xué)、誰來教”的問題,每年又在以多快的速度在發(fā)展和變化?
與此同時,從底層創(chuàng)新到應(yīng)用落地的過程也在加速。上一代工業(yè)軟件從最基礎(chǔ)的計算機結(jié)合數(shù)值模擬的算法突破,到成為成熟解決方案與行業(yè)深度結(jié)合,用了 30 年;而從 Transformer 這樣的最基礎(chǔ)模型架構(gòu)創(chuàng)新到 ChatGPT 這樣的殺手級應(yīng)用,僅用了5年。這種加速過程背后的原因是復(fù)雜多元的——這在本篇討論的范疇之外。但是,這個過程越來越指向一個特征時間尺度的變化——從 20-30 年縮短到 3-5 年、甚至更短。
3-5 年意味著什么呢?它意味著一個學(xué)生從本科入學(xué)到畢業(yè)的時間、一個博士生從選擇研究方向到畢業(yè)的時間;它意味著任何一個花足夠長時間習(xí)得的具體技能體系本身都可能不再被需要;當(dāng)然,它也意味著對更根本、更深層次的通識能力和人文關(guān)懷的需求。
這是我們當(dāng)下所處時代的大背景。
我們與?ChatGPT?討論了更多問題,感興趣的讀者可以點擊鏈接查看:AI4S 與 AIGC 時代,云上 Notebook 將如何革新教學(xué)與科研體系NBHubhttps://nb.bohrium.dp.tech/detail/1320?utm_source=csdn
教學(xué)的新痛點、新需求、新實踐——云上 Notebook 如何革新知識的傳播、分享、與學(xué)習(xí)方式
教什么?學(xué)什么?誰在教?誰在學(xué)?啥時候教?啥時候?qū)W?在 AI4S 與 AIGC 時代,這些問題變成了靈魂問題。知識體系更新速度與教學(xué)體系適應(yīng)和教學(xué)資源供應(yīng)之間存在著難以調(diào)和的矛盾。傳統(tǒng)的課本、教材和教學(xué)方法很難滿足學(xué)生對最新知識的需求;教師也面臨著如何在有限的時間內(nèi)學(xué)新技術(shù)、以及向?qū)W生傳授更多、更有效的知識的壓力;甚至,對于大學(xué)和研究生教育來說,很大比例上充當(dāng)主力的青年教師群體同時也面臨著下一部分將討論的科研壓力,從而加劇了上述痛點痛的程度。
在這種背景下,自主學(xué)習(xí)、終身學(xué)習(xí)以及持續(xù)定義問題、解決問題的能力顯得尤為重要。然而,這樣的能力體系該如何系統(tǒng)地發(fā)展起來呢?我們發(fā)現(xiàn),在跨學(xué)科碰撞與協(xié)作需求旺盛的當(dāng)下,一個顯著的缺失是能夠快速上手、快速建立手感的“新技術(shù)入門體系”。
在信息爆炸與技術(shù)爆炸的時代,我們了解新技術(shù)進展的渠道和方式在快速變化。文獻與技術(shù) blog 的規(guī)模在擴大、平均質(zhì)量在降低;技術(shù)博客或社交媒體的宣傳更加簡短、快速,但也難以深入。更關(guān)鍵的是,在很多跨領(lǐng)域的需求中,如何真正快速上手、嘗試(例如花看一篇微信公眾號的時間來探索?SAM 這樣的圖像預(yù)訓(xùn)練模型對材料圖像表征需求的效果和進一步方案),并基于真正的“手感”來判斷如何逐層深入,正在成為領(lǐng)域發(fā)展的瓶頸點。這已經(jīng)催生了 Hugging Face Space 等實踐,但更廣泛的切入方式仍有待進一步探索,特別是考慮到 AI4S 的場景需求,知識結(jié)構(gòu)往往更深、數(shù)據(jù)更少、軟件/流程等歷史包袱更重。
為了應(yīng)對這些挑戰(zhàn),我們認(rèn)為,滿足個性化和靈活化學(xué)習(xí)需求的云上 Notebook 體系是最關(guān)鍵的切入點。在傳統(tǒng)的教育模式中,云上 Notebook 作為一種基于云計算的在線編程環(huán)境,能夠輕松實現(xiàn)知識的生產(chǎn)、傳播和學(xué)習(xí)。在教學(xué)過程中,教師可以通過云上 Notebook 創(chuàng)建實時的教學(xué)示例和練習(xí),學(xué)生則可以在線完成作業(yè)并獲取即時反饋。此外,利用云上 Notebook,教師能夠輕松地為學(xué)生提供最新的教學(xué)資源,使得知識的傳播更加迅速。同時,學(xué)生可以根據(jù)自己的需求選擇感興趣的課程和項目,實現(xiàn)個性化學(xué)習(xí)。
云上 Notebook 還為教師和學(xué)生提供了一個共享的在線空間,方便雙方進行實時交流和協(xié)作。更關(guān)鍵的是,在此基礎(chǔ)上,“教師”與“學(xué)生”將不再是對立的、單向的關(guān)系,而是可以有非常多樣化的組合——試想,當(dāng)一個同學(xué)嘗鮮、學(xué)習(xí)完一個新技術(shù)后,不只是寫了一個技術(shù) blog,而是寫了一個優(yōu)秀的云上 Notebook(我們將在后續(xù)文章中結(jié)合我們的實踐來給出關(guān)于“優(yōu)秀的云上 Notebook”的思考),然后馬上所有人就可以連接云上機器進行實戰(zhàn)式學(xué)習(xí)、優(yōu)秀的案例也能無縫進入教學(xué)課堂,甚至大家可以相互評論、更新、改進、沉淀這個 Notebook。這樣的模式豈不恰好是解決上述挑戰(zhàn)問題的關(guān)鍵?
最后,為什么強調(diào)“云上”?核心原因是運維部署和彈性擴展等方面的能力需求是統(tǒng)一的、且具有規(guī)模效應(yīng)的,很難以教學(xué)科研相對習(xí)慣的“小作坊”模式做起來。而恰恰是這些能力也讓不同時間地點、不同形式組合、不同規(guī)模的靈活的、交互式的教與學(xué)成為可能。
科研的新痛點、新需求、新實踐——云上 Notebook 如何革新跨學(xué)科科研過程及廣義的學(xué)術(shù)發(fā)表體系
在 AI4S 和 AIGC 領(lǐng)域的快速發(fā)展背景下,科研體系在信息時代伊始就面臨的挑戰(zhàn)被進一步放大。以跨學(xué)科合作為例,不同領(lǐng)域的研究者在語言、方法和工具上的差異,使得跨學(xué)科合作在技術(shù)層面上變得非常困難。更雪上加霜的是,不同領(lǐng)域背景的人們所受到的激勵也各不相同,這至少反映在他們所認(rèn)可的學(xué)術(shù)期刊及相應(yīng)的評審依據(jù)上,這使得大家即便關(guān)注同一問題,也容易因為關(guān)注的角度、希望項目推進的方式方向不同而難以取得有效進展。
那么,我們期待云上 Notebook 能做些什么呢?
我們需要從對廣義的發(fā)表體系的討論開始。實際上,學(xué)術(shù)論文體系、開源社區(qū)、微信公眾號等,本身都可以被視為廣義的發(fā)表體系。它們在載體與呈現(xiàn)形式、評審機制與評價體系、各方激勵等方面均有所不同,因此適用于不同類型的情況。我們將不同的發(fā)表體系類比為不同類型的“代謝通路”,因為它們代表了不同類型的知識體系的吸收、分解、消化、合成、進化過程。
在當(dāng)下這個 AI4S 和 AIGC 時代,我們發(fā)現(xiàn):一方面,科研人員是在前沿創(chuàng)新和探索人類認(rèn)知邊界的一線群體;另一方面,本質(zhì)上在承擔(dān)推動科研體系運轉(zhuǎn)核心作用的學(xué)術(shù)發(fā)表體系正在變得臃腫、笨重、僵化、從而反過來束縛了科研人員的生產(chǎn)力和創(chuàng)造力。在資源有限、學(xué)術(shù)群體規(guī)模持續(xù)增長的情況下,良性競爭正逐漸演變?yōu)椤熬怼钡母窬帧T绞恰熬怼?,人們就越容易被現(xiàn)有指標(biāo)綁架,越容易浪費時間或投機取巧,從而越難以產(chǎn)出有意義的工作。
對相關(guān)問題的討論已經(jīng)有很多,這里我們僅就呈現(xiàn)形式、評審與迭代機制來針對云上 Notebook 略作探討。
就“呈現(xiàn)形式”而言,學(xué)術(shù)文章的呈現(xiàn)形式是文字、圖表等;開源軟件的呈現(xiàn)形式基本上是代碼和文檔;而云上 Notebook 的呈現(xiàn)形式則綜合兩者,本身能很方便地搭載文檔和代碼,且在良好的后端支持下,還可以有模型/數(shù)據(jù)/算力穩(wěn)定可擴展的系統(tǒng)環(huán)境,并保障學(xué)術(shù)成果或技術(shù)探索的可重復(fù)性。當(dāng)下正在有越來越多的學(xué)術(shù)期刊探索 Notebook 的形式。例如,2022 年末,流體力學(xué)頂刊 Journal of Fluid Mechanics (JFM) 發(fā)布了其 Notebook 系列。我們直接引用其發(fā)刊詞《Introducing JFM Notebooks》的首段作為對這里討論的補充:
Source: J. Fluid Mech. (2022), vol. 952, E1, doi:10.1017/jfm.2022.903
就評審與迭代機制而言,學(xué)術(shù)論文體系依賴的是“同行評審”。當(dāng)下面臨兩個問題:
- 在跨學(xué)科語境下“同行”是否容易被定義和歸類;
- “卷”的局面及文章和期刊日益泛濫的情況下“同行”是否有足夠多的時間來做高質(zhì)量、負(fù)責(zé)任的評審。而從對知識體系的迭代推動方式來看,對學(xué)術(shù)論文來說,新的進展往往意味著需要通過新的一篇文章來呈現(xiàn)。也是因此,越來越多的文章的越來越大比例的部分正在成為八股文——這會成為大語言模型更擅長的事情。
相比較而言,開源社區(qū)的“評審”是分布式、用腳投票的——一個東西解決問題就有人用、有人用且有問題就會持續(xù)反饋與解決,于是用戶的規(guī)模和一系列反饋便起到了評審的作用。開源體系的迭代,無論是開源代碼,還是開源的數(shù)據(jù)、模型,乃至像 wikipedia 這樣的開源文檔體系,都有較為成熟的 CI(continuous integration 持續(xù)集成)機制來更新迭代。云上 Notebook 作為一種新的呈現(xiàn)形式,評審與迭代機制可以較為靈活,可以參考學(xué)術(shù)論文、也可以參考技術(shù) blog 或者 wikipedia,但其核心在于帶著 code block 以及包含數(shù)據(jù)模型算力的云上環(huán)境。
對很多創(chuàng)新成果來說,開源+云上 Notebook 可能是一種比發(fā)表文章反饋迭代快且廣泛很多的形式。我們相信,會有越來越多的 Paper with Notebook、甚至 Paper as Notebook 的實踐出現(xiàn),這也更能順應(yīng)“知識體系更新迭代加速、從底層創(chuàng)新到應(yīng)用落地過程加速”的大背景。
值得注意的是,對云上 Notebook 的支持不意味著對現(xiàn)有發(fā)表體系的“替代”,而意味著為創(chuàng)新成果找到新的“出口”、新的“代謝通路”。我們也在積極探索各種類型的“代謝通路”,例如發(fā)起?DeepModeling 開源社區(qū)并逐漸體系化,也例如結(jié)合 MLOPS 技術(shù)的算法解決方案快速上線也在新一輪的嘗試中(一個參考是結(jié)合 Uni-Mol 技術(shù)的?Bohrium APP Uni-QSAR)。這些嘗試正在很大程度地解放生產(chǎn)力和創(chuàng)造力。我們會發(fā)現(xiàn),對于大量真正有意義的算法來說,快速解決問題、得到反饋比使勁憋文章、跟審稿人干架來得更關(guān)鍵——當(dāng)這里的“大量”真的“量夠大”時,革新也自然就會發(fā)生。此外,這些本質(zhì)上在提升創(chuàng)新效能的手段也能最大程度地減緩與“卷”的邏輯的矛盾。
同樣值得注意的是,無論是這里的 Notebook、還是 APP,與純粹的開源代碼或 Wiki 體系很大的區(qū)別在于對后端環(huán)境的需求。算力/數(shù)據(jù)/軟件等系統(tǒng)環(huán)境是任何類型的計算解決方案所必須的,在這些方面哪怕開發(fā)成本是固定的,更大的成本——且是邊際成本——也會發(fā)生在規(guī)?;褂煤统掷m(xù)迭代維護上。對于任何一個 AI 模型體系也同樣如此。因此,我們需要一個運行足夠良好的經(jīng)濟模型和協(xié)同體系來支撐這個體系的運轉(zhuǎn),這是需要根據(jù)實際情況尋求最佳方案的、也是需要持續(xù)探索的。
綜合上述討論,NBHub 希望做什么
NBHub 希望推動形成一個在 AI4S 與 AIGC 時代讓知識“跑”起來的社區(qū)。這里的“跑”既指以云上 Notebook 的形式一鍵運行、快速上手,又指在一個跨領(lǐng)域的開放共建的社區(qū)中充分、自由地傳播與分享。這種靈活的社區(qū)形式將作為教學(xué)與科研體系的有效補充,并終將推動現(xiàn)有教學(xué)與科研體系的革新。
NBHub 目前主要通過微信公眾號的形式運營,我們也將探索更為豐富的形式。我們希望 NBHub 的內(nèi)容覆蓋 AI4S 與 AIGC 領(lǐng)域那些適合不只“看”、還得“跑”的知識,包括經(jīng)典的技術(shù)體系、也包括前沿的技術(shù)進展,以及好玩、有用的新鮮內(nèi)容,和對先進實踐的推廣介紹,等等。對于那些痛點鮮明、共振強烈的群體(例如我們最近發(fā)現(xiàn)的 AI for Bioinformatics 群體)我們將進一步通過靈活的社區(qū)教學(xué)交流等形式的活動組織起來。對于任何對 NBHub 的想法、建議,都?xì)g迎提出;也歡迎以任何形式加入我們。
令人驚喜的是,在我們推出一系列優(yōu)質(zhì) Notebook 內(nèi)容的同時,其集散地——?Notebook 案例廣場,正在被越來越多地關(guān)注起來。有一天,我們發(fā)現(xiàn)有一位朋友在他的朋友圈熱情地推薦案例廣場。當(dāng)我們問他是什么激起他的分享欲時,他說:“……我順著這個 Uni-mol 相關(guān)的教程摸到了整個案例廣場,發(fā)現(xiàn)里面已經(jīng)有很多高質(zhì)量的 Notebook 了;想起以前學(xué)東西的時候都是全網(wǎng)搜(可能尤其在 CSDN 上),然后質(zhì)量和版本都參差不齊,在學(xué)習(xí)之前還得先解決很多的配置問題,不同版本的指令可能還不太一樣;然后驚奇地案例廣場上的 Notebook 的數(shù)量和覆蓋面已經(jīng)很廣了,還有包括像 Python 作圖類的教程,Notebook 有審核、能跑通;我覺得這對新手或者想了解這個領(lǐng)域的人是很激動的,甚至可能很少會有人的知識面是覆蓋案例廣場上所有案例的;所以從這個角度上我覺得是個“寶藏庫”,一定程度上,新手入門最高效的方式之一是在有標(biāo)準(zhǔn)答案或者指導(dǎo)的情況下“做作業(yè)”,這個層面上,案例廣場降低了我獲取知識的成本,提高了學(xué)習(xí)效率”。對此我們感到激動——這正是我們希望推動做好的。
文章來源:http://www.zghlxwxcb.cn/news/detail-560270.html
最后,One More Thing。通過 NBHub,我們最希望倡導(dǎo)的,還是回歸好奇心與責(zé)任心驅(qū)動下最樸素的價值追求。技術(shù)在飛快地發(fā)展,但“科技向善”永不過時。如 DeepModeling 社區(qū)宣言所言,“那些希望通過計算建模突破科學(xué)邊界、解決困難問題的人們正在以前所未有的新方式集結(jié)起來。他們需要新的基礎(chǔ)設(shè)施——新的協(xié)作平臺,新的代碼框架,新的數(shù)據(jù)處理手段,新的算力使用方式;他們需要新的文化——追求通力協(xié)作、惠及大眾;追求知識與工具的自由交流與分享;追求尊重并欣賞相互的成就、和而不同。”我們希望推動的,是讓那些志同道合者,能在這里,成為更好的自己。文章來源地址http://www.zghlxwxcb.cn/news/detail-560270.html
到了這里,關(guān)于AI4S 與 AIGC 時代,云上 Notebook 將如何革新教學(xué)與科研體系的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!