Datawhale 大模型基礎(chǔ)理論 Day1 引言

2年前作者：AIzealot無分類：Toy博客閱讀(32)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了Datawhale 大模型基礎(chǔ)理論 Day1 引言。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

開源鏈接如下：https://github.com/datawhalechina/so-large-lm/blob/main/docs/content/ch01.md

語言模型的概念：即能夠賦予每個(gè)有意義的詞（token）以一定的概率的一個(gè)函數(shù)的集合。

語言模型可以被用來評(píng)估輸入的質(zhì)量，也可以根據(jù)prompt生成對(duì)應(yīng)的內(nèi)容（作畫、描述、回答等）

溫度，可以控制模型生成中的變異量。

長(zhǎng)短期記憶模型通過門控結(jié)構(gòu)，在一定程度上緩解了模型對(duì)長(zhǎng)序列的信息的處理能力。

Transformer則是大模型的前身。

二者具有里程碑意義。

大語言模型具有參數(shù)量以及訓(xùn)練的數(shù)據(jù)集大的特點(diǎn)，當(dāng)然數(shù)據(jù)集大也意味著消耗的算力資源很大，當(dāng)然國外企業(yè)也能以GPU的顯卡資源抑制我國AI行業(yè)的發(fā)展，比如某美麗國和三大顯卡公司對(duì)其政策的執(zhí)行。

ok，今天的總結(jié)到此結(jié)束。

歡迎關(guān)注無神一起學(xué)習(xí)AI前沿領(lǐng)域，覺得有用請(qǐng)給個(gè)一鍵三連哦！文章來源地址http://www.zghlxwxcb.cn/news/detail-792307.html

到了這里，關(guān)于Datawhale 大模型基礎(chǔ)理論 Day1 引言的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

Day31 貪心算法 part01 理論基礎(chǔ) 455.分發(fā)餅干 376.擺動(dòng)序列 53.最大子序和
什么是貪心貪心的本質(zhì)是選擇每一階段的局部最優(yōu)，從而達(dá)到全局最優(yōu) 。這么說有點(diǎn)抽象，來舉一個(gè)例子：例如，有一堆鈔票，你可以拿走十張，如果想達(dá)到最大的金額，你要怎么拿？指定每次拿最大的，最終結(jié)果就是拿走最大數(shù)額的錢。每次拿最大的就是局部最優(yōu)，最
2024年01月19日
瀏覽(31)
day3-鏈表理論基礎(chǔ) 203.移除鏈表元素 707.設(shè)計(jì)鏈表 206.反轉(zhuǎn)鏈表
單鏈表雙鏈表：每個(gè)節(jié)點(diǎn)有兩個(gè)指針域，一個(gè)指向下一個(gè)節(jié)點(diǎn)，一個(gè)指向上一個(gè)節(jié)點(diǎn) 既可以查詢前一個(gè)節(jié)點(diǎn)，又能查詢后一個(gè)節(jié)點(diǎn) 循環(huán)列表：鏈表首尾相連在內(nèi)存上不是連續(xù)分布的，散亂分布在內(nèi)存中的某地址上刪除節(jié)點(diǎn)：next指針直接指向下下個(gè)節(jié)點(diǎn)，且在內(nèi)存中刪除
2024年02月04日
瀏覽(28)
算法訓(xùn)練day31貪心算法理論基礎(chǔ)Leetcode455分發(fā)餅干376擺動(dòng)序列53最大子序和
文章鏈接代碼隨想錄 (programmercarl.com) 說實(shí)話貪心算法并沒有固定的套路。最好用的策略就是舉反例，如果想不到反例，那么就試一試貪心吧。面試中基本不會(huì)讓面試者現(xiàn)場(chǎng)證明貪心的合理性，代碼寫出來跑過測(cè)試用例即可，或者自己能自圓其說理由就行了。刷題或者面
2024年02月20日
瀏覽(20)
代碼隨想錄day3｜鏈表理論基礎(chǔ)、移除鏈表元素、設(shè)計(jì)鏈表、翻轉(zhuǎn)鏈表
1、基本類型：?jiǎn)捂湵?、雙鏈表、循環(huán)鏈表 2、存儲(chǔ)方式：和數(shù)組不一樣，鏈表是隨機(jī)存儲(chǔ)在內(nèi)存中，不是連續(xù)分配在內(nèi)存中。 3、鏈表的定義：定義了一個(gè)數(shù)據(jù)域，還有一個(gè)指針域，并且定義了一個(gè)構(gòu)造函數(shù)。 4、鏈表的操作：刪除節(jié)點(diǎn)： ?在圖中，若需要?jiǎng)h除D這個(gè)節(jié)點(diǎn)，只
2024年02月05日
瀏覽(29)
● day5:哈希表理論基礎(chǔ) 242.有效的字母異位詞 349. 兩個(gè)數(shù)組的交集 202. 快樂數(shù) 1. 兩數(shù)之和
● 哈希表理論基礎(chǔ) ● 242.有效的字母異位詞 ● 349. 兩個(gè)數(shù)組的交集 ● 202. 快樂數(shù) ● 1. 兩數(shù)之和哈希表理論基礎(chǔ) 建議：大家要了解哈希表的內(nèi)部實(shí)現(xiàn)原理，哈希函數(shù)，哈希碰撞，以及常見哈希表的區(qū)別，數(shù)組，set 和map。什么時(shí)候想到用哈希法，當(dāng)我們遇到了要快速判斷一
2024年02月05日
瀏覽(22)
代碼隨想錄day6｜哈希表理論基礎(chǔ)、有效的字母異位詞、兩個(gè)數(shù)組的交集、快樂數(shù)、兩數(shù)之和
當(dāng)需要判斷一個(gè)元素是否在一個(gè)集合中，哈希表的時(shí)間復(fù)雜度只有O(1)。哈希表有一個(gè)映射的操作，當(dāng)映射的元素在同一個(gè)索引下標(biāo)的位置，就會(huì)引發(fā) 哈希碰撞。哈希碰撞的兩種解決方法：拉鏈法線性探測(cè)法? ?同時(shí)，哈希表還有常見的三種數(shù)據(jù)結(jié)構(gòu)：分別是數(shù)組、集合s
2024年02月06日
瀏覽(24)
代碼隨想錄Day3|鏈表理論基礎(chǔ)|203.移除鏈表元素|707.設(shè)計(jì)鏈表|206.反轉(zhuǎn)鏈表
雖然以前寫過一次鏈表，但是真的已經(jīng)忘得一干二凈了鏈表：通過指針串聯(lián)在一起的線性結(jié)構(gòu)，每個(gè) 節(jié)點(diǎn) 都由數(shù)據(jù)域和指針域組成。指針域：存放下一個(gè)節(jié)點(diǎn)的指針，最后一個(gè)節(jié)點(diǎn)的指針域指向null，也即空指針 head ：鏈表的入口節(jié)點(diǎn)，也即鏈表的頭節(jié)點(diǎn) 鏈表的類型單
2024年02月11日
瀏覽(21)
【代碼隨想錄】Day6 哈希表理論基礎(chǔ) 242.有效的字母異位詞，349. 兩個(gè)數(shù)組的交集 202. 快樂數(shù) 1. 兩數(shù)之和
【代碼隨想錄】Day6 哈希表理論基礎(chǔ) 242.有效的字母異位詞，349. 兩個(gè)數(shù)組的交集 202. 快樂數(shù) 1. 兩數(shù)之和新的一部分-哈希表，哈希表之前做題相對(duì)比較熟練希望能快速復(fù)習(xí) Source: 題目 Note：以前刷的時(shí)候使用python字典，這次換做C++ 注意數(shù)組就是簡(jiǎn)單的哈希表，但是數(shù)組的大小
2024年02月20日
瀏覽(25)
OpenAI取消GPT-4 Turbo每日限制，速率提升一倍；擴(kuò)散模型的理論基礎(chǔ)
?? AI新聞 ?? OpenAI取消GPT-4 Turbo每日限制，速率提升一倍摘要：OpenAI宣布取消GPT-4 Turbo的每日限制，提升速率限制1倍，每分鐘可處理高達(dá)150萬TPM的數(shù)據(jù)。 OpenAI解釋速率限制對(duì)防止API濫用、確保公平訪問和管理基礎(chǔ)設(shè)施負(fù)載的重要性。 OpenAI發(fā)布了避免速率限制的攻略，包括使
2024年02月21日
瀏覽(27)
代碼隨想錄 Day6 哈希表哈希表理論基礎(chǔ)， 242.有效的字母異位詞， 349. 兩個(gè)數(shù)組的交集，202. 快樂數(shù)，1. 兩數(shù)之和
yi? 哈希表理論基礎(chǔ) 哈希表是采用了犧牲空間換取時(shí)間，因?yàn)樾枰鎯?chǔ)額外的數(shù)據(jù)。需要快速判斷一個(gè)元素是否出現(xiàn)在一個(gè) 數(shù)組中的時(shí)候就需要哈希法。 er? 242.有效的字母異位詞本題一開始想到的是使用map，感覺是字母和數(shù)字的組合問題：? 1. 注意給\\\'a\\\'穿衣服 2.想到其實(shí)
2024年03月09日
瀏覽(29)