国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼

這篇具有很好參考價(jià)值的文章主要介紹了谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼

文 | 智商掉了一地

你有沒有想過,讓一臺(tái)計(jì)算機(jī)診斷和修復(fù)自己生成的錯(cuò)誤代碼?一篇最新的研究論文介紹了一種名為 Self-Debugging 的技術(shù),通過在生成的代碼中添加自解釋的信息,讓計(jì)算機(jī)像一個(gè)可以自己修復(fù)代碼的程序員一樣調(diào)試自己的 BUG。

隨著大型語言模型(LLMs)在代碼生成領(lǐng)域的不斷發(fā)展,取得了令人矚目的性能。然而在面對(duì)復(fù)雜的編程任務(wù)時(shí),一次性生成正確的解決方案變得越來越具有挑戰(zhàn)性。為了解決這一問題,先前的研究提出了一些代碼修復(fù)方法來改善代碼生成性能。而在本篇論文中,作者提出了一種名為?Self-Debugging?的方法,通過少量示范來教大型語言模型調(diào)試它所生成的代碼。

該研究表明,Self-Debugging 方法可以教大型語言模型進(jìn)行橡皮鴨調(diào)試,即在沒有任何關(guān)于代碼正確性或錯(cuò)誤信息的反饋的情況下,通過自然語言解釋生成的代碼來識(shí)別其錯(cuò)誤,這種方法對(duì)于提升代碼生成性能具有潛在的巨大價(jià)值。

為了驗(yàn)證 Self-Debugging 方法的有效性,作者在多個(gè)代碼生成基準(zhǔn)測(cè)試上進(jìn)行了實(shí)驗(yàn),包括文本到 SQL 生成、C++ 到 Python 翻譯和文本到 Python 生成。該方法不僅在提升預(yù)測(cè)準(zhǔn)確性方面表現(xiàn)出色,同時(shí)還在樣本效率上獲得了顯著的改進(jìn),通過利用反饋信息和重用失敗的預(yù)測(cè),能在樣本效率上具有優(yōu)勢(shì),并且在與生成超過 10 倍候選代碼的基線模型相比時(shí),能夠取得匹敵甚至超越的表現(xiàn)。

綜上所述,這篇文章提出的 Self-Debugging 方法為解決復(fù)雜編程任務(wù)中代碼生成困難的問題提供了一種新穎且有效的解決方案。這一研究將為解決復(fù)雜編程任務(wù)中代碼生成的難題帶來了新的可能性,對(duì)推動(dòng)大型語言模型在代碼生成領(lǐng)域的應(yīng)用和發(fā)展提供了有力支持。

論文題目:?
Teaching Large Language Models to Self-Debug

論文鏈接:?
https://arxiv.org/abs/2304.05128


背景探索

近期的大型語言模型在生成代碼方面有了顯著的改進(jìn),但生成正確的代碼仍然具有挑戰(zhàn)性。研究表明從模型中采樣多個(gè)程序時(shí),選擇最佳候選程序的準(zhǔn)確性更高。即使對(duì)于人類程序員來說,第一次編寫的代碼并不總是正確的,他們通常會(huì)檢查代碼并根據(jù)執(zhí)行結(jié)果更改來解決實(shí)現(xiàn)錯(cuò)誤。因此,該研究提出了一種名為 Self-Debugging 的方法,通過執(zhí)行生成的代碼并基于代碼和執(zhí)行結(jié)果生成反饋信息,來引導(dǎo)模型進(jìn)行調(diào)試。

不同于需要額外模型訓(xùn)練的方法,Self-Debugging 通過代碼解釋來指導(dǎo)模型識(shí)別實(shí)現(xiàn)錯(cuò)誤,類似于人類程序員通過逐行向橡皮鴨解釋代碼行來提高調(diào)試效率的方法。圖 1 展示了 Self-Debugging 的完整過程。

在每一步調(diào)試中,模型首先生成新的代碼,然后執(zhí)行該代碼并解釋,代碼解釋和執(zhí)行結(jié)果構(gòu)成了反饋信息,然后將反饋信息發(fā)送回模型以執(zhí)行更多的調(diào)試步驟。當(dāng)單元測(cè)試不可用時(shí),反饋可以完全基于代碼解釋。

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲圖1 使用大型語言模型進(jìn)行迭代調(diào)試的 Self-Debugging

生成代碼的 Prompt 技術(shù)

Few-shot prompting

Few-shot prompting 是一種通過幾個(gè)輸入-輸出演示來指導(dǎo)語言模型完成任務(wù)的方法。以文本到 SQL 生成為例,few-shot 提示在感興趣的問題前面加上(question, SQL)對(duì)的列表,這樣當(dāng)模型被要求預(yù)測(cè)給定提示后的后續(xù) token 時(shí),它會(huì)按照提示的格式生成 SQL 查詢語句。圖 2 展示了一個(gè)示例的提示。此外,這種方法還可以在提示中添加指令來提供高級(jí)任務(wù)描述。

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲圖2 文本到 SQL 生成的示例

基于執(zhí)行的代碼選擇

先前的研究表明,對(duì)于大型語言模型,在解碼過程中生成多個(gè)預(yù)測(cè)結(jié)果可以顯著提高性能,特別是在代碼生成任務(wù)中,可以利用代碼執(zhí)行結(jié)果來選擇最終的預(yù)測(cè)結(jié)果。有以下兩種方法:

  • 使用執(zhí)行結(jié)果的多數(shù)投票來選擇最終的預(yù)測(cè)結(jié)果;

  • 設(shè)計(jì)重新排序方案來提高性能。

在本研究中,當(dāng)存在多個(gè)預(yù)測(cè)結(jié)果時(shí),遵循第一種方法,選擇在執(zhí)行時(shí)沒有遇到錯(cuò)誤的預(yù)測(cè)中具有最頻繁執(zhí)行結(jié)果的代碼,并對(duì)其應(yīng)用 Self-Debugging。一些代碼生成任務(wù)伴隨著單元測(cè)試,以指定程序的執(zhí)行行為。在問題描述中給出單元測(cè)試時(shí),執(zhí)行基于多數(shù)投票的選擇之前,會(huì)先過濾掉未通過單元測(cè)試的程序。

Self-Debugging 框架

圖 1 展示了 Self-Debugging 迭代調(diào)試框架,使用未經(jīng)微調(diào)的預(yù)訓(xùn)練大型語言模型。在給定問題描述后,模型首先預(yù)測(cè)候選程序,然后推斷程序的正確性,并生成反饋信息以進(jìn)行后續(xù)的調(diào)試步驟。當(dāng)反饋信息表明預(yù)測(cè)結(jié)果是正確的,或者達(dá)到了允許的最大調(diào)試輪數(shù)時(shí),調(diào)試過程終止。

現(xiàn)有的研究表明,語言模型可以通過訓(xùn)練來理解人類對(duì)代碼的反饋,并根據(jù)指令進(jìn)行修正。然而,目前尚不清楚語言模型是否能夠在沒有人類輔助的情況下自行進(jìn)行調(diào)試。在接下來的討論中,將探討如何利用代碼執(zhí)行和 few-shot 提示來生成不同類型的自動(dòng)獲取和生成的反饋信息。

通過簡(jiǎn)單反饋進(jìn)行 Self-Debugging

最簡(jiǎn)單的自動(dòng)反饋形式是一句話,僅指示代碼的正確性,沒有更詳細(xì)的信息。例如,在文本到 SQL 生成任務(wù)中, few-shot 提示會(huì)依據(jù)正確或錯(cuò)誤結(jié)果為所有 SQL 查詢提供反饋信息:

  • “上面的SQL預(yù)測(cè)是正確的!”

  • “上面的 SQL 預(yù)測(cè)是錯(cuò)誤的,請(qǐng)修正 SQL?!?/p>

使用單元測(cè)試進(jìn)行 Self-Debugging(UT)

對(duì)于包含單元測(cè)試的代碼生成任務(wù),除了通過代碼執(zhí)行來檢查代碼的正確性外,還可以在反饋信息中呈現(xiàn)單元測(cè)試的執(zhí)行結(jié)果,從而為調(diào)試提供更豐富的信息。圖 5 的示例包含了代碼翻譯任務(wù)的單元測(cè)試反饋信息。通過檢查運(yùn)行時(shí)錯(cuò)誤消息和未通過的單元測(cè)試的執(zhí)行結(jié)果,可以幫助人類程序員更有效地進(jìn)行調(diào)試。實(shí)驗(yàn)結(jié)果表明,利用單元測(cè)試可以顯著提高調(diào)試性能。

通過代碼解釋進(jìn)行 Self-Debugging(Expl.)

盡管大型語言模型在生成批評(píng)性反饋方面取得了一些進(jìn)展,以避免生成有害的輸出并在自然語言和推理任務(wù)中提高性能,但先前的研究尚未在代碼生成任務(wù)中驗(yàn)證了反饋的有效性。然而,研究表明大型語言模型可以生成描述問題解決方案的文本和代碼?;谶@一啟示,提出了一種新方法,即通過解釋生成的代碼來教模型進(jìn)行自我調(diào)試,而不是教它預(yù)測(cè)錯(cuò)誤消息。這種調(diào)試過程類似于程序員通過向橡皮鴨逐行解釋代碼來進(jìn)行調(diào)試。研究驗(yàn)證了即使在沒有單元測(cè)試的情況下,大型語言模型也可以從這種調(diào)試方法中獲益。

應(yīng)用

文本到 SQL 生成

在文本到 SQL 生成任務(wù)中,使用 Self-Debugging 方法旨在評(píng)估大型語言模型的性能,如圖 3 所示。由于缺乏單元測(cè)試,模型更難推斷預(yù)測(cè)的 SQL 查詢的正確性。

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲圖3 用于生成文本到 SQL 的 Self-Debugging 提示示例

調(diào)試過程包括三個(gè)步驟:

  1. 首先,模型通過提示對(duì)問題進(jìn)行總結(jié),并推斷問題所需的返回類型,即對(duì)應(yīng) SQL 查詢表的列數(shù)。

  2. 其次,模型執(zhí)行 SQL 查詢并將返回的表格添加到輸入中,以進(jìn)行代碼解釋。生成的 SQL 解釋包括對(duì)每個(gè)子句的詳細(xì)描述、包含在返回表格中的列數(shù)以及完整 SQL 查詢的高層含義。如果返回表格超過兩行,只有前兩行包含在提示中。

  3. 最后,模型將推斷的 SQL 解釋和問題描述進(jìn)行比較,并預(yù)測(cè)當(dāng)前 SQL 查詢的正確性。Self-Debugging 過程在第三步中認(rèn)為 SQL 查詢是正確的,或者達(dá)到最大的調(diào)試輪數(shù)時(shí)終止。

這種方法使得模型能夠通過對(duì)生成的 SQL 查詢進(jìn)行解釋和比較,從而自我調(diào)試并預(yù)測(cè) SQL 查詢的正確性??梢杂型岣吣P驮谖谋镜?SQL 生成任務(wù)中的性能,并彌補(bǔ)缺乏單元測(cè)試的限制。

代碼翻譯

在實(shí)驗(yàn)中,TransCoder 數(shù)據(jù)集包含了不同編程語言中的平行函數(shù)以及單元測(cè)試的測(cè)試集。根據(jù)先前研究的方法,將 Self-Debugging 應(yīng)用于將 C++ 代碼翻譯成 Python 代碼的任務(wù),并且使用了相同的測(cè)試集,包含 560 個(gè)問題和每個(gè)問題 10 個(gè)單元測(cè)試,問題描述包括了 C++ 代碼和所有單元測(cè)試,如圖 4 所示。

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲圖4 TransCoder 數(shù)據(jù)集中的一個(gè)示例。問題描述包含 C++ 程序和單元測(cè)試,并且需要該模型來預(yù)測(cè) Python 程序。

由于單元測(cè)試的可用性,研究人員只在預(yù)測(cè)的 Python 代碼未通過所有單元測(cè)試時(shí)才應(yīng)用 Self-Debugging 技術(shù),這樣模型就不需要預(yù)測(cè)反饋信息。如圖 5 所示,他們迭代地應(yīng)用 Self-Debugging 技術(shù),直到預(yù)測(cè)的代碼通過了所有單元測(cè)試,或模型達(dá)到了預(yù)設(shè)的最大調(diào)試輪數(shù)。

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲圖5 用于代碼翻譯的 Self-Debugging 提示的示例。左側(cè)是模型預(yù)測(cè),右側(cè)包含基于代碼執(zhí)行的輸入 C++ 代碼和反饋消息。

文本到 Python 生成

在問題描述中包含了部分單元測(cè)試,MBPP 數(shù)據(jù)集包含了 500 個(gè) Python 問題的文本描述,每個(gè)問題都包含3個(gè)單元測(cè)試。作者在提示中包含問題描述中的第一個(gè)單元測(cè)試,并將剩余的2個(gè)單元測(cè)試保留以進(jìn)行完整的評(píng)估。與代碼翻譯類似,可以在反饋信息中利用單元測(cè)試的執(zhí)行結(jié)果,但主要的區(qū)別在于,即使預(yù)測(cè)的 Python 代碼通過了給定的單元測(cè)試,模型仍然需要推斷代碼的正確性。

實(shí)驗(yàn)

這里對(duì)實(shí)驗(yàn)部分將不再贅述,作者在所有 Self-Debugging 的實(shí)驗(yàn)中,使用貪婪解碼來生成代碼解釋、反饋信息和新的程序,并將最大調(diào)試輪數(shù)設(shè)置為 10。實(shí)驗(yàn)證明,成功的調(diào)試過程通常在 3 輪內(nèi)結(jié)束。

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲表1 用于文本到 SQL 生成的 Spider 數(shù)據(jù)集的準(zhǔn)確性
谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲表2 TransCoder 數(shù)據(jù)集的準(zhǔn)確性。其中所有非調(diào)試的方法都使用貪婪解碼,而 Self-Debugging 方法則用 Codex 預(yù)測(cè)進(jìn)行調(diào)試
谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲表3 用于文本到 Python 生成的 MBPP 數(shù)據(jù)集的準(zhǔn)確性

在表格 1、2 和 3 中,作者展示了 Self-Debugging 與現(xiàn)有方法的比較結(jié)果:

  • 由于沒有可用的單元測(cè)試,僅有簡(jiǎn)單的反饋并不能改善性能,因?yàn)槟P蜔o法僅通過少量的示例區(qū)分正確和錯(cuò)誤的 SQL 查詢,并且不能對(duì)初始預(yù)測(cè)的 SQL 查詢進(jìn)行有意義的修改。

  • 簡(jiǎn)單的反饋利用了執(zhí)行結(jié)果來推斷代碼的正確性,即使執(zhí)行信息沒有在反饋信息中呈現(xiàn)給模型。因此簡(jiǎn)單的反饋仍然改進(jìn)了模型的預(yù)測(cè)性能。

  • 對(duì)于所有任務(wù),模型從更豐富的反饋信號(hào)中受益。尤其是代碼解釋使得模型可以在沒有單元測(cè)試的情況下進(jìn)行 Self-Debugging

在消融實(shí)驗(yàn)中,作者主要指出以下幾點(diǎn):

文本到 SQL 生成

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲圖6 Spider 開發(fā)集的消融研究。(a)使用不同數(shù)量的初始樣本進(jìn)行準(zhǔn)確度。(b)不同難度等級(jí)問題的細(xì)分精度。
  • 通常情況下,一個(gè)調(diào)試輪次已經(jīng)足夠。這些結(jié)果強(qiáng)調(diào)了利用大型語言模型解釋代碼進(jìn)行調(diào)試的優(yōu)勢(shì)。

  • 在圖 6b 中進(jìn)一步展示了不同難度級(jí)別問題上的準(zhǔn)確性細(xì)分情況,其中每個(gè)問題的難度在數(shù)據(jù)集中根據(jù)目標(biāo) SQL 查詢的復(fù)雜性進(jìn)行了注釋。在不同難度級(jí)別的問題上,Self-Debugging 對(duì)于較難的問題改進(jìn)更加顯著。

  • 解決難題的能力:特別是在額外困難問題上,Self-Debugging 將準(zhǔn)確性提高了 9%。圖 7 展示了一個(gè)額外困難問題中,Self-Debugging 修復(fù)了預(yù)測(cè)的 SQL 查詢的例子。

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲圖7 Spider 基準(zhǔn)測(cè)試中的一個(gè)例子

代碼翻譯

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲圖8 TransCoder 消融研究
  • 圖 8a 展示了不同調(diào)試輪次上的準(zhǔn)確性,圖 8b 展示了不同初始樣本數(shù)量上的準(zhǔn)確性。

  • 將單元測(cè)試執(zhí)行和代碼解釋結(jié)合起來可以提高調(diào)試性能,在圖 9 和圖 10 中展示了這些例子。

  • 如圖 8b 所示,單獨(dú)利用代碼解釋而不進(jìn)行 Self-Debugging 也可以在不同數(shù)量的樣本上提供一致的性能提升。

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲圖9 通過單元測(cè)試反饋進(jìn)行 Self-Debugging 修復(fù)了代碼翻譯錯(cuò)誤,而簡(jiǎn)單的反饋方法則未能成功
谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲圖10 帶有代碼解釋的翻譯會(huì)正確地檢查字符串的末尾

文本到 Python 生成

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼
▲圖11 在 MBPP 上的一個(gè)例子,Self-Debugging 后的預(yù)測(cè)與初始代碼有很大差異
  • 發(fā)現(xiàn)在初始預(yù)測(cè)代碼與正確解之間差距較大時(shí),代碼解釋的作用較小,此時(shí)模型更傾向于生成新的程序而不是依賴于初始預(yù)測(cè)中的代碼片段。在圖 11 中展示了一個(gè)例子,其中 Self-Debugging 后的預(yù)測(cè)代碼與初始代碼差異很大。

小結(jié)

本文介紹了 Self-Debugging 技術(shù),它使得大型語言模型能夠自行調(diào)試所生成的代碼,該方法使模型能夠進(jìn)行橡皮鴨子調(diào)試,從而使模型能夠在沒有人類指導(dǎo)的情況下識(shí)別和修復(fù)錯(cuò)誤。在多個(gè)代碼生成領(lǐng)域,它實(shí)現(xiàn)了最先進(jìn)的性能,并且顯著提高了樣本效率。

在文本到 SQL 生成任務(wù)中,由于該任務(wù)沒有指定單元測(cè)試,利用代碼解釋進(jìn)行 Self-Debugging 以及在最困難的問題上可以始終有好效果。對(duì)于代碼翻譯和文本到 Python 生成任務(wù),在有單元測(cè)試可用的情況下,Self-Debugging 準(zhǔn)確性提高了多達(dá) 12%。

本工作強(qiáng)調(diào)了通過教大型語言模型迭代來自己調(diào)試預(yù)測(cè)的方法,從而改進(jìn)其編碼性能的潛力,而非要求模型從零開始生成正確的代碼。Self-Debugging 指導(dǎo)模型理解代碼、識(shí)別錯(cuò)誤,并根據(jù)錯(cuò)誤信息修復(fù)錯(cuò)誤。

未來的研究方向可以包括進(jìn)一步提高模型在調(diào)試過程中的能力。例如:

  • 探索讓模型更好地描述代碼的高級(jí)語義含義和實(shí)現(xiàn)細(xì)節(jié),從而提高其代碼解釋能力。

  • 考慮在模型的反饋中包含更多的調(diào)試信息(例如潛在錯(cuò)誤的描述),以提供更加豐富的指導(dǎo)。

相信這些改進(jìn)將進(jìn)一步推動(dòng)大型語言模型在編碼任務(wù)中的性能提升,并在實(shí)際應(yīng)用中發(fā)揮更大的潛力。若是有朝一日,用大模型的問答工具準(zhǔn)確地輔助我們寫代碼,少了焦頭爛額 Debug 的內(nèi)耗時(shí)刻,豈不美哉?

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼

賣萌屋作者:智商掉了一地

北理工計(jì)算機(jī)碩士在讀,近期沉迷于跟 ChatGPT 嘮嗑,對(duì)一切新穎的 NLP 應(yīng)用充滿好奇,正在努力成為興趣廣泛的斜杠青年~

作品推薦

  1. 我是粉紅豬佩奇,我要把粉色吹風(fēng)機(jī)寫進(jìn) IJCAI 論文!

  2. AI取代人類,可以自動(dòng)生成prompt了

  3. ICLR 2023 最高分論文被錘抄襲??

  4. AI講話總愛“結(jié)巴”?這篇NeurIPS論文找到了病因,結(jié)巴率已接近人類!

  5. 如何提升大規(guī)模Transformer的訓(xùn)練效果?Primer給出答案

  6. Yoshua Bengio:我的一生

谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼后臺(tái)回復(fù)關(guān)鍵詞【入群

加入賣萌屋NLP、CV、搜推廣與求職討論群文章來源地址http://www.zghlxwxcb.cn/news/detail-418338.html

到了這里,關(guān)于谷歌發(fā)布Self-Debug方法,讓大模型學(xué)會(huì)自己修bug,一次性生成正確代碼的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 阿里首提前向訓(xùn)練框架:讓大模型深度思考,可快速定制專屬模型

    大語言模型(LLM)是當(dāng)前自然語言處理領(lǐng)域最核心的技術(shù),以 GPT-4 為代表的大語言模型展現(xiàn)出了類人的學(xué)習(xí)能力。其中,情境學(xué)習(xí)(In-context Learning)是大語言模型最神秘的能力之一。如下圖所示,在這種情境學(xué)習(xí)的范式下,大模型無需更新任何參數(shù),僅依賴幾個(gè)示例樣本(demonstrations)就可以學(xué)習(xí)新任務(wù),執(zhí)行新樣本的預(yù)測(cè)。

    2024年02月11日
    瀏覽(20)
  • 使用 AutoGPTQ 和 transformers 讓大語言模型更輕量化

    大語言模型在理解和生成人類水平的文字方面所展現(xiàn)出的非凡能力,正在許多領(lǐng)域帶來應(yīng)用上的革新。然而,在消費(fèi)級(jí)硬件上訓(xùn)練和部署大語言模型的需求也變得越來越難以滿足。 ?? Hugging Face 的核心使命是 讓優(yōu)秀的機(jī)器學(xué)習(xí)普惠化 ,而這正包括了盡可能地讓所有人都能夠

    2024年02月11日
    瀏覽(18)
  • 通過搜索引擎讓大模型獲取實(shí)時(shí)數(shù)據(jù)-實(shí)現(xiàn)類似 perplexity 的效果

    通過搜索引擎讓大模型獲取實(shí)時(shí)數(shù)據(jù)-實(shí)現(xiàn)類似 perplexity 的效果

    匯報(bào)一下這周末的工作,主要是開發(fā)了一門課程:通過搜索引擎讓大模型獲取實(shí)時(shí)數(shù)據(jù),第一次開發(fā)一門課程,難免會(huì)有很多不熟悉和做的不好的地方。 已經(jīng)訓(xùn)練好的大模型有氣數(shù)據(jù)的局限性,比如 GPT-4,只有 2023年4月之前的數(shù)據(jù)。關(guān)于最新發(fā)生的一些事情,它無法回答。

    2024年04月23日
    瀏覽(21)
  • 12秒內(nèi)AI在手機(jī)上完成作畫!谷歌提出擴(kuò)散模型推理加速新方法

    12秒內(nèi)AI在手機(jī)上完成作畫!谷歌提出擴(kuò)散模型推理加速新方法

    本文源自:量子位 只需12秒,只憑手機(jī)自己的算力,就能拿Stable Diffusion生成一張圖像。 而且是完成了20次迭代的那種。 要知道,現(xiàn)在的擴(kuò)散模型基本都超過了10億參數(shù),想要快速生成一張圖片,要么基于云計(jì)算,要么就是要本地硬件夠強(qiáng)大了。 而隨著大模型應(yīng)用逐漸普及開

    2024年02月01日
    瀏覽(22)
  • 幾種技巧讓大模型(ChatGPT、文心一言)幫你提高寫代碼效率!

    幾種技巧讓大模型(ChatGPT、文心一言)幫你提高寫代碼效率!

    自從大模型推出來之后,似乎沒有什么工作是大模型不能做的。特別是在文本生成、文案寫作、代碼提示、代碼生成、代碼改錯(cuò)等方面都表現(xiàn)出不錯(cuò)的能力。下面我將介紹運(yùn)用大模型寫代碼的幾種方式,幫助程序員寫出更好的代碼!(大模型包括但不限于 ChatGPT、文心一言【

    2024年02月08日
    瀏覽(26)
  • 不真實(shí)、難解釋?讓大模型更安全,3位前沿學(xué)者告訴我們能做什么

    不真實(shí)、難解釋?讓大模型更安全,3位前沿學(xué)者告訴我們能做什么

    在上月舉行的“2022大模型創(chuàng)新論壇?·?模型技術(shù)安全與治理峰會(huì)”上,加州伯克利分校助理教授 Jacob Steinhardt、Anthropic 聯(lián)合創(chuàng)始人 Chris Olah、 紐約大學(xué)終身副教授Samuel Bowman 闡述了他們對(duì)模型安全這一領(lǐng)域的前沿解讀。 如果你正在從事這一領(lǐng)域研究,歡迎掃碼申請(qǐng)加入我們的

    2023年04月18日
    瀏覽(21)
  • Vscode使用cmake進(jìn)行debug的配置教學(xué)(教你學(xué)會(huì)寫json配置)

    Vscode使用cmake進(jìn)行debug的配置教學(xué)(教你學(xué)會(huì)寫json配置)

    目前csdn上很多的cmake配置,無論是用插件還是寫json,都不太方便,經(jīng)常配置不成功。 比如想要運(yùn)行slambook里的一些代碼,用傳統(tǒng)的配置方案都是建立在工作區(qū)就在本文件夾創(chuàng)建。 這樣的缺點(diǎn)有: 每次切換工作區(qū)都要重新配置,麻煩 每次增加外部連接庫(kù)都要用pkg去find路徑,

    2024年02月06日
    瀏覽(18)
  • 讓大模型分析csdn文章質(zhì)量 —— 提取csdn博客評(píng)論在文心一言分析評(píng)論區(qū)內(nèi)容

    讓大模型分析csdn文章質(zhì)量 —— 提取csdn博客評(píng)論在文心一言分析評(píng)論區(qū)內(nèi)容

    大家好,我是yma16,本文分享關(guān)于 讓大模型分析csdn文章質(zhì)量 —— 提取csdn博客評(píng)論在開源大模型分析評(píng)論區(qū)內(nèi)容。 vue3系列相關(guān)文章: vue3 + fastapi 實(shí)現(xiàn)選擇目錄所有文件自定義上傳到服務(wù)器 前端vue2、vue3去掉url路由“ # ”號(hào)——nginx配置 csdn新星計(jì)劃vue3+ts+antd賽道——利用i

    2024年02月08日
    瀏覽(31)
  • Unity項(xiàng)目發(fā)布谷歌AAB+PAD

    Unity項(xiàng)目發(fā)布谷歌AAB+PAD

    一切的根源都在谷歌商店。 谷歌商店一直對(duì)上架的應(yīng)用和游戲有嚴(yán)格的要求。最早期的時(shí)候,谷歌商店要求apk容量限制在50mb內(nèi),后來隨著應(yīng)用的普遍容量增大,谷歌商店把a(bǔ)pk的容量限制放寬到100mb。 但對(duì)于游戲來說,100mb的容量明顯不夠用。于是谷歌在早期提出了apk+obb(Opa

    2023年04月24日
    瀏覽(24)
  • 谷歌將發(fā)布全新搜索引擎,你期待嗎?

    谷歌將發(fā)布全新搜索引擎,你期待嗎?

    Google一身自帶AI屬性的新搜索最首要的目標(biāo)并非急于取代傳統(tǒng)搜索引擎,或者說徹底打敗ChatGPT,而是能夠用全新的產(chǎn)品說服用戶,變得與競(jìng)爭(zhēng)對(duì)手同樣“強(qiáng)大、能力出眾以及順應(yīng)AI潮流”。 對(duì)于Google而言,搜索就是命脈。Google每年的收入有八成來自廣告業(yè)務(wù),而廣告收入的八

    2024年02月05日
    瀏覽(31)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包