国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【LLM】Prompt微調(diào)

這篇具有很好參考價值的文章主要介紹了【LLM】Prompt微調(diào)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

Prompt

在機器學習中,Prompt通常指的是一種生成模型的輸入方式。生成模型可以接收一個Prompt作為輸入,并生成與該輸入相對應的輸出。Prompt可以是一段文本、一個問題或者一個片段,用于指導生成模型生成相應的響應、續(xù)寫文本等。

Prompt優(yōu)化

一般大模型蘊含的訓練數(shù)據(jù)量往往是百億級別甚至萬億級別。大模型通常無法在小數(shù)據(jù)上微調(diào)。因此,基于Prompt的微調(diào)技術便成為了首要選擇。

Prompt優(yōu)化方式

有兩種方向上的優(yōu)化方式:

  1. 從Prompt結構上

    • Few-Shot(FS):模型推理時給予少量樣本,但不允許進行權重更新。
    • One-Shot(1S):模型推理時只給予一個樣本。
    • Zero-Shot(0S):模型推理時不允許提供樣本。
  2. 從Prompt內(nèi)容上

    • Role Prompt:與大模型玩角色扮演游戲。讓大模型想象自己是某方面的專家、因而獲得更好的任務效果。
    • Instruction Prompt:指令形式的Prompt。
    • Chain-of-Thought(CoT)Prompt:常見于推理和計算任務中,通過讓大模型給出推理或計算步驟來解決較難的推理問題,比如進行應用數(shù)學計算。
    • Multimodal Prompt:多模態(tài)Prompt。顧名思義,輸入不再是單一模態(tài)的Prompt,而是包含了眾多模態(tài)的信息。比如同時輸入文本和圖像與多模態(tài)大模型進行交互。

比較重要的是Few-Shot PromptChain-of-Thought Prompt。它們對后續(xù)人們構建AI Agent應用以及各項大模型產(chǎn)品落地起到了關鍵的作用。

Few-Shot Prompt

eg:嘗試給寵物狗取個名字

  • Zero-Shot
    【LLM】Prompt微調(diào),工具,prompt,大模型,LLM,GPT,人工智能
  • Few-Shot
    【LLM】Prompt微調(diào),工具,prompt,大模型,LLM,GPT,人工智能
    可以看到示例中,Zero-Shot 的Prompt中,大模型給出的名字比較泛化,只是一種可能的比較合理的解釋。Few-Shot 的Prompt中,大模型能夠了解我們的取名傾向,并給出和示例風格一致的名字。

Chain-of-Thought Prompt

CoT Prompt則能夠大幅提高大模型的多步推理能力:

  • 不推理
    【LLM】Prompt微調(diào),工具,prompt,大模型,LLM,GPT,人工智能
  • Cot推理
    【LLM】Prompt微調(diào),工具,prompt,大模型,LLM,GPT,人工智能
    可以看出,大模型在直接給出結果時,有時候答案明顯是錯誤的,但我們只需要改動一下Prompt,使用Cot Prompt ,讓他輸出詳細的計算過程或者思考過程,大模型就能夠給出正確的結果。

CRISPE框架

有時合理組合使用這些Prompt優(yōu)化方法,就可以讓Prompt效果更好,整體框架結構:

  • CR:Capacity and Role(能力和角色),你希望AI扮演怎樣的角色。
  • I:Insight(洞察),提供背景信息和上下文。
  • S:Statement(陳述),你希望AI做什么。
  • P:Personality(個性),你希望AI以什么風格或方式回答你。
  • E:Experiment(實驗),要求AI為你提供多個答案。

假設我們的目標是獲取一個淺顯易懂的關于導數(shù)的解釋方式,第一種方式是:
【LLM】Prompt微調(diào),工具,prompt,大模型,LLM,GPT,人工智能
第二種方式我們來應用一下框架:
【LLM】Prompt微調(diào),工具,prompt,大模型,LLM,GPT,人工智能

Prompt的持續(xù)優(yōu)化

Prompt的優(yōu)化并不是一蹴而就的,而是一個持續(xù)的過程,使用上述方式和框架也不能夠保證每次都可以一次就拿到滿意的結果,尤其是當我們需要大模型完成一些比較復雜的工作時。但是遵循這些方法,我們可以有更高的可能性能夠通過較少的調(diào)整次數(shù)得到一個滿意的結果,并且能夠在這個結果上進行微調(diào),比如潤色,適當?shù)卦黾訄D表等。

Prompt 除了人工調(diào)節(jié),也可以讓機器自動調(diào)節(jié),也就是由機器自動生成 Prompt,這就是 Prompt Tuning。

文章參考:https://www.zhihu.com/collection/920873327文章來源地址http://www.zghlxwxcb.cn/news/detail-796895.html

到了這里,關于【LLM】Prompt微調(diào)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內(nèi)容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 飛漿AI studio人工智能課程學習(1)-大模型時代&優(yōu)質(zhì)Prompt

    飛漿AI studio人工智能課程學習(1)-大模型時代&優(yōu)質(zhì)Prompt

    學習記錄 源自:百度飛漿-基于大模型的優(yōu)質(zhì)Prompt開發(fā)課 原始視頻地址 原始視頻:地址 朵云軒x文心一格的110萬拍賣畫作 創(chuàng)作者在一些提示詞平臺上進行售/Prompt Base -使用提示詞能讓想象力得到發(fā)揮 -發(fā)掘提示詞可以產(chǎn)生收益 開始構建你的優(yōu)質(zhì)prompt 大規(guī)模預訓練語言模型LL

    2024年02月10日
    瀏覽(25)
  • 《花雕學AI》18:AI繪畫嘗鮮Prompt Hunt,使用人工智能模型來創(chuàng)造、探索和分享藝術作品

    《花雕學AI》18:AI繪畫嘗鮮Prompt Hunt,使用人工智能模型來創(chuàng)造、探索和分享藝術作品

    人工智能是當今科技領域的熱門話題,它不僅可以幫助人類解決各種實際問題,也可以激發(fā)人類的創(chuàng)造力和藝術感。Prompt Hunt就是一個利用人工智能模型來創(chuàng)造、探索和分享藝術作品的AI繪畫網(wǎng)站。它提供了三種不同的模型,分別是Stable Diffusion、DALL·E和Midjourney,它們可以根據(jù)

    2024年02月09日
    瀏覽(93)
  • 解密Prompt系列13. LLM Agent-指令微調(diào)方案: Toolformer & Gorilla

    解密Prompt系列13. LLM Agent-指令微調(diào)方案: Toolformer & Gorilla

    上一章我們介紹了基于Prompt范式的工具調(diào)用方案,這一章介紹基于模型微調(diào),支持任意多工具組合調(diào)用,復雜調(diào)用的方案。多工具調(diào)用核心需要解決3個問題,在哪個位置進行工具調(diào)用(where), 從眾多工具中選擇哪一個(Which), 工具的輸入是什么(What)。Where + Which + What,我稱之為

    2024年02月12日
    瀏覽(15)
  • 解密Prompt系列12. LLM Agent零微調(diào)范式 ReAct & Self Ask

    解密Prompt系列12. LLM Agent零微調(diào)范式 ReAct & Self Ask

    前三章我們分別介紹了思維鏈的使用,原理和在小模型上的使用。這一章我們正式進入應用層面,聊聊如何把思維鏈和工具使用結合得到人工智能代理。 要回答我們?yōu)槭裁葱枰狝I代理?代理可以解決哪些問題?可以有以下兩個視角 首先是我們賦能模型,如果說 LLM是大腦,那

    2024年02月15日
    瀏覽(15)
  • 【人工智能】GPT-4 的使用成本,竟然是GPT-3.5的50倍之多 —— 大語言模型(LLM)開發(fā)者必須知道的數(shù)字

    GPT-4的使用成本,竟然是GPT-3.5的50倍之多; 而讓大語言模型同時處理25個請求的時間,僅是處理單個請求的2倍…… 這些數(shù)據(jù)聽上去可能有些出乎意料,但都是真實的。 它們出自一篇名為《大語言模型(LLM)開發(fā)者必須知道的數(shù)字》的GitHub文章。 GitHub - ray-project/llm-numbers: Nu

    2024年02月07日
    瀏覽(44)
  • 人工智能prompt的優(yōu)化技巧

    了解prompt的構成有助于我們能夠更好的編寫prompt,prompt的構成類似于自然語言的成分。 prompt主要包括以下部分: 指令:你想讓人工智能執(zhí)行的命令 上下文:可以涉及外部信息或附加上下文,可以引導模型產(chǎn)生更好的響應,不是必須的 輸入數(shù)據(jù):我們感興趣的輸入或問題(以

    2024年02月16日
    瀏覽(25)
  • Learn Prompt-人工智能基礎

    Learn Prompt-人工智能基礎

    什么是人工智能?很多人能舉出很多例子說這就是人工智能,但是讓我們給它定義一個概念大家又覺得很難描述的清楚。實際上,人工智能并不是計算機科學領域?qū)俚母拍睿谄渌麑W科包括神經(jīng)科學、心理學、哲學等也有人工智能的概念以及相關的研究。在筆者的觀點里,

    2024年02月07日
    瀏覽(26)
  • Prompt設計與大語言模型微調(diào)

    Prompt設計與大語言模型微調(diào)

    本文主要介紹了Prompt設計、大語言模型SFT和LLM在手機天貓AI導購助理項目應用。 ChatGPT基本原理 “會說話的AI”,“智能體” 簡單概括成以下幾個步驟: 預處理文本:ChatGPT的輸入文本需要進行預處理。 輸入編碼:ChatGPT將經(jīng)過預處理的文本輸入到神經(jīng)網(wǎng)絡中進行編碼處理,使

    2024年02月08日
    瀏覽(24)
  • Prompt Learning:人工智能的新篇章

    Prompt Learning:人工智能的新篇章

    想象一下,你正在和一位智能助手對話,它不僅理解你的問題,還能提出引導性的問題幫助你更深入地思考。這正是prompt learning的魔力所在——它讓機器學習模型變得更加智能和互動。在這篇博客中,我們將探索prompt learning的奧秘,它如何改變我們與AI的互動方式,以及它在

    2024年04月10日
    瀏覽(24)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包