Prompt
在機器學習中,Prompt通常指的是一種生成模型的輸入方式。生成模型可以接收一個Prompt作為輸入,并生成與該輸入相對應的輸出。Prompt可以是一段文本、一個問題或者一個片段,用于指導生成模型生成相應的響應、續(xù)寫文本等。
Prompt優(yōu)化
一般大模型蘊含的訓練數(shù)據(jù)量往往是百億級別甚至萬億級別。大模型通常無法在小數(shù)據(jù)上微調(diào)。因此,基于Prompt的微調(diào)技術便成為了首要選擇。
Prompt優(yōu)化方式
有兩種方向上的優(yōu)化方式:
-
從Prompt結構上
- Few-Shot(FS):模型推理時給予少量樣本,但不允許進行權重更新。
- One-Shot(1S):模型推理時只給予一個樣本。
- Zero-Shot(0S):模型推理時不允許提供樣本。
-
從Prompt內(nèi)容上
-
Role Prompt:與大模型玩
角色扮演
游戲。讓大模型想象自己是某方面的專家、因而獲得更好的任務效果。 - Instruction Prompt:指令形式的Prompt。
-
Chain-of-Thought(CoT)Prompt:常見于推理和計算任務中,通過讓大模型給出
推理或計算步驟
來解決較難的推理問題,比如進行應用數(shù)學計算。 - Multimodal Prompt:多模態(tài)Prompt。顧名思義,輸入不再是單一模態(tài)的Prompt,而是包含了眾多模態(tài)的信息。比如同時輸入文本和圖像與多模態(tài)大模型進行交互。
-
Role Prompt:與大模型玩
比較重要的是Few-Shot Prompt
和Chain-of-Thought Prompt
。它們對后續(xù)人們構建AI Agent應用以及各項大模型產(chǎn)品落地起到了關鍵的作用。
Few-Shot Prompt
eg:嘗試給寵物狗取個名字
- Zero-Shot
- Few-Shot
可以看到示例中,Zero-Shot
的Prompt中,大模型給出的名字比較泛化,只是一種可能的比較合理的解釋。Few-Shot
的Prompt中,大模型能夠了解我們的取名傾向,并給出和示例風格一致的名字。
Chain-of-Thought Prompt
CoT Prompt則能夠大幅提高大模型的多步推理能力:
- 不推理
- Cot推理
可以看出,大模型在直接給出結果時,有時候答案明顯是錯誤的,但我們只需要改動一下Prompt,使用Cot Prompt
,讓他輸出詳細的計算過程或者思考過程,大模型就能夠給出正確的結果。
CRISPE框架
有時合理組合使用這些Prompt優(yōu)化方法,就可以讓Prompt效果更好,整體框架結構:
- CR:Capacity and Role(能力和角色),你希望AI扮演怎樣的角色。
- I:Insight(洞察),提供背景信息和上下文。
- S:Statement(陳述),你希望AI做什么。
- P:Personality(個性),你希望AI以什么風格或方式回答你。
- E:Experiment(實驗),要求AI為你提供多個答案。
假設我們的目標是獲取一個淺顯易懂的關于導數(shù)的解釋方式,第一種方式是:
第二種方式我們來應用一下框架:
Prompt的持續(xù)優(yōu)化
Prompt的優(yōu)化并不是一蹴而就的,而是一個持續(xù)的過程,使用上述方式和框架也不能夠保證每次都可以一次就拿到滿意的結果,尤其是當我們需要大模型完成一些比較復雜的工作時。但是遵循這些方法,我們可以有更高的可能性能夠通過較少的調(diào)整次數(shù)得到一個滿意的結果,并且能夠在這個結果上進行微調(diào),比如潤色,適當?shù)卦黾訄D表等。
Prompt 除了人工調(diào)節(jié),也可以讓機器自動調(diào)節(jié),也就是由機器自動生成 Prompt,這就是 Prompt Tuning。文章來源:http://www.zghlxwxcb.cn/news/detail-796895.html
文章參考:https://www.zhihu.com/collection/920873327文章來源地址http://www.zghlxwxcb.cn/news/detail-796895.html
到了這里,關于【LLM】Prompt微調(diào)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!