国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

openai模型個(gè)性化訓(xùn)練Embedding和fine-tuning區(qū)別

這篇具有很好參考價(jià)值的文章主要介紹了openai模型個(gè)性化訓(xùn)練Embedding和fine-tuning區(qū)別。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

現(xiàn)在基于自然語言和文檔進(jìn)行對(duì)話的背后都是使用的基于嵌入的向量搜索。OpenAI在這方面做的很好,它的Cookbook(github.com/openai/openai-cookbook)上有很多案例,最近他們對(duì)文檔做了一些更新。
GPT擅長(zhǎng)回答問題,但是只能回答它以前被訓(xùn)練過的問題,如果是沒有訓(xùn)練過的數(shù)據(jù),比如一些私有數(shù)據(jù)或者最新的數(shù)據(jù)該怎么辦呢?

這種情況下通常有兩種辦法,一種是微調(diào)(fine-tuning),一種是嵌入(embedding)。

微調(diào)就是在大模型的數(shù)據(jù)基礎(chǔ)上做二次訓(xùn)練,事先準(zhǔn)備好一批prompt-complition(類似于問答Q&A)的數(shù)據(jù),生成新的模型,這個(gè)模型將會(huì)包含微調(diào)后的數(shù)據(jù)。
而嵌入則是每次向ChatGPT發(fā)送消息(prompt)的時(shí)候,把你自己數(shù)據(jù)結(jié)果帶上。
王建碩老師對(duì)于微調(diào)和嵌入有過精妙的比喻:
ChatGPT就像一個(gè)已經(jīng)訓(xùn)練好的家政阿姨,她懂中文,會(huì)做家務(wù),但是對(duì)你家里的情況不了解。
微調(diào)就相當(dāng)于阿姨第一次到你家干活的時(shí)候,你要花一小時(shí)時(shí)間告訴她家里的情況,比如物件的擺放、哪些地方不能動(dòng),哪些地方要重點(diǎn)照顧。
嵌入就相當(dāng)于你省去了對(duì)阿姨進(jìn)行二次培訓(xùn)的,而是在家里貼滿紙條,這樣阿姨一看到紙條就知道該怎么做了。

OpenAI的Cookbook也有類似的比喻

微調(diào)就像你通過學(xué)習(xí)準(zhǔn)備考試,是一種長(zhǎng)期記憶,但過了一周后考試來臨,模型可能會(huì)忘記襲擊,或者記錯(cuò)它從來沒有讀過的事實(shí)。
嵌入就像記筆記,是一種短期記憶,當(dāng)考試的時(shí)候,你把筆記帶上,隨時(shí)翻看筆記,對(duì)于筆記上有的內(nèi)容可以得到準(zhǔn)確的答案。
另外嵌入的搜索提問方式相對(duì)于微調(diào)有一個(gè)缺點(diǎn)就是它每次附帶的文本數(shù)量是有限制的,因?yàn)槌嗽嫉膯栴},它還需要帶上搜索出來的問題,GPT-3.5是4K(大約5頁),GPT-4最大是32K(大約40頁)。
就好比你有成書架的教科書可以借鑒,但每次卻只能翻看其中幾頁筆記。
如果你想構(gòu)建一個(gè)對(duì)大量文本問答的系統(tǒng),OpenAI建議“搜索-問”(Search-Ask)的方法。
也就是先在本地文檔庫中Search,拿到本地的數(shù)據(jù)結(jié)果,再去Ask,把搜索結(jié)果和問題一起交給GPT,這樣GPT可以根據(jù)你提供的內(nèi)容以及它模型中的數(shù)據(jù),一起將結(jié)果返還給你。
至于如何搜索,并非一定要基于向量的搜索,可以有多重搜索方式:
- 基于關(guān)鍵字搜索
- 基于圖形的搜索
- 基于向量的搜索
至于在技術(shù)上如何實(shí)現(xiàn),OpenAI的Cookbook上也有詳細(xì)的介紹。
更多細(xì)節(jié)建議參考:
github.com/openai/openai-cookbook/blob/main/examples/Question_answering_using_embeddings.ipynb

文章來源地址http://www.zghlxwxcb.cn/news/detail-613149.html

到了這里,關(guān)于openai模型個(gè)性化訓(xùn)練Embedding和fine-tuning區(qū)別的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 新模型GPT-5個(gè)性化定制將導(dǎo)致的安全問題

    新模型GPT-5個(gè)性化定制將導(dǎo)致的安全問題

    人工智能(AI)的發(fā)展速度遠(yuǎn)遠(yuǎn)超過了硅谷過去所見的任何其他技術(shù)。OpenAI首席執(zhí)行官山姆·奧特曼(Sam Altman)在最近的一次采訪中表示,他們的首要任務(wù)是推出可能被稱為GPT-5的新模型,這一模型將能夠比現(xiàn)有模型做更多的事情。這一消息引發(fā)了廣泛的關(guān)注和討論,因?yàn)镚P

    2024年01月19日
    瀏覽(31)
  • 構(gòu)建自己的ChatGPT:從零開始構(gòu)建個(gè)性化語言模型

    構(gòu)建自己的ChatGPT:從零開始構(gòu)建個(gè)性化語言模型

    ???? 博主 libin9iOak帶您 Go to New World.??? ?? 個(gè)人主頁——libin9iOak的博客?? ?? 《面試題大全》 文章圖文并茂??生動(dòng)形象??簡(jiǎn)單易學(xué)!歡迎大家來踩踩~?? ?? 《IDEA開發(fā)秘籍》學(xué)會(huì)IDEA常用操作,工作效率翻倍~?? ???? 希望本文能夠給您帶來一定的幫助??文章粗淺,敬

    2024年02月15日
    瀏覽(28)
  • LLM-Rec:基于提示大語言模型的個(gè)性化推薦

    LLM-Rec:基于提示大語言模型的個(gè)性化推薦

    論文題目:LLM-Rec: Personalized Recommendation via Prompting Large Language Models 作者:Hanjia Lyu, Song Jiang, Hanqing Zeng, Yinglong Xia, Jiebo Luo 機(jī)構(gòu):University of Rochester, University of California Los Angeles, Meta AI, University of Rochester 本文研究了通過輸入增強(qiáng)來提高大語言模型個(gè)性化內(nèi)容推薦性能的各種提示策略

    2024年02月11日
    瀏覽(32)
  • 手把手教你做一個(gè) ChatGPT !絲滑小白版,只需一張單卡 GPU,輕松開啟個(gè)性化訓(xùn)練!...

    手把手教你做一個(gè) ChatGPT !絲滑小白版,只需一張單卡 GPU,輕松開啟個(gè)性化訓(xùn)練!...

    大家好,我是賀同學(xué)。 一直以來密切關(guān)注 ChatGPT 的趨勢(shì),最近相關(guān)的話題可謂是熱度不減,雖然從事互聯(lián)網(wǎng)行業(yè),但一直對(duì) LLM 相關(guān)領(lǐng)域關(guān)注較少。 最近的 ChatGPT 的火熱,讓我對(duì) LLM 相關(guān)開源社區(qū)也關(guān)注了起來,相關(guān)的開源社區(qū),也涌現(xiàn)了很多優(yōu)秀的工作,吸引了很多人的關(guān)

    2024年02月08日
    瀏覽(93)
  • 基于聯(lián)合表示學(xué)習(xí)、用戶聚類和模型自適應(yīng)的個(gè)性化聯(lián)合推薦

    基于聯(lián)合表示學(xué)習(xí)、用戶聚類和模型自適應(yīng)的個(gè)性化聯(lián)合推薦

    [Personalized Federated Recommendation via Joint Representation Learning, User Clustering, and Model Adaptation] (https://dl.acm.org/doi/abs/10.1145/3511808.3557668) CIKM2022(CCF-B) 文章主要?jiǎng)?chuàng)新點(diǎn)(消融實(shí)驗(yàn)分析的三個(gè)點(diǎn)): 聯(lián)合表示學(xué)習(xí) 聯(lián)合表示學(xué)習(xí)是指通過將用戶的協(xié)作信息和屬性信息結(jié)合起來,使用圖神經(jīng)網(wǎng)絡(luò)

    2024年02月06日
    瀏覽(23)
  • 【AIGC】AnimateDiff:無需定制化微調(diào)的動(dòng)畫化個(gè)性化的文生圖模型

    【AIGC】AnimateDiff:無需定制化微調(diào)的動(dòng)畫化個(gè)性化的文生圖模型

    Animatediff是一個(gè)有效的框架將文本到圖像模型擴(kuò)展到動(dòng)畫生成器中,無需針對(duì)特定模型進(jìn)行調(diào)整。只要在大型視頻數(shù)據(jù)集中學(xué)習(xí)到運(yùn)動(dòng)先驗(yàn)知識(shí)。AnimateDiff就可以插入到個(gè)性化的文生圖模型中,與Civitai和Huggingface的文生圖模型兼容,也可以與自己微調(diào)的大模型兼容。 ?隨著文本

    2024年01月25日
    瀏覽(31)
  • AutoDev 1.1.3  登場(chǎng),個(gè)性化 AI 輔助:私有化大模型、自主設(shè)計(jì) prompt、定義獨(dú)特規(guī)則...

    AutoDev 1.1.3 登場(chǎng),個(gè)性化 AI 輔助:私有化大模型、自主設(shè)計(jì) prompt、定義獨(dú)特規(guī)則...

    使用自己部署的開源大模型 自己配置 Intellij IDEA 中的行為 自定義開發(fā)過程中的規(guī)范 當(dāng)然了,如果您自身擁有開發(fā)能力的話,建議您自己基于 AutoDev 定制。畢竟,為 AutoDev 添加太多的自定義能力,會(huì)導(dǎo)致架構(gòu)的復(fù)雜性螺旋上升。 AutoDev 現(xiàn)在已支持多語言(不同語言能力有所差

    2024年02月11日
    瀏覽(27)
  • 個(gè)性化定制的知識(shí)付費(fèi)小程序,為用戶提供個(gè)性化的知識(shí)服務(wù)

    個(gè)性化定制的知識(shí)付費(fèi)小程序,為用戶提供個(gè)性化的知識(shí)服務(wù)

    明理信息科技知識(shí)付費(fèi)saas租戶平臺(tái)? 隨著知識(shí)經(jīng)濟(jì)的興起,越來越多的人開始重視知識(shí)付費(fèi),并希望通過打造自己的知識(shí)付費(fèi)平臺(tái)來實(shí)現(xiàn)自己的知識(shí)變現(xiàn)。本文將介紹如何打造自己的知識(shí)付費(fèi)平臺(tái),并從定位、內(nèi)容制作、渠道推廣、運(yùn)營維護(hù)四個(gè)方面進(jìn)行詳細(xì)闡述。 一、定

    2024年01月16日
    瀏覽(25)
  • 使用ChatGPT進(jìn)行個(gè)性化學(xué)習(xí)

    使用ChatGPT進(jìn)行個(gè)性化學(xué)習(xí)

    推薦:將 NSDT場(chǎng)景編輯器 加入你的3D工具鏈 3D工具集: NSDT簡(jiǎn)石數(shù)字孿生 在這篇文章中,您將發(fā)現(xiàn) ChatGPT 作為機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)愛好者的個(gè)人導(dǎo)師的好處。特別是,您將學(xué)習(xí) 如何讓ChatGPT引導(dǎo)你學(xué)習(xí)抽象代數(shù) 如何讓 ChatGPT 幫助您準(zhǔn)備數(shù)據(jù)科學(xué)面試 讓我們開始吧。 使用ChatG

    2024年02月16日
    瀏覽(22)
  • 一、 個(gè)性化電商廣告推薦系統(tǒng)介紹

    1.1 數(shù)據(jù)集介紹 Ali_Display_Ad_Click是阿里巴巴提供的一個(gè)淘寶展示廣告點(diǎn)擊率預(yù)估數(shù)據(jù)集 數(shù)據(jù)集來源:天池競(jìng)賽 原始樣本骨架raw_sample 淘寶網(wǎng)站中隨機(jī)抽樣了114萬用戶8天內(nèi)的廣告展示/點(diǎn)擊日志(2600萬條記錄),構(gòu)成原始的樣本骨架。 字段說明如下: user_id:脫敏過的用戶ID;

    2024年02月13日
    瀏覽(31)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包