国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<th id="z3urt"></th>

openai模型個(gè)性化訓(xùn)練Embedding和fine-tuning區(qū)別

2年前作者：程序員老狼分類：Toy博客閱讀(23)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了openai模型個(gè)性化訓(xùn)練Embedding和fine-tuning區(qū)別。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

現(xiàn)在基于自然語言和文檔進(jìn)行對(duì)話的背后都是使用的基于嵌入的向量搜索。OpenAI在這方面做的很好，它的Cookbook(github.com/openai/openai-cookbook)上有很多案例，最近他們對(duì)文檔做了一些更新。
GPT擅長(zhǎng)回答問題，但是只能回答它以前被訓(xùn)練過的問題，如果是沒有訓(xùn)練過的數(shù)據(jù)，比如一些私有數(shù)據(jù)或者最新的數(shù)據(jù)該怎么辦呢？

這種情況下通常有兩種辦法，一種是微調(diào)(fine-tuning)，一種是嵌入(embedding)。

微調(diào)就是在大模型的數(shù)據(jù)基礎(chǔ)上做二次訓(xùn)練，事先準(zhǔn)備好一批prompt-complition(類似于問答Q&A)的數(shù)據(jù)，生成新的模型，這個(gè)模型將會(huì)包含微調(diào)后的數(shù)據(jù)。
而嵌入則是每次向ChatGPT發(fā)送消息(prompt)的時(shí)候，把你自己數(shù)據(jù)結(jié)果帶上。
王建碩老師對(duì)于微調(diào)和嵌入有過精妙的比喻：
ChatGPT就像一個(gè)已經(jīng)訓(xùn)練好的家政阿姨，她懂中文，會(huì)做家務(wù)，但是對(duì)你家里的情況不了解。
微調(diào)就相當(dāng)于阿姨第一次到你家干活的時(shí)候，你要花一小時(shí)時(shí)間告訴她家里的情況，比如物件的擺放、哪些地方不能動(dòng)，哪些地方要重點(diǎn)照顧。
嵌入就相當(dāng)于你省去了對(duì)阿姨進(jìn)行二次培訓(xùn)的，而是在家里貼滿紙條，這樣阿姨一看到紙條就知道該怎么做了。

OpenAI的Cookbook也有類似的比喻

微調(diào)就像你通過學(xué)習(xí)準(zhǔn)備考試，是一種長(zhǎng)期記憶，但過了一周后考試來臨，模型可能會(huì)忘記襲擊，或者記錯(cuò)它從來沒有讀過的事實(shí)。
嵌入就像記筆記，是一種短期記憶，當(dāng)考試的時(shí)候，你把筆記帶上，隨時(shí)翻看筆記，對(duì)于筆記上有的內(nèi)容可以得到準(zhǔn)確的答案。
另外嵌入的搜索提問方式相對(duì)于微調(diào)有一個(gè)缺點(diǎn)就是它每次附帶的文本數(shù)量是有限制的，因?yàn)槌嗽嫉膯栴}，它還需要帶上搜索出來的問題，GPT-3.5是4K(大約5頁)，GPT-4最大是32K(大約40頁)。
就好比你有成書架的教科書可以借鑒，但每次卻只能翻看其中幾頁筆記。
如果你想構(gòu)建一個(gè)對(duì)大量文本問答的系統(tǒng)，OpenAI建議“搜索-問”(Search-Ask)的方法。
也就是先在本地文檔庫中Search，拿到本地的數(shù)據(jù)結(jié)果，再去Ask，把搜索結(jié)果和問題一起交給GPT，這樣GPT可以根據(jù)你提供的內(nèi)容以及它模型中的數(shù)據(jù)，一起將結(jié)果返還給你。
至于如何搜索，并非一定要基于向量的搜索，可以有多重搜索方式：
- 基于關(guān)鍵字搜索
- 基于圖形的搜索
- 基于向量的搜索
至于在技術(shù)上如何實(shí)現(xiàn)，OpenAI的Cookbook上也有詳細(xì)的介紹。
更多細(xì)節(jié)建議參考：
github.com/openai/openai-cookbook/blob/main/examples/Question_answering_using_embeddings.ipynb

文章來源地址http://www.zghlxwxcb.cn/news/detail-613149.html

到了這里，關(guān)于openai模型個(gè)性化訓(xùn)練Embedding和fine-tuning區(qū)別的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

新模型GPT-5個(gè)性化定制將導(dǎo)致的安全問題
人工智能（AI）的發(fā)展速度遠(yuǎn)遠(yuǎn)超過了硅谷過去所見的任何其他技術(shù)。OpenAI首席執(zhí)行官山姆·奧特曼（Sam Altman）在最近的一次采訪中表示，他們的首要任務(wù)是推出可能被稱為GPT-5的新模型，這一模型將能夠比現(xiàn)有模型做更多的事情。這一消息引發(fā)了廣泛的關(guān)注和討論，因?yàn)镚P
2024年01月19日
瀏覽(31)
構(gòu)建自己的ChatGPT：從零開始構(gòu)建個(gè)性化語言模型
???? 博主 libin9iOak帶您 Go to New World.??? ?? 個(gè)人主頁——libin9iOak的博客?? ?? 《面試題大全》文章圖文并茂??生動(dòng)形象??簡(jiǎn)單易學(xué)！歡迎大家來踩踩~?? ?? 《IDEA開發(fā)秘籍》學(xué)會(huì)IDEA常用操作，工作效率翻倍~?? ???? 希望本文能夠給您帶來一定的幫助??文章粗淺，敬
2024年02月15日
瀏覽(28)
LLM-Rec:基于提示大語言模型的個(gè)性化推薦
論文題目:LLM-Rec: Personalized Recommendation via Prompting Large Language Models 作者:Hanjia Lyu, Song Jiang, Hanqing Zeng, Yinglong Xia, Jiebo Luo 機(jī)構(gòu):University of Rochester, University of California Los Angeles, Meta AI, University of Rochester 本文研究了通過輸入增強(qiáng)來提高大語言模型個(gè)性化內(nèi)容推薦性能的各種提示策略
2024年02月11日
瀏覽(32)
手把手教你做一個(gè) ChatGPT ！絲滑小白版，只需一張單卡 GPU，輕松開啟個(gè)性化訓(xùn)練！...
大家好，我是賀同學(xué)。一直以來密切關(guān)注 ChatGPT 的趨勢(shì)，最近相關(guān)的話題可謂是熱度不減，雖然從事互聯(lián)網(wǎng)行業(yè)，但一直對(duì) LLM 相關(guān)領(lǐng)域關(guān)注較少。最近的 ChatGPT 的火熱，讓我對(duì) LLM 相關(guān)開源社區(qū)也關(guān)注了起來，相關(guān)的開源社區(qū)，也涌現(xiàn)了很多優(yōu)秀的工作，吸引了很多人的關(guān)
2024年02月08日
瀏覽(93)
基于聯(lián)合表示學(xué)習(xí)、用戶聚類和模型自適應(yīng)的個(gè)性化聯(lián)合推薦
[Personalized Federated Recommendation via Joint Representation Learning, User Clustering, and Model Adaptation] (https://dl.acm.org/doi/abs/10.1145/3511808.3557668) CIKM2022(CCF-B) 文章主要?jiǎng)?chuàng)新點(diǎn)(消融實(shí)驗(yàn)分析的三個(gè)點(diǎn))：聯(lián)合表示學(xué)習(xí) 聯(lián)合表示學(xué)習(xí)是指通過將用戶的協(xié)作信息和屬性信息結(jié)合起來，使用圖神經(jīng)網(wǎng)絡(luò)
2024年02月06日
瀏覽(23)
【AIGC】AnimateDiff:無需定制化微調(diào)的動(dòng)畫化個(gè)性化的文生圖模型
Animatediff是一個(gè)有效的框架將文本到圖像模型擴(kuò)展到動(dòng)畫生成器中，無需針對(duì)特定模型進(jìn)行調(diào)整。只要在大型視頻數(shù)據(jù)集中學(xué)習(xí)到運(yùn)動(dòng)先驗(yàn)知識(shí)。AnimateDiff就可以插入到個(gè)性化的文生圖模型中，與Civitai和Huggingface的文生圖模型兼容，也可以與自己微調(diào)的大模型兼容。 ?隨著文本
2024年01月25日
瀏覽(31)
AutoDev 1.1.3 登場(chǎng)，個(gè)性化 AI 輔助：私有化大模型、自主設(shè)計(jì) prompt、定義獨(dú)特規(guī)則...
使用自己部署的開源大模型自己配置 Intellij IDEA 中的行為自定義開發(fā)過程中的規(guī)范當(dāng)然了，如果您自身擁有開發(fā)能力的話，建議您自己基于 AutoDev 定制。畢竟，為 AutoDev 添加太多的自定義能力，會(huì)導(dǎo)致架構(gòu)的復(fù)雜性螺旋上升。 AutoDev 現(xiàn)在已支持多語言（不同語言能力有所差
2024年02月11日
瀏覽(27)
個(gè)性化定制的知識(shí)付費(fèi)小程序，為用戶提供個(gè)性化的知識(shí)服務(wù)
明理信息科技知識(shí)付費(fèi)saas租戶平臺(tái)? 隨著知識(shí)經(jīng)濟(jì)的興起，越來越多的人開始重視知識(shí)付費(fèi)，并希望通過打造自己的知識(shí)付費(fèi)平臺(tái)來實(shí)現(xiàn)自己的知識(shí)變現(xiàn)。本文將介紹如何打造自己的知識(shí)付費(fèi)平臺(tái)，并從定位、內(nèi)容制作、渠道推廣、運(yùn)營維護(hù)四個(gè)方面進(jìn)行詳細(xì)闡述。一、定
2024年01月16日
瀏覽(25)
使用ChatGPT進(jìn)行個(gè)性化學(xué)習(xí)
推薦：將 NSDT場(chǎng)景編輯器加入你的3D工具鏈 3D工具集： NSDT簡(jiǎn)石數(shù)字孿生在這篇文章中，您將發(fā)現(xiàn) ChatGPT 作為機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)愛好者的個(gè)人導(dǎo)師的好處。特別是，您將學(xué)習(xí) 如何讓ChatGPT引導(dǎo)你學(xué)習(xí)抽象代數(shù) 如何讓 ChatGPT 幫助您準(zhǔn)備數(shù)據(jù)科學(xué)面試讓我們開始吧。使用ChatG
2024年02月16日
瀏覽(22)
一、個(gè)性化電商廣告推薦系統(tǒng)介紹
1.1 數(shù)據(jù)集介紹 Ali_Display_Ad_Click是阿里巴巴提供的一個(gè)淘寶展示廣告點(diǎn)擊率預(yù)估數(shù)據(jù)集數(shù)據(jù)集來源：天池競(jìng)賽原始樣本骨架raw_sample 淘寶網(wǎng)站中隨機(jī)抽樣了114萬用戶8天內(nèi)的廣告展示/點(diǎn)擊日志（2600萬條記錄），構(gòu)成原始的樣本骨架。字段說明如下： user_id：脫敏過的用戶ID；
2024年02月13日
瀏覽(31)

<center id="o6o6y"></center>

<sup id="o6o6y"></sup>

<sup id="o6o6y"></sup>