国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<label id="1btu5"><dfn id="1btu5"></dfn></label>

<meter id="1btu5"><xmp id="1btu5"></xmp></meter>

<track id="1btu5"><video id="1btu5"><tr id="1btu5"></tr></video></track>

斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

2年前作者：小小何先生分類：Toy博客閱讀(22)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance

主要解決問(wèn)題

這篇文章主要是要解決如何降低調(diào)用大語(yǔ)言模型的成本(ChatGPT)。大模型API調(diào)用成本主要是三方面的：1. prompt cost(輸入的prompt)；2. generation cost(輸出的部分)；3. 每次調(diào)用的固定開(kāi)銷(xiāo)(網(wǎng)費(fèi)等)。不用的模型之前的差異化收費(fèi)也不一樣，比如ChatGPT 10M的token需要30美金，但是如果是調(diào)用GPT-J的話，只需要0.2美金。

如何基于query的難易程度，來(lái)調(diào)用差異化的模型？如何將相似的問(wèn)題存起來(lái)，減少模型的調(diào)用？等等一些手段都可以用來(lái)減少GPT的調(diào)用，減少成本。作者提出了三種策略來(lái)減少開(kāi)銷(xiāo)：

prompt adaptation；
LLM approximation；
LLM cascade；

結(jié)論就是能夠減少98%的花銷(xiāo)，或者是相同花銷(xiāo)下，提升4%的性能。

采用什么方法

斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

Prompt adaptation

LLM的調(diào)用開(kāi)銷(xiāo)與query的大小呈線性遞增，因此減小prompt的長(zhǎng)度就是一個(gè)可以去減少開(kāi)銷(xiāo)的點(diǎn)。

prompt selections：選擇合適的，需要的QA示例：
query concatenation：多個(gè)query一起發(fā)送給chatgpt：

斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

LLM approximation

如果大語(yǔ)言模型的調(diào)用很貴，那么一個(gè)簡(jiǎn)單的想法就是去近似這個(gè)大語(yǔ)言模型。不管是completion cache，還是fine-tuning都是可以的。

斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

LLM cascade

不同的LLM APIs都具有他們各自的強(qiáng)項(xiàng)和弱項(xiàng)。

LLM cascade中兩個(gè)比較關(guān)鍵的地方是：1. scoring function；2. LLM router。

斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

在論文中，作者是采用DistiBERT去作為這個(gè) scoring function。LLM router就是作者非常建議的設(shè)定這些閾值和順序。當(dāng)然這個(gè)也可以用大模型中的Reward Model去評(píng)分。

LLM的多樣性同時(shí)會(huì)使得最終的性能有所提升，貴的LLM APIs也不一定見(jiàn)地好。

實(shí)驗(yàn)結(jié)論

作者在一些特定的數(shù)據(jù)集上面做了實(shí)驗(yàn)，以下是一些Cost和Acc的曲線圖?？梢钥吹胶苌俚腻X(qián)就能夠達(dá)到較為不錯(cuò)的效果。

斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

討論與展望

這里很重要的一點(diǎn)，時(shí)間開(kāi)銷(xiāo)作者這里并沒(méi)有討論。尤其是LLM cascade這塊，如果前兩次調(diào)用失敗，那時(shí)間開(kāi)銷(xiāo)就比較長(zhǎng)了。當(dāng)然還有一些問(wèn)題是LLM商業(yè)化應(yīng)用的共性問(wèn)題，安全，隱私，倫理，不確定性等等。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-463208.html

到了這里，關(guān)于斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

大模型也內(nèi)卷，Vicuna訓(xùn)練及推理指南，效果碾壓斯坦福羊駝
2023開(kāi)年以來(lái)，大模型進(jìn)入瘋狂內(nèi)卷狀態(tài)，大模型的發(fā)布都要以“天”為單位進(jìn)行迭代。之前，嘗試了從0到1復(fù)現(xiàn)斯坦福羊駝（Stanford Alpaca 7B），下面我們來(lái)嘗試從0到1復(fù)現(xiàn)Vicuna訓(xùn)練及推理。繼斯坦福羊駝（Stanford Alpaca）之后，UC伯克利、CMU、斯坦福等機(jī)構(gòu)的學(xué)者，聯(lián)手發(fā)布
2024年02月08日
瀏覽(25)
AI大模型額外學(xué)習(xí)一：斯坦福AI西部世界小鎮(zhèn)筆記（包括部署和源碼分析）
github鏈接 ①背景介紹 This repository accompanies our research paper titled “Generative Agents: Interactive Simulacra of Human Behavior.” It contains our core simulation module for generative agents—computational agents that simulate believable human behaviors—and their game environment. ②總體邏輯讓小鎮(zhèn)的NPC自由交流、開(kāi)party、生
2024年04月28日
瀏覽(20)
大幅超越DALL·E 2和Imagen，斯坦福發(fā)布RA-CM3模型，融合檢索與生成
文｜QvQ 最近，DALL-E和CM3等模型在多模態(tài)任務(wù)尤其是圖文理解上表現(xiàn)出色。然而，這些模型似乎需要將所有學(xué)到的知識(shí)存儲(chǔ)都存儲(chǔ)在模型參數(shù)中，這就不得不需要越來(lái)越大的模型和訓(xùn)練數(shù)據(jù)來(lái)獲取更多的知識(shí)，儼然將 bigger and better 綁定在了一起。那既然如此，哪還需要算法工
2024年02月09日
瀏覽(33)
斯坦福聯(lián)合Meta提出多模態(tài)模型RA-CM3，檢索增強(qiáng)機(jī)制或成文本圖像領(lǐng)域新制勝法寶
原文鏈接：https://www.techbeat.net/article-info?id=4403 作者：seven_ 論文鏈接： https://arxiv.org/abs/2211.12561 相信目前很多AI大模型研究者都會(huì)遇到一個(gè)非常困難的問(wèn)題，那就是很難控制的模型參數(shù)和容量，由于參與模型訓(xùn)練的數(shù)據(jù)量非常龐大，如果模型參數(shù)太少會(huì)導(dǎo)致過(guò)擬合，參數(shù)量過(guò)
2024年02月09日
瀏覽(22)
大模型機(jī)器人發(fā)展史：從VoxPoser、RT2到斯坦福Mobile ALOHA、Google機(jī)器人
23年7月，我在朋友圈評(píng)估Google的RT2說(shuō)道： “大模型正在革新一切領(lǐng)域啊，超帥，通過(guò)大模型不僅能理解“人話”，還能對(duì)“人話”進(jìn)行推理，并轉(zhuǎn)變?yōu)闄C(jī)器人能理解的指令，從而分階段完成任務(wù)?；仡^仔細(xì)看下論文” 當(dāng)時(shí)便對(duì)大模型機(jī)器人印象深刻，一直想仔細(xì)研究下來(lái)著
2024年02月02日
瀏覽(36)
斯坦福人生設(shè)計(jì)課——簡(jiǎn)略筆記
來(lái)源： ?爾 · 博內(nèi)特戴夫 · 伊萬(wàn)斯著圖書(shū)《人生設(shè)計(jì)課》目錄一、認(rèn)清當(dāng)下的情況，從四個(gè)維度觀察自己的人生二、平衡人生，但不要走入誤區(qū) 2.1 記錄你的“美好時(shí)光日志”： 2.1.1 記錄內(nèi)容： 2.1.2 輔助反思的方法：AEIOU方法 2.1.3 一個(gè)小TIPS： 2.1.4 如果你發(fā)現(xiàn)自己當(dāng)下
2024年02月11日
瀏覽(23)
斯坦福用幾百塊錢(qián)訓(xùn)練的alpaca，體驗(yàn)一下基于llama的7b和13b模型，據(jù)說(shuō)比gpt3.0還牛，結(jié)果怎樣？？你能信？
好久沒(méi)寫(xiě)代碼了，上頭了，強(qiáng)擼了！ 1、自己買(mǎi)個(gè)GPU服務(wù)器（如果不訓(xùn)練，可以隨便買(mǎi)個(gè)高內(nèi)存的即可），有些網(wǎng)站很便宜，小時(shí)起租！ 2、alpaca和模型下載地址：GitHub - antimatter15/alpaca.cpp: Locally run an Instruction-Tuned Chat-Style LLM git clone GitHub - antimatter15/alpaca.cpp: Locally run an Instr
2024年02月04日
瀏覽(21)
筆記匯總 | 斯坦福 CS229 機(jī)器學(xué)習(xí)
本文為斯坦福大學(xué) CS229 機(jī)器學(xué)習(xí)課程學(xué)習(xí)筆記本文主體部分轉(zhuǎn)載自黃海廣博士，文末已給出鏈接，大家有興趣可以直接訪問(wèn)筆記首頁(yè)，下載對(duì)應(yīng)課程資料及作業(yè)代碼課程官網(wǎng)：CS229: Machine Learning (stanford.edu) 課程視頻：Stanford CS229: Machine Learning Course, Lecture 1 - Andrew Ng (Autumn 2
2024年02月14日
瀏覽(18)
斯坦福JSKarel編程機(jī)器人使用介紹
為了避免被編程語(yǔ)言固有的復(fù)雜性所困擾，有一個(gè)被稱為卡雷爾（Karel）機(jī)器人的微型世界（microworld）的簡(jiǎn)化環(huán)境，可以讓編程初學(xué)者從中學(xué)習(xí)理解編程的基本概念，而不必掌握大量無(wú)關(guān)的細(xì)節(jié)，讓編程初學(xué)者更容易理解編程的要點(diǎn)和思維方式。斯坦福Karel是一門(mén)面向初學(xué)者
2024年02月05日
瀏覽(26)
斯坦福人生設(shè)計(jì)課——簡(jiǎn)略筆記（未完待更新）
來(lái)源： ?爾 · 博內(nèi)特戴夫 · 伊萬(wàn)斯著圖書(shū)《人生設(shè)計(jì)課》目錄一、認(rèn)清當(dāng)下的情況，從四個(gè)維度觀察自己的人生二、平衡人生，但不要走入誤區(qū) 2.1 記錄你的“美好時(shí)光日志”： 2.1.1 記錄內(nèi)容： 2.1.2 輔助反思的方法：AEIOU方法 2.1.3 一個(gè)小TIPS： 2.1.4 如果你發(fā)現(xiàn)自己當(dāng)下
2024年02月11日
瀏覽(22)