国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

這篇具有很好參考價(jià)值的文章主要介紹了斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

  • FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance

主要解決問(wèn)題

這篇文章主要是要解決如何降低調(diào)用大語(yǔ)言模型的成本(ChatGPT)。大模型API調(diào)用成本主要是三方面的:1. prompt cost(輸入的prompt);2. generation cost(輸出的部分);3. 每次調(diào)用的固定開(kāi)銷(xiāo)(網(wǎng)費(fèi)等)。不用的模型之前的差異化收費(fèi)也不一樣,比如ChatGPT 10M的token需要30美金,但是如果是調(diào)用GPT-J的話,只需要0.2美金。

如何基于query的難易程度,來(lái)調(diào)用差異化的模型?如何將相似的問(wèn)題存起來(lái),減少模型的調(diào)用?等等一些手段都可以用來(lái)減少GPT的調(diào)用,減少成本。作者提出了三種策略來(lái)減少開(kāi)銷(xiāo):

  1. prompt adaptation;
  2. LLM approximation;
  3. LLM cascade;

結(jié)論就是能夠減少98%的花銷(xiāo),或者是相同花銷(xiāo)下,提升4%的性能。

采用什么方法

斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

Prompt adaptation

LLM的調(diào)用開(kāi)銷(xiāo)與query的大小呈線性遞增,因此減小prompt的長(zhǎng)度就是一個(gè)可以去減少開(kāi)銷(xiāo)的點(diǎn)。

  • prompt selections:選擇合適的,需要的QA示例:
    斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

  • query concatenation:多個(gè)query一起發(fā)送給chatgpt:

斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

LLM approximation

如果大語(yǔ)言模型的調(diào)用很貴,那么一個(gè)簡(jiǎn)單的想法就是去近似這個(gè)大語(yǔ)言模型。不管是completion cache,還是fine-tuning都是可以的。

斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

LLM cascade

不同的LLM APIs都具有他們各自的強(qiáng)項(xiàng)和弱項(xiàng)。

LLM cascade中兩個(gè)比較關(guān)鍵的地方是:1. scoring function;2. LLM router。

斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

在論文中,作者是采用DistiBERT去作為這個(gè) scoring function。LLM router就是作者非常建議的設(shè)定這些閾值和順序。當(dāng)然這個(gè)也可以用大模型中的Reward Model去評(píng)分。

LLM的多樣性同時(shí)會(huì)使得最終的性能有所提升,貴的LLM APIs也不一定見(jiàn)地好。

實(shí)驗(yàn)結(jié)論

作者在一些特定的數(shù)據(jù)集上面做了實(shí)驗(yàn),以下是一些Cost和Acc的曲線圖??梢钥吹胶苌俚腻X(qián)就能夠達(dá)到較為不錯(cuò)的效果。

斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本

討論與展望

這里很重要的一點(diǎn),時(shí)間開(kāi)銷(xiāo)作者這里并沒(méi)有討論。尤其是LLM cascade這塊,如果前兩次調(diào)用失敗,那時(shí)間開(kāi)銷(xiāo)就比較長(zhǎng)了。當(dāng)然還有一些問(wèn)題是LLM商業(yè)化應(yīng)用的共性問(wèn)題,安全,隱私,倫理,不確定性等等。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-463208.html

到了這里,關(guān)于斯坦福2023【FrugalGPT】減少大模型的商業(yè)化應(yīng)用成本的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 大模型也內(nèi)卷,Vicuna訓(xùn)練及推理指南,效果碾壓斯坦福羊駝

    大模型也內(nèi)卷,Vicuna訓(xùn)練及推理指南,效果碾壓斯坦福羊駝

    2023開(kāi)年以來(lái),大模型進(jìn)入瘋狂內(nèi)卷狀態(tài),大模型的發(fā)布都要以“天”為單位進(jìn)行迭代。 之前,嘗試了 從0到1復(fù)現(xiàn)斯坦福羊駝(Stanford Alpaca 7B) ,下面我們來(lái)嘗試從0到1復(fù)現(xiàn)Vicuna訓(xùn)練及推理。 繼斯坦福羊駝(Stanford Alpaca)之后,UC伯克利、CMU、斯坦福等機(jī)構(gòu)的學(xué)者,聯(lián)手發(fā)布

    2024年02月08日
    瀏覽(25)
  • AI大模型額外學(xué)習(xí)一:斯坦福AI西部世界小鎮(zhèn)筆記(包括部署和源碼分析)

    AI大模型額外學(xué)習(xí)一:斯坦福AI西部世界小鎮(zhèn)筆記(包括部署和源碼分析)

    github鏈接 ①背景介紹 This repository accompanies our research paper titled “Generative Agents: Interactive Simulacra of Human Behavior.” It contains our core simulation module for generative agents—computational agents that simulate believable human behaviors—and their game environment. ②總體邏輯 讓小鎮(zhèn)的NPC自由交流、開(kāi)party、生

    2024年04月28日
    瀏覽(20)
  • 大幅超越DALL·E 2和Imagen,斯坦福發(fā)布RA-CM3模型,融合檢索與生成

    大幅超越DALL·E 2和Imagen,斯坦福發(fā)布RA-CM3模型,融合檢索與生成

    文|QvQ 最近,DALL-E和CM3等模型在多模態(tài)任務(wù)尤其是圖文理解上表現(xiàn)出色。然而,這些模型似乎需要將所有學(xué)到的知識(shí)存儲(chǔ)都存儲(chǔ)在模型參數(shù)中,這就不得不需要越來(lái)越大的模型和訓(xùn)練數(shù)據(jù)來(lái)獲取更多的知識(shí),儼然將 bigger and better 綁定在了一起。 那既然如此,哪還需要算法工

    2024年02月09日
    瀏覽(33)
  • 斯坦福聯(lián)合Meta提出多模態(tài)模型RA-CM3,檢索增強(qiáng)機(jī)制或成文本圖像領(lǐng)域新制勝法寶

    斯坦福聯(lián)合Meta提出多模態(tài)模型RA-CM3,檢索增強(qiáng)機(jī)制或成文本圖像領(lǐng)域新制勝法寶

    原文鏈接:https://www.techbeat.net/article-info?id=4403 作者:seven_ 論文鏈接: https://arxiv.org/abs/2211.12561 相信目前很多AI大模型研究者都會(huì)遇到一個(gè)非常困難的問(wèn)題,那就是 很難控制的模型參數(shù)和容量 ,由于參與模型訓(xùn)練的數(shù)據(jù)量非常龐大,如果模型參數(shù)太少會(huì)導(dǎo)致過(guò)擬合,參數(shù)量過(guò)

    2024年02月09日
    瀏覽(22)
  • 大模型機(jī)器人發(fā)展史:從VoxPoser、RT2到斯坦福Mobile ALOHA、Google機(jī)器人

    大模型機(jī)器人發(fā)展史:從VoxPoser、RT2到斯坦福Mobile ALOHA、Google機(jī)器人

    23年7月,我在朋友圈評(píng)估Google的RT2說(shuō)道: “大模型正在革新一切領(lǐng)域啊,超帥,通過(guò)大模型不僅能理解“人話”,還能對(duì)“人話”進(jìn)行推理,并轉(zhuǎn)變?yōu)闄C(jī)器人能理解的指令,從而分階段完成任務(wù)?;仡^仔細(xì)看下論文” 當(dāng)時(shí)便對(duì)大模型機(jī)器人印象深刻,一直想仔細(xì)研究下來(lái)著

    2024年02月02日
    瀏覽(36)
  • 斯坦福人生設(shè)計(jì)課——簡(jiǎn)略筆記

    斯坦福人生設(shè)計(jì)課——簡(jiǎn)略筆記

    來(lái)源: ?爾 · 博內(nèi)特 戴夫 · 伊萬(wàn)斯 著圖書(shū)《人生設(shè)計(jì)課》 目錄 一、認(rèn)清當(dāng)下的情況,從四個(gè)維度觀察自己的人生 二、平衡人生,但不要走入誤區(qū) 2.1 記錄你的“美好時(shí)光日志”: 2.1.1 記錄內(nèi)容: 2.1.2 輔助反思的方法:AEIOU方法 2.1.3 一個(gè)小TIPS: 2.1.4 如果你發(fā)現(xiàn)自己當(dāng)下

    2024年02月11日
    瀏覽(23)
  • 斯坦福用幾百塊錢(qián)訓(xùn)練的alpaca,體驗(yàn)一下基于llama的7b和13b模型,據(jù)說(shuō)比gpt3.0還牛,結(jié)果怎樣??你能信?

    斯坦福用幾百塊錢(qián)訓(xùn)練的alpaca,體驗(yàn)一下基于llama的7b和13b模型,據(jù)說(shuō)比gpt3.0還牛,結(jié)果怎樣??你能信?

    好久沒(méi)寫(xiě)代碼了,上頭了,強(qiáng)擼了! 1、自己買(mǎi)個(gè)GPU服務(wù)器(如果不訓(xùn)練,可以隨便買(mǎi)個(gè)高內(nèi)存的即可),有些網(wǎng)站很便宜,小時(shí)起租! 2、alpaca和模型下載地址:GitHub - antimatter15/alpaca.cpp: Locally run an Instruction-Tuned Chat-Style LLM git clone GitHub - antimatter15/alpaca.cpp: Locally run an Instr

    2024年02月04日
    瀏覽(21)
  • 筆記匯總 | 斯坦福 CS229 機(jī)器學(xué)習(xí)

    本文為斯坦福大學(xué) CS229 機(jī)器學(xué)習(xí)課程學(xué)習(xí)筆記 本文主體部分轉(zhuǎn)載自黃海廣博士,文末已給出鏈接,大家有興趣可以直接訪問(wèn)筆記首頁(yè),下載對(duì)應(yīng)課程資料及作業(yè)代碼 課程官網(wǎng):CS229: Machine Learning (stanford.edu) 課程視頻:Stanford CS229: Machine Learning Course, Lecture 1 - Andrew Ng (Autumn 2

    2024年02月14日
    瀏覽(18)
  • 斯坦福JSKarel編程機(jī)器人使用介紹

    斯坦福JSKarel編程機(jī)器人使用介紹

    為了避免被編程語(yǔ)言固有的復(fù)雜性所困擾,有一個(gè)被稱為卡雷爾(Karel)機(jī)器人的微型世界(microworld)的簡(jiǎn)化環(huán)境,可以讓編程初學(xué)者從中學(xué)習(xí)理解編程的基本概念,而不必掌握大量無(wú)關(guān)的細(xì)節(jié),讓編程初學(xué)者更容易理解編程的要點(diǎn)和思維方式。 斯坦福Karel是一門(mén)面向初學(xué)者

    2024年02月05日
    瀏覽(26)
  • 斯坦福人生設(shè)計(jì)課——簡(jiǎn)略筆記(未完待更新)

    斯坦福人生設(shè)計(jì)課——簡(jiǎn)略筆記(未完待更新)

    來(lái)源: ?爾 · 博內(nèi)特 戴夫 · 伊萬(wàn)斯 著圖書(shū)《人生設(shè)計(jì)課》 目錄 一、認(rèn)清當(dāng)下的情況,從四個(gè)維度觀察自己的人生 二、平衡人生,但不要走入誤區(qū) 2.1 記錄你的“美好時(shí)光日志”: 2.1.1 記錄內(nèi)容: 2.1.2 輔助反思的方法:AEIOU方法 2.1.3 一個(gè)小TIPS: 2.1.4 如果你發(fā)現(xiàn)自己當(dāng)下

    2024年02月11日
    瀏覽(22)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包