本文是LLM系列文章,針對(duì)《LARGE LANGUAGE MODEL AS AUTONOMOUS DECISION MAKER》的翻譯。
摘要
盡管大型語言模型(LLM)表現(xiàn)出令人印象深刻的語言理解和上下文學(xué)習(xí)能力,但在解決現(xiàn)實(shí)世界任務(wù)時(shí),它們的決策能力仍然嚴(yán)重依賴于特定任務(wù)專家知識(shí)的指導(dǎo)。為了釋放LLM作為自主決策者的潛力,本文提出了一種JUDEC賦予LLM自我判斷能力的方法,使LLM能夠?qū)崿F(xiàn)自主判斷和決策探索。具體來說,在JUDEC中,基于Elo的自我判斷機(jī)制被設(shè)計(jì)為將Elo分?jǐn)?shù)分配給決策步驟,通過兩個(gè)解決方案之間的成對(duì)比較來判斷其價(jià)值和效用,然后相應(yīng)地引導(dǎo)決策搜索過程走向最優(yōu)解決方案。ToolBench數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,JUDEC優(yōu)于基線,在不同任務(wù)上的通過率提高了10%以上。它提供更高質(zhì)量的解決方案并降低成本(ChatGPT API調(diào)用),突出了其有效性和效率。文章來源:http://www.zghlxwxcb.cn/news/detail-686101.html
1 引言
2 前言
3 任務(wù)形式化
4 方法
5 實(shí)驗(yàn)
6 相關(guān)工作
7 結(jié)論
在這項(xiàng)工作中,我們引入了一種新的方法JUDEC,使大型語言模型(LLM)能夠在不同的現(xiàn)實(shí)世界任務(wù)中作為自主決策者,而不需要特定任務(wù)的專家知識(shí)?;贓lo的自我判斷機(jī)制的引入增強(qiáng)了LLM對(duì)決策步驟的自我判斷,并指導(dǎo)決策探索過程。在ToolBench數(shù)據(jù)集上進(jìn)行的大量實(shí)驗(yàn)已經(jīng)證實(shí)了JUDEC的有效性,它通過顯著提高通過率和產(chǎn)生更高質(zhì)量的解決方案而優(yōu)于基線方法。此外,LLM API調(diào)用的減少顯示了我們方法的效率提高。通過賦予LLM自主決策能力,我們的工作為其在現(xiàn)實(shí)世界場景中的更廣泛應(yīng)用鋪平了道路,消除了對(duì)特定任務(wù)知識(shí)的依賴。文章來源地址http://www.zghlxwxcb.cn/news/detail-686101.html
到了這里,關(guān)于LARGE LANGUAGE MODEL AS AUTONOMOUS DECISION MAKER的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!