国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

SWE-Agent 這是針對本地模型的新人工智能一個開源項目

這篇具有很好參考價值的文章主要介紹了SWE-Agent 這是針對本地模型的新人工智能一個開源項目。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

完全自主的編碼代理,可以解決 GitHub 問題。 它在編碼基準測試中的得分幾乎與 Devin 一樣高。 這是完整的評論和教程。

SWE-agent 將 LM(例如 GPT-4)轉(zhuǎn)變?yōu)檐浖こ檀?,可以修復真?GitHub 存儲庫中的錯誤和問題。

?? 在完整的 SWE-bench 測試集上,SWE-agent 修復了 12.29% 的問題,這是完整測試集上最新的結(jié)果。

我們通過設計簡單的以 LM 為中心的命令和專門構(gòu)建的輸入和輸出格式來實現(xiàn)這些結(jié)果,使 LM 更容易瀏覽存儲庫、查看、編輯和執(zhí)行代碼文件。 我們將此稱為代理計算機接口 (ACI),并構(gòu)建 SWE 代理存儲庫,以便輕松迭代存儲庫級編碼代理的 ACI 設計。

swe-agent源碼解析,AI,swe-agent,人工智能

Agent-Computer Interface 代理計算機接口 (ACI)

我們通過設計簡單的以 LM 為中心的命令和反饋格式來實現(xiàn)這些結(jié)果,使 LM 更容易瀏覽存儲庫、查看、編輯和執(zhí)行代碼文件。 我們將其稱為代理計算機接口 (ACI),并構(gòu)建 SWE 代理存儲庫,以便輕松迭代存儲庫級編碼代理的 ACI 設計。

就像典型的語言模型需要良好的提示工程一樣,良好的 ACI 設計在使用代理時會帶來更好的結(jié)果。 正如我們在論文中所示,沒有經(jīng)過良好調(diào)整的 ACI 的基線代理的表現(xiàn)比 SWE 代理差得多。

SWE-agent 包含我們發(fā)現(xiàn)在代理-計算機界面設計過程中非常有用的功能:
  1. 我們添加了一個在發(fā)出編輯命令時運行的 linter,并且如果代碼語法不正確,則不會讓編輯命令通過。
  2. 我們?yōu)榇硖峁┝艘粋€專門構(gòu)建的文件查看器,而不僅僅是 cat 文件。 我們發(fā)現(xiàn)此文件查看器在每輪僅顯示 100 行時效果最佳。 我們構(gòu)建的文件編輯器具有用于上下滾動以及在文件中執(zhí)行搜索的命令。
  3. 我們?yōu)榇硖峁┝藢iT構(gòu)建的全目錄字符串搜索命令。 我們發(fā)現(xiàn)該工具簡潔地列出匹配項非常重要 - 我們只需列出至少有一個匹配項的每個文件。 事實證明,向模型顯示有關每場比賽的更多上下文對于模型來說太混亂了。
  4. 當命令的輸出為空時,我們會返回一條消息,指出“您的命令已成功運行,但未產(chǎn)生任何輸出”。

請閱讀我們的論文了解更多詳細信息。

@misc{yang2024sweagent,
      title={SWE-agent: Agent Computer Interfaces Enable Software Engineering Language Models}, 
      author={John Yang and Carlos E. Jimenez and Alexander Wettig and Shunyu Yao and Karthik Narasimhan and Ofir Press},
      year={2024},
}
Setup 設置
  1. 安裝 Docker,然后在本地啟動 Docker。
    ?
  2. 安裝 Miniconda,使用
    conda env create -fenvironment.yml
    ?創(chuàng)建 swe-agent 環(huán)境 使用?
    ?
  3. 使用
    conda activate swe-agent
    激活。
    ?
  4. 運行
     ./setup.sh 
    創(chuàng)建 swe-agent docker 鏡像。
    ?
  5. 在此存儲庫的根目錄下創(chuàng)建一個keys.cfg 文件并填寫以下內(nèi)容:
    GITHUB_TOKEN: 'GitHub Token Here (required)'
    OPENAI_API_KEY: 'OpenAI API Key Here if using OpenAI Model (optional)'
    ANTHROPIC_API_KEY: 'Anthropic API Key Here if using Anthropic Model (optional)'
    TOGETHER_API_KEY: 'Together API Key Here if using Together Model (optional)'
    AZURE_OPENAI_API_KEY: 'Azure OpenAI API Key Here if using Azure OpenAI Model (optional)'
    AZURE_OPENAI_ENDPOINT: 'Azure OpenAI Endpoint Here if using Azure OpenAI Model (optional)'
    AZURE_OPENAI_DEPLOYMENT: 'Azure OpenAI Deployment Here if using Azure OpenAI Model (optional)'
    AZURE_OPENAI_API_VERSION: 'Azure OpenAI API Version Here if using Azure OpenAI Model (optional)'

    請參閱以下鏈接,獲取有關獲取 Anthropic、OpenAI 和 Github 令牌的教程。

Usage?用途

SWE-agent 管道有兩個步驟。 第一個 SWE 代理接受輸入 GitHub 問題并返回嘗試修復它的拉取請求。 我們稱該步驟為推理。 第二步(目前僅適用于 SWE-bench 基準測試中的問題)是評估拉取請求以驗證它確實解決了問題。

注意:目前,少數(shù)存儲庫存在已知問題,無法為arm64 / aarch64 架構(gòu)計算機正確安裝。 我們正在努力修復,但如果您想在整個 SWE-bench 上運行和評估,最簡單的方法是使用 x86 機器。

Inference 推論

對任何 GitHub 問題進行推理:使用此腳本,您可以在任何 GitHub 問題上運行 SWE-agent!

python run.py --model_name gpt4 \
  --data_path https://github.com/pvlib/pvlib-python/issues/1603 \
  --config_file config/default_from_url.yaml

SWE-bench 上的推理:在 SWE-bench Lite 上運行 SWE-agent 并生成補丁。

python run.py --model_name gpt4 \
  --per_instance_cost_limit 2.00 \
  --config_file ./config/default.yaml

如果您想從 SWE-bench 運行單個問題,請使用 --instance_filter 選項,如下所示:

python run.py --model_name gpt4 \
  --instance_filter marshmallow-code__marshmallow-1359
  • 請參閱 script/?文件夾以獲取其他有用的腳本和詳細信息。
  • 有關如何定義自己的配置的詳細信息,請參閱?config/?文件夾!
  • 有關基于配置的工作流程背后的邏輯的詳細信息,請參閱?sweagent/agent/ 文件夾。
  • 有關 SWEEnv 環(huán)境(接口 + 實現(xiàn))的詳細信息,請參閱 sweagent/environment/?文件夾。
  • 有關 run.py 輸出的詳細信息,請參閱 trajectories/文件夾。
Evaluation 評估

此步驟僅適用于 SWE 基準集中的問題。 要評估生成的拉取請求:

cd evaluation/
./run_eval.sh <predictions_path>

將 <predictions_path> 替換為模型預測的路徑,該路徑應從推理步驟生成。 <predictions_path> 參數(shù)應類似于 ../trajectories/<username>/<model>-<dataset>-<hyperparams>/all_preds.jsonl

有關評估如何工作的詳細信息,請參見評估/文件夾文章來源地址http://www.zghlxwxcb.cn/news/detail-858477.html

到了這里,關于SWE-Agent 這是針對本地模型的新人工智能一個開源項目的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 人工智能 | 一文介紹五種基本 Agent

    人工智能 | 一文介紹五種基本 Agent

    在討論智能化 Agent 之前,我們首先來了解一下,什么是 Agent? Agent 是一個通過 傳感器 感知所處環(huán)境、通過 執(zhí)行器 對環(huán)境產(chǎn)生作用的東西。 如果將人類看成一個 Agent,那么傳感器就是眼睛、耳朵等器官,執(zhí)行器就是手、腿等身體的其他部位。 接下來,我們就來介紹一下五

    2024年04月12日
    瀏覽(26)
  • 人工智能入門教學——AI代理(AI Agent)

    人工智能入門教學——AI代理(AI Agent)

    目錄 一、簡介 二、特征 三、結(jié)構(gòu) 四、工作流程 五、類型 六、應用 AI代理 (Artificial Intelligence Agent)是指 使用人工智能技術和算法來執(zhí)行特定任務、解決問題或?qū)崿F(xiàn)目標的 程序或系統(tǒng) 。 這些代理可以是簡單的程序,也可以是復雜的系統(tǒng),其設計目的是模擬和執(zhí)行類似人類智

    2024年02月03日
    瀏覽(30)
  • 多Agent框架之-CrewAI-人工智能代理團隊的未來

    多Agent框架之-CrewAI-人工智能代理團隊的未來

    CrewAI- a role playing AI Agents git地址:https://github.com/joaomdmoura/crewai#why-crewai langchain地址:CrewAI Unleashed: Future of AI Agent Teams Agent具有與另一個Agent聯(lián)系的能力,以委派工作或提出問題。 任務可以使用特定的代理工具覆蓋,這些工具應該被使用,同時還可以指定特定的代理來處理它們

    2024年02月03日
    瀏覽(29)
  • 人工智能 Agent 簡介:核心原理 / 數(shù)學公式 / 實現(xiàn)算法 / 代碼實例

    人工智能 Agent 簡介:核心原理 / 數(shù)學公式 / 實現(xiàn)算法 / 代碼實例

    人工智能Agent(AI Agent)是一個自動化的系統(tǒng),它可以感知其環(huán)境并根據(jù)其感知進行決策以實現(xiàn)特定的目標。這些Agent可以是簡單的程序,如搜索引擎的爬蟲,也可以是復雜的系統(tǒng),如自動駕駛汽車。AI Agent的主要目標是通過學習和優(yōu)化來提高其性能。 AI Agent的實現(xiàn)原理主要基

    2024年02月12日
    瀏覽(29)
  • 【人工智能】之深入理解 AI Agent:超越代碼的智能助手(2)

    人工智能(AI)正在以前所未有的速度迅猛發(fā)展,而AI Agent(智能代理)則是這一領域中備受矚目的一環(huán)。 AI Agent 不僅僅是程序的執(zhí)行者,更是能夠感知、學習和交互的智能實體。本文將深入探討什么是 AI Agent ,以及這一概念在當今科技領域中的重要性。 AI Agent 是指一種能夠

    2024年01月19日
    瀏覽(40)
  • 【人工智能】— 邏輯Agent、一般邏輯、Entailment 蘊涵、命題邏輯、前向鏈接、反向鏈接、Resolution歸結(jié)

    【人工智能】— 邏輯Agent、一般邏輯、Entailment 蘊涵、命題邏輯、前向鏈接、反向鏈接、Resolution歸結(jié)

    邏輯智能體:基于知識的智能體 知識和推理的重要性 部分可觀察的環(huán)境 自然語言理解 基于知識的智能體的靈活性 知識庫是一組用形式化語言表述的陳述句,其中包含有系統(tǒng)需要了解的信息。 在構(gòu)建一個智能體時,通常采用“告訴”和“詢問”的方式,即先將需要的知識加

    2024年02月08日
    瀏覽(17)
  • AI人工智能Mojo語言:AI的新編程語言

    AI人工智能Mojo語言:AI的新編程語言

    推薦:使用 NSDT場景編輯器 快速搭建3D應用場景 Mojo的主要功能包括: 類似Python的語法和動態(tài)類型使Python開發(fā)人員易于學習Mojo,因為Python是現(xiàn)代AI / ML開發(fā)背后的主要編程語言。 使用Mojo,您可以導入和使用任何Python庫,確保與Python的完全互操作性。 它支持實時 (JIT) 和提前

    2024年02月09日
    瀏覽(24)
  • 人工智能與音樂結(jié)合,打造未來音樂產(chǎn)業(yè)的新商業(yè)模式

    作者:禪與計算機程序設計藝術 在這個技術日新月異的時代,音樂已經(jīng)成為人們生活不可或缺的一部分。其中的重要因素之一就是其廣闊的現(xiàn)實空間以及充滿著豐富多彩的音符、旋律和節(jié)奏的創(chuàng)作力。隨著科技的飛速發(fā)展和互聯(lián)網(wǎng)的蓬勃發(fā)展,人類的音樂創(chuàng)作能力也發(fā)生了翻

    2024年02月11日
    瀏覽(23)
  • 探索人工智能在健康數(shù)據(jù)分析中的新領域:智能醫(yī)療咨詢

    作者:禪與計算機程序設計藝術 隨著全球數(shù)字化進程的加快、互聯(lián)網(wǎng)行業(yè)的蓬勃發(fā)展、數(shù)字健康產(chǎn)品和服務的不斷涌現(xiàn),人工智能(AI)作為一種高技術含量的新興產(chǎn)業(yè)正在引爆全新的經(jīng)濟增長點。而如何利用人工智能技術幫助醫(yī)療機構(gòu)進行健康管理,則是一個亟待解決的問

    2024年02月07日
    瀏覽(18)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包