国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【網(wǎng)安AIGC專題10.19】論文3代碼生成：ChatGPT+自協(xié)作代碼生成+角色扮演（分析員、程序員、測試員）+消融實(shí)驗(yàn)、用于MBPP+HumanEval數(shù)據(jù)集

2年前作者：是Yu欸分類：Toy博客閱讀(36)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了【網(wǎng)安AIGC專題10.19】論文3代碼生成：ChatGPT+自協(xié)作代碼生成+角色扮演（分析員、程序員、測試員）+消融實(shí)驗(yàn)、用于MBPP+HumanEval數(shù)據(jù)集。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

寫在最前面

Yihong Dong?, Xue Jiang?, Zhi Jin?, Ge Li? (Peking University)
arXiv May 2023

arXiv 2023.4.15
https://arxiv.org/pdf/2304.07590.pdf

一位不愿意透露姓名的朋友分享了Self-collaboration Code Generation via ChatGPT《基于ChatGPT的自協(xié)作代碼生成》
這篇論文是chatgpt的黑盒api調(diào)用，因此沒有關(guān)于模型的微調(diào)等操作，更多的是提示工程的框架設(shè)計(jì)（后面同學(xué)提到，和思維鏈的工作有相通之處）
同時(shí)，由于是大模型，因此是零樣本和少樣本學(xué)習(xí)
如果之后有類似的idea，或許可以嘗試模仿論文中的圖設(shè)計(jì)、消融實(shí)驗(yàn)

朋友講解論文敘述框架性強(qiáng)，梳理論文的邏輯清晰
PPT也很清晰明了，很多值得學(xué)習(xí)的細(xì)節(jié)

朋友分享的收獲與啟發(fā)

1.框架性的idea也是一種方向，有時(shí)也可以帶來顯著的結(jié)果，在AI領(lǐng)域不止有提升算法的思路。
2.實(shí)現(xiàn)這種idea也需要嚴(yán)謹(jǐn)完整的推理和驗(yàn)證，將high-level的想法落到細(xì)節(jié)
3.作者的結(jié)論里說明了自協(xié)作架構(gòu)還是要結(jié)合人類程序員的指導(dǎo)，避免系統(tǒng)脫離需求，這說明ChatGPT暫時(shí)還不能完全自主地工作

課堂討論

框架性idea
實(shí)現(xiàn)idea，需要嚴(yán)謹(jǐn)完整的推理和驗(yàn)證

代碼生成如何協(xié)作，是一種方法嗎

漏洞檢測幫助這個(gè)框架，這個(gè)框架本身首先需要能檢測出漏洞，才能去輔助漏洞檢測

思路相同

思維鏈（2022），分步驟
三個(gè)人員可以用一個(gè)提示來完成

交互實(shí)用性

運(yùn)行時(shí)間上
將全部都用chatgpt，寫代碼換成codeX文章來源地址http://www.zghlxwxcb.cn/news/detail-769037.html

代碼生成與自協(xié)作框架摘要

目的： 代碼生成旨在生成符合特定規(guī)范、滿足人類需求的代碼，以提高軟件開發(fā)效率和質(zhì)量，甚至推動生產(chǎn)模式的轉(zhuǎn)變。

創(chuàng)新點(diǎn)： 本研究提出了一種自協(xié)作框架，使大型語言模型（LLM，例如ChatGPT）能夠應(yīng)對復(fù)雜的代碼生成任務(wù)。

方法： 該框架首先為三個(gè)不同角色的大型語言模型分配任務(wù)，包括分析員（analyst，負(fù)責(zé)需求分析）、程序員（coder，負(fù)責(zé)編寫代碼）、測試員（tester，負(fù)責(zé)檢驗(yàn)效果），然后通過軟件開發(fā)方法（SDM）規(guī)定了這些角色之間的交互方式。

結(jié)果： 通過所提出的自協(xié)作框架，相較于ChatGPT3.5，實(shí)驗(yàn)結(jié)果顯示在四種不同基準(zhǔn)測試中，Pass@1的性能提高了29.9%至47.1%。

mbpp (the sanitized version),前沿AIGC：網(wǎng)絡(luò)安全領(lǐng)域最新應(yīng)用與論文解讀,科研筆記與實(shí)踐,chatgpt,論文閱讀,nlp,ppt,自然語言處理,AIGC,代碼復(fù)審

成果和貢獻(xiàn)

提出LLM的自協(xié)作框架，以應(yīng)對“在復(fù)雜任務(wù)上生成正確的代碼”的挑戰(zhàn)

根據(jù)SDM實(shí)例化初始團(tuán)隊(duì)，在software development環(huán)節(jié)分配三個(gè)角色負(fù)責(zé)不同stage

由GPT3.5組成的自協(xié)作虛擬團(tuán)隊(duì)在各種代碼生成的基準(zhǔn)測試上，性能超過了GPT-4

在現(xiàn)實(shí)場景下，自協(xié)作模式有效完成復(fù)雜任務(wù)

自協(xié)作框架原理

1、DOL任務(wù)分配

根據(jù)任務(wù)分配角色指令，然后將對應(yīng)的任務(wù)傳遞給角色
mbpp (the sanitized version),前沿AIGC：網(wǎng)絡(luò)安全領(lǐng)域最新應(yīng)用與論文解讀,科研筆記與實(shí)踐,chatgpt,論文閱讀,nlp,ppt,自然語言處理,AIGC,代碼復(fù)審

2、共享黑板協(xié)作

不同角色間，將輸出的信息共享

3、Instance實(shí)例化

1）采用SDM中的經(jīng)典瀑布模型 [Petersen et al., 2009]，簡化為三個(gè)階段：分析、編碼、測試。
2）分析員：生成一個(gè)高維的計(jì)劃，著重指導(dǎo)程序員。程序員：根據(jù)分析員的計(jì)劃寫代碼；根據(jù)測試員的測試報(bào)告修改代碼。測試員：從功能性、可讀性和可維護(hù)性評判程序員的代碼
3）終止條件：達(dá)到最大交互次數(shù)n或者測試員報(bào)告沒有錯(cuò)誤

案例說明

簡單任務(wù)：基本操作

1）分析員：分解任務(wù)
+制定high-level計(jì)劃
2）程序員：按照計(jì)劃生成對應(yīng)代碼
3）測試員：檢驗(yàn)代碼的功能性和邊緣測試情況，反饋錯(cuò)誤讓程序員修改

復(fù)雜任務(wù)：游戲開發(fā)

未展示訓(xùn)練過程，僅說明結(jié)果
滿足所有游戲邏輯，保障了精確的角色控制，設(shè)置正確的碰撞檢測，必要的游戲資產(chǎn)加載和適當(dāng)?shù)膱D像縮放。此外，注意到了沒有直接規(guī)定但是符合常識的游戲邏輯，比如炸彈掉落至底部后會被重置位置
單個(gè)LLM只能生成腳本的粗略草稿
mbpp (the sanitized version),前沿AIGC：網(wǎng)絡(luò)安全領(lǐng)域最新應(yīng)用與論文解讀,科研筆記與實(shí)踐,chatgpt,論文閱讀,nlp,ppt,自然語言處理,AIGC,代碼復(fù)審

實(shí)驗(yàn)

設(shè)置

數(shù)據(jù)集

四個(gè)基準(zhǔn)測試（數(shù)據(jù)集）

1）MBPP(sanitized version) [Austin et al., 2021]

427個(gè)Python編程任務(wù)，屬于調(diào)用標(biāo)準(zhǔn)庫功能函數(shù)的基礎(chǔ)代碼生成任務(wù)
包含：自然語言描述+編程計(jì)劃提示+3個(gè)測試用例

2）HumanEval [Chen et al., 2021]

164個(gè)編程任務(wù)
包含：自然語言描述+函數(shù)簽名+函數(shù)主體+單元測試

3）MBPP-ET

4）HumanEval-ET

比原本的數(shù)據(jù)集多100余個(gè)測試，包含邊緣案例

實(shí)驗(yàn)結(jié)果1：與其他代碼生成方法比較

輸入：自然語言+函數(shù)簽名+公共的測試用例
分析：相較于GPT-3.5增長了29.9%-34.6%；在后兩個(gè)數(shù)據(jù)集上表現(xiàn)更佳，證明自協(xié)作代碼生成的可靠性。
原因可能為：成員多可以考慮更多邊界條件和處理常見bug。

實(shí)驗(yàn)結(jié)果2：評估不同角色的影響

輸入：自然語言
分析：在HumanEval基準(zhǔn)測試上三角色團(tuán)隊(duì)效果最好，在MBPP基準(zhǔn)測試上coder-tester團(tuán)隊(duì)表現(xiàn)最好，
原因是：MBPP的兩個(gè)數(shù)據(jù)集任務(wù)較簡單，不需要計(jì)劃

實(shí)驗(yàn)結(jié)果3：評估有無角色的影響

mbpp (the sanitized version),前沿AIGC：網(wǎng)絡(luò)安全領(lǐng)域最新應(yīng)用與論文解讀,科研筆記與實(shí)踐,chatgpt,論文閱讀,nlp,ppt,自然語言處理,AIGC,代碼復(fù)審
few-shot prompting：每個(gè)階段給予一些案例提示
zero-shot：給予指令刪除角色，不給予提示
分析：角色指令的特定的上下文語境限制了LLM的生成空間，令其在場景約束下進(jìn)行推理，生成與命令一致的結(jié)果。few-shot比zero-shot表現(xiàn)差的原因是有限的例子提示不能完全反映目標(biāo)反而讓LLM的理解產(chǎn)生偏差，此外提示太長阻礙了LLM的理解。

實(shí)驗(yàn)結(jié)果4：評估交互次數(shù)的影響

mbpp (the sanitized version),前沿AIGC：網(wǎng)絡(luò)安全領(lǐng)域最新應(yīng)用與論文解讀,科研筆記與實(shí)踐,chatgpt,論文閱讀,nlp,ppt,自然語言處理,AIGC,代碼復(fù)審
Maximum Interaction(MI)=0，相當(dāng)于只有coder
分析：大多數(shù)任務(wù)在兩輪內(nèi)就可以完成；輪數(shù)越大，效果越好，但是由于maximum token的限制只能做4輪交互

結(jié)論與展望

優(yōu)勢

自協(xié)作框架允許團(tuán)隊(duì)成員的數(shù)量被修改，以適應(yīng)不同難度的代碼生成任務(wù)
在通用人工智能（AGI）時(shí)代，也可以不受限制，創(chuàng)造新的軟件開發(fā)模型和新角色組成的虛擬團(tuán)隊(duì)

問題

完全自主的系統(tǒng)，可能會脫離需求
有可能的解決方案：結(jié)合人類專家的指導(dǎo)監(jiān)督虛擬團(tuán)隊(duì)的操作

有價(jià)值的探索方向

通過外部工具彌補(bǔ)LLM自身存在的局限，比如通過角色指令調(diào)動Toolformer [Schick et al., 2023]

課堂討論

框架性idea
實(shí)現(xiàn)idea，需要嚴(yán)謹(jǐn)完整的推理和驗(yàn)證

代碼生成如何協(xié)作，是一種方法嗎

漏洞檢測幫助這個(gè)框架，這個(gè)框架本身首先需要能檢測出漏洞，才能去輔助漏洞檢測

思路相同

思維鏈（2022），分步驟
三個(gè)人員可以用一個(gè)提示來完成

交互實(shí)用性

運(yùn)行時(shí)間上
將全部都用chatgpt，寫代碼換成codeX

到了這里，關(guān)于【網(wǎng)安AIGC專題10.19】論文3代碼生成：ChatGPT+自協(xié)作代碼生成+角色扮演（分析員、程序員、測試員）+消融實(shí)驗(yàn)、用于MBPP+HumanEval數(shù)據(jù)集的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

【網(wǎng)安AIGC專題10.11】軟件安全+安全代碼大模型
本文為鄒德清教授的《網(wǎng)絡(luò)安全專題》課堂筆記系列的文章，本次專題主題為大模型。第一次課上，鄒德清教授對軟件安全+安全代碼大模型進(jìn)行了介紹最好進(jìn)行一系列體系性工作，科研連貫、市場需求、能落地（業(yè)務(wù)：提供代碼掃描檢測）、批判性思維（數(shù)據(jù)集趨勢）有
2024年02月03日
瀏覽(62)
【網(wǎng)安AIGC專題】46篇前沿代碼大模型論文、24篇論文閱讀筆記匯總
本文為鄒德清教授的《網(wǎng)絡(luò)安全專題》課堂筆記系列的文章，本次專題主題為大模型。本系列文章不僅涵蓋了46篇關(guān)于前沿代碼大模型的論文，還包含了24篇深度論文閱讀筆記，全面覆蓋了代碼生成、漏洞檢測、程序修復(fù)、生成測試等多個(gè)應(yīng)用方向，深刻展示了這些技術(shù)如何
2024年02月05日
瀏覽(25)
19ContraBERT：頂會ICSE23 數(shù)據(jù)增強(qiáng)+對比學(xué)習(xí)+代碼預(yù)訓(xùn)練模型，提升NLP模型性能與魯棒性：處理程序變異（變量重命名）【網(wǎng)安AIGC專題11.15】
隨著大規(guī)模代碼的崛起，無監(jiān)督學(xué)習(xí) 成為了提高代碼預(yù)訓(xùn)練模型性能的有效手段。這些預(yù)訓(xùn)練模型在廣泛的下游任務(wù)中表現(xiàn)出色，如自然語言處理和程序語言處理。例如，像CodeBERT和GraphCodeBERT這樣的模型在預(yù)訓(xùn)練階段通過大規(guī)模代碼數(shù)據(jù)學(xué)到通用的表示，并在下游任務(wù)上進(jìn)
2024年02月05日
瀏覽(33)
20源代碼模型的數(shù)據(jù)增強(qiáng)方法：克隆檢測、缺陷檢測和修復(fù)、代碼摘要、代碼搜索、代碼補(bǔ)全、代碼翻譯、代碼問答、問題分類、方法名稱預(yù)測和類型預(yù)測對論文進(jìn)行分組【網(wǎng)安AIGC專題11.15】
本文為鄒德清教授的《網(wǎng)絡(luò)安全專題》課堂筆記系列的文章，本次專題主題為大模型。一位同學(xué)分享了Data Augmentation Approaches for Source Code Models: A Survey 《源代碼模型的數(shù)據(jù)增強(qiáng)方法：綜述》全英文PPT，又學(xué)了很多專業(yè)術(shù)語英文排版好好看，感覺這位同學(xué)是直接閱讀的英文文
2024年02月02日
瀏覽(167)
【網(wǎng)安AIGC專題10.11】①代碼大模型的應(yīng)用：檢測、修復(fù)②其安全性研究：模型竊取攻擊（API和網(wǎng)頁接口）數(shù)據(jù)竊取攻擊對抗攻擊（用途：漏洞隱藏）后門攻擊（加觸發(fā)器+標(biāo)簽翻轉(zhuǎn)）
本文為鄒德清教授的《網(wǎng)絡(luò)安全專題》課堂筆記系列的文章，本次專題主題為大模型。第一次課上，文明老師的博士生杜小虎學(xué)長進(jìn)行了代碼大模型的應(yīng)用及其安全性研究的相關(guān)介紹將我之前不太明白的一些概念解釋得深入淺出，醐醍灌頂另有部分個(gè)人不成熟的理解，歡
2024年02月04日
瀏覽(26)
24 LLM錯(cuò)誤代碼補(bǔ)全：機(jī)器學(xué)習(xí)頂會NeurIPS‘23 智能體評估：自行構(gòu)建數(shù)據(jù)集Buggy-HumanEval、Buggy-FixEval+錯(cuò)誤代碼補(bǔ)全+修復(fù)模型【網(wǎng)安AIGC專題11.22】
本文為鄒德清教授的《網(wǎng)絡(luò)安全專題》課堂筆記系列的文章，本次專題主題為大模型。一位同學(xué)分享了Large Language Models of Code Fail at Completing Code with Potential Bugs《大語言模型在具有潛在錯(cuò)誤代碼補(bǔ)全中的問題》論文發(fā)表在NeurIPS’23，機(jī)器學(xué)習(xí)三大頂會之一。分享時(shí)的PPT簡潔大
2024年02月04日
瀏覽(45)
21Dak攻擊：計(jì)算機(jī)頂會PLDI‘23 針對語義依附代碼模型的對抗攻擊方法：Destroyer篡改輸入程序，F(xiàn)inder尋找關(guān)鍵特征，Merger關(guān)鍵特征注入【網(wǎng)安AIGC專題11.22】
本文為鄒德清教授的《網(wǎng)絡(luò)安全專題》課堂筆記系列的文章，本次專題主題為大模型。陳蘇寧同學(xué)分享了Discrete Adversarial Attack to Models of Code《對代碼模型的離散對抗性攻擊》 PPT很清爽接受起來比較順暢論文發(fā)布在：PLDI 2023（Programming Language Design and Implementation）計(jì)算機(jī)科學(xué)領(lǐng)
2024年01月16日
瀏覽(22)
23REPEAT方法：軟工頂會ICSE ‘23 大模型在代碼智能領(lǐng)域持續(xù)學(xué)習(xí) 代表性樣本重放（選擇信息豐富且多樣化的示例） + 基于可塑權(quán)重鞏固EWC的自適應(yīng)參數(shù)正則化【網(wǎng)安AIGC專題11.22】
本文為鄒德清教授的《網(wǎng)絡(luò)安全專題》課堂筆記系列的文章，本次專題主題為大模型。黃邕靈同學(xué)@potatotomato:分享了Keeping Pace with Ever-Increasing Data:Towards Continual Learning of Code Intelligence Models《跟上不斷增長的數(shù)據(jù):邁向代碼智能模型的持續(xù)學(xué)習(xí)》軟工頂會ICSE ‘23: Proceedings of t
2024年02月05日
瀏覽(30)
AIGC for code(AIGC/AI生成代碼/生成式AI之代碼生成/AI編程工具/自動編程/自動生成代碼/智能編程工具/智能編程系統(tǒng))
AIGC，Artificial Intelligence Generated Content，人工智能生成內(nèi)容 AIGC for code，AI生成代碼 Copilot是由微軟的子公司Github與openAI共同開發(fā)的人工智能（AI）驅(qū)動的編程助手。它能夠直接在你的編輯器中，為你提供代碼片段或者整個(gè)函數(shù)的建議，以幫助你更快地編寫和完成代碼。這個(gè)工具
2024年02月17日
瀏覽(24)
【Arxml專題】-29-使用Cantools將CAN Matrix Arxml自動生成C語言代碼
目錄 1 安裝Python和Cantools 1.1 查看Python已安裝的Package包 1.2 在Python中安裝Cantools插件包 1.3 獲取更多Cantools工具的更新動態(tài) 2 CAN Matrix Arxml自動生成C語言代碼 2.1 批處理文件CAN_Matrix_Arxml_To_C.bat內(nèi)容說明 2.2 CAN Matrix Arxml文件要求 2.3 如何使用生成的C語言代碼 3 附錄：CAN Matrix Arxml文件
2024年04月09日
瀏覽(19)