国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

基于AI的架構優(yōu)化:創(chuàng)新數(shù)據(jù)集構造法提升Feature envy壞味道檢測與重構準確率

這篇具有很好參考價值的文章主要介紹了基于AI的架構優(yōu)化:創(chuàng)新數(shù)據(jù)集構造法提升Feature envy壞味道檢測與重構準確率。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

本文分享自華為云社區(qū)《華為云基于AI實現(xiàn)架構壞味道重構取得業(yè)界突破,相應文章已被軟工頂會FSE 2023收錄》,作者: 華為云軟件分析Lab。

基于AI技術實現(xiàn)架構壞味道檢測與重構建議是當前業(yè)界比較流行的做法,但此做法往往存在一個通病,即訓練數(shù)據(jù)集的質(zhì)量問題,如何構建大規(guī)模、高質(zhì)量的訓練數(shù)據(jù)成為制約算法有效性的關鍵挑戰(zhàn)。針對這項挑戰(zhàn),我們以Feature envy架構壞味道為例,利用一系列啟發(fā)式規(guī)則和一個基于決策樹的分類器,實現(xiàn)了一種基于真實數(shù)據(jù)的高質(zhì)量重構數(shù)據(jù)集構造方法,并利用此方法構建的數(shù)據(jù)集將Feature envy架構壞味道的檢測與重構準確率提升到業(yè)界SOTA水平。此工作來自華為云技術創(chuàng)新Lab和北京理工大學劉輝教授團隊的合作項目,相應產(chǎn)出已落地至華為公司內(nèi)部研發(fā)工具,相關研究成果已被軟件工程領域頂會ESEC/FSE 2023(CCF A類)正式收錄,文章詳細內(nèi)容已經(jīng)公開,歡迎查閱。

圖1 Feature envy檢測方法概覽

如何獲得真實世界的移動方法重構數(shù)據(jù)集

我們通過一系列啟發(fā)式規(guī)則和一個基于決策樹的分類器來自動過濾現(xiàn)有的重構檢測工具的誤報。如果移動方法重構的源類在新版本中不存在或者目標類在舊版本中不存在,我們過濾這樣的重構,因為它們通常是與其它重構緊密相關的,例如提取類重構。其次我們也過濾掉重寫方法,測試方法,以及構造函數(shù),因為測試方法與生產(chǎn)代碼無關,其目的是為了測試生產(chǎn)代碼中某個方法是否符合開發(fā)者的預期。而重寫方法和構造函數(shù)通常不能被移動由于其編程特性。我們也利用了一個決策樹分類器來進一步過濾簡單的啟發(fā)式規(guī)則無法解決的情況。由于移動方法通常會涉及調(diào)用關系的遷徙,因此我們分別提取移動方法在兩個版本上的調(diào)用關系以及它們的語句匹配關系作為決策樹的特征。通過這兩步過濾,使開發(fā)者可以在大量提交中自動挖掘移動方法重構,降低其誤報的存在。

如何實現(xiàn)Feature envy的智能檢測與重構

通過在大量的項目和提交上挖掘移動方法重構,并應用我們的誤報過濾方法,我們可以自動地收集真實世界中由開發(fā)者所執(zhí)行的大量且高質(zhì)量的移動方法重構示例。為了訓練一個Feature envy檢測模型,我們也在相同的項目中隨機地等比例采樣了未移動的方法作為訓練數(shù)據(jù)集中的負樣本。我們的模型輸入包括文本度量和結構度量兩部分。其中文本度量由移動方法名,源類名,和目標類名三方面組成。結構度量包含移動方法分別和源類以及目標類之間的Jaccard距離(dist),與源類和目標類中的方法的調(diào)用次數(shù)(mcmc),以及與源類和目標類中的方法的調(diào)用個數(shù)(cbmc)?;谟柧毢玫哪P停覀兛梢詸z測真實世界中的項目是否存在Feature envy方法。并為其提供解決方案。對于待檢測的方法,我們也提出了一系列啟發(fā)式規(guī)則來降低誤報的可能性。包括數(shù)據(jù)類和工具類的過濾等。這樣的類通常是為了向外部提供數(shù)據(jù)訪問和操作。因此它們會被外部的方法頻繁訪問但訪問此類的方法并不應該被移動到這樣的類中。

圖2 Feature envy模型

方法效果評估

表1 評估結果

我們選擇了當前最先進的基于深度學習的方法(feDeep)以及知名的基于啟發(fā)式的方法(JDeodorant和JMove)。我們的方法在5個真實世界的項目上與這些方法相比,針對Feature envy檢測的準確性有明顯的提升。我們由此推斷出利用真實世界代碼訓練出的模型在實際檢測的過程中具備更好的表現(xiàn)。另外,所提出的方法在重構推薦上相比于現(xiàn)有的基于深度學習的方法也有明顯的提升。

PaaS技術創(chuàng)新Lab隸屬于華為云,致力于綜合利用軟件分析、數(shù)據(jù)挖掘、機器學習等技術,為軟件研發(fā)人員提供下一代智能研發(fā)工具服務的核心引擎和智慧大腦。我們將聚焦軟件工程領域硬核能力,不斷構筑研發(fā)利器,持續(xù)交付高價值商業(yè)特性!加入我們,一起開創(chuàng)研發(fā)新“境界”!

點擊關注,第一時間了解華為云新鮮技術~文章來源地址http://www.zghlxwxcb.cn/news/detail-747686.html

到了這里,關于基于AI的架構優(yōu)化:創(chuàng)新數(shù)據(jù)集構造法提升Feature envy壞味道檢測與重構準確率的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 阿里云機器學習PAI全新推出特征平臺 (Feature Store),助力AI建模場景特征數(shù)據(jù)高效利用

    阿里云機器學習PAI全新推出特征平臺 (Feature Store),助力AI建模場景特征數(shù)據(jù)高效利用

    推薦算法與系統(tǒng)在全球范圍內(nèi)已得到廣泛應用,為用戶提供了更個性化和智能化的產(chǎn)品推薦體驗。在推薦系統(tǒng)領域,AI建模中特征數(shù)據(jù)的復用、一致性等問題嚴重影響了建模效率。 阿里云機器學習平臺 PAI 推出特征平臺(PAI-FeatureStore) 。在所有需要特征的AI建模場景,用戶可

    2024年02月11日
    瀏覽(19)
  • 標題:深入了解ChatGPT:基于GPT-4架構的創(chuàng)新人工智能語言模型及其應用前景

    一、ChatGPT簡介 ChatGPT是一種基于OpenAI開發(fā)的GPT-4架構的人工智能語言模型。GPT-4是一種自然語言處理技術,其前身為GPT-3。隨著技術的迅速發(fā)展,GPT-4在許多方面超越了GPT-3,如模型規(guī)模、知識庫和性能。ChatGPT在多種語言和應用場景中表現(xiàn)出卓越的性能,成為現(xiàn)代人工智能領域

    2024年02月03日
    瀏覽(28)
  • 優(yōu)雅編碼!Java與MongoDB的創(chuàng)新數(shù)據(jù)庫架構

    優(yōu)雅編碼!Java與MongoDB的創(chuàng)新數(shù)據(jù)庫架構

    隨著現(xiàn)代應用程序?qū)?shù)據(jù)存儲和處理需求的不斷增加,開發(fā)人員需要尋找更具創(chuàng)新性和靈活性的數(shù)據(jù)庫架構來滿足這些需求。在這樣的背景下,Java與MongoDB的結合為開發(fā)人員提供了一種創(chuàng)新的數(shù)據(jù)庫架構,為應用程序帶來了無限可能。 下面將探討Java與MongoDB的創(chuàng)新數(shù)據(jù)庫架構

    2024年02月10日
    瀏覽(27)
  • 《人工智能算法案例大全:基于Python》——實踐AI算法,馭智創(chuàng)新之路

    《人工智能算法案例大全:基于Python》——實踐AI算法,馭智創(chuàng)新之路

    導語 隨著人工智能(AI)技術的飛速發(fā)展,AI算法成為推動智能化進程的核心要素。而在這個領域中,一本名為《人工智能算法案例大全:基于Python》的書籍引起了廣泛關注。本文將深入探討這本書所呈現(xiàn)的豐富案例,以及它在實踐AI算法、馭智創(chuàng)新之路上的重要作用。 第一

    2024年02月06日
    瀏覽(25)
  • 在英特爾AI開發(fā)板上用OpenVINO NNCF優(yōu)化YOLOv7,2.15倍性能提升

    在英特爾AI開發(fā)板上用OpenVINO NNCF優(yōu)化YOLOv7,2.15倍性能提升

    作者:康瑤明 英特爾邊緣計算創(chuàng)新大使 YOLO代表“You Only Look Once”,它是一種流行的實時物體檢測算法系列。最初的YOLO物體檢測器于2016年首次發(fā)布。從那時起,YOLO的不同版本和變體被提出,每個版本和變體都顯著提高了性能和效率。YOLO算法作為one-stage目標檢測算法最典型的

    2024年01月24日
    瀏覽(28)
  • 性能提升30%!袋鼠云數(shù)棧基于 Apache Hudi 的性能優(yōu)化實戰(zhàn)解析

    性能提升30%!袋鼠云數(shù)?;?Apache Hudi 的性能優(yōu)化實戰(zhàn)解析

    Apache Hudi 是一款開源的數(shù)據(jù)湖解決方案,它能夠幫助企業(yè)更好地管理和分析海量數(shù)據(jù),支持高效的數(shù)據(jù)更新和查詢。并提供多種數(shù)據(jù)壓縮和存儲格式以及索引功能,從而為企業(yè)數(shù)據(jù)倉庫實踐提供更加靈活和高效的數(shù)據(jù)處理方式。 在金融領域,企業(yè)可以使用 Hudi 來處理大量需要

    2024年02月09日
    瀏覽(22)
  • 優(yōu)化WordPress數(shù)據(jù)庫提升網(wǎng)站運行速度

    WordPress的文章、評論等很多數(shù)據(jù)都是存放在數(shù)據(jù)庫的,所以搭建wordpress網(wǎng)站的時間,網(wǎng)站的空間不需要多大,而數(shù)據(jù)庫一定要充足,而在WordPress數(shù)據(jù)庫中主要使用 wp_posts 表來存儲日志,頁面,附件,導航菜單等數(shù)據(jù),根據(jù)使用的時間越來越長,堆積的數(shù)據(jù)越來越多,從而運行

    2023年04月23日
    瀏覽(17)
  • MyBatis批量插入數(shù)據(jù)優(yōu)化,增加一個參數(shù),效率提升百倍

    MyBatis批量插入數(shù)據(jù)優(yōu)化,增加一個參數(shù),效率提升百倍

    項目中進行接口壓測,發(fā)現(xiàn)批量插入的速度有點超出預期,感覺很奇怪,經(jīng)過定位后發(fā)現(xiàn)mybatise-plus批量保存的處理十分緩慢,使用的是saveBatch方法,這點有點想不通。于是就進行了相關內(nèi)容分析。 根據(jù)mybatise-plus中saveBatch的方法進行源碼查看: ? 繼續(xù)跟蹤邏輯,從代碼上看,

    2024年02月15日
    瀏覽(25)
  • C嘎嘎~~[構造函數(shù)提升篇]

    C嘎嘎~~[構造函數(shù)提升篇]

    1.1.1問題引入 通過前面所學的知識, 我們知道了 _year , _month , _day 這三個變量都是一些聲明, 并沒有開辟空間, 不是定義. 這一個操作就是給 d1這個對象整體定義, 但是對象整體定義,并不代表著里面的三個成員變量定義了. ???那么問題來了: 成員變量是在什么時候定義的?? 1.1

    2024年02月07日
    瀏覽(13)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包