FIFL: A Fair Incentive Mechanism for Federated Learning
FL公平激勵機制(多中心FL,無區(qū)塊鏈)
論文資源已免費上傳
問題
1)沒有與其花費的資源相匹配的獎勵,設(shè)備就沒有興趣參加訓(xùn)練。
2)防范惡意員工——上傳無意義的更新進行破壞,防范低水平與搭便車者——獲得獎勵大于為系統(tǒng)帶來的收入。
本文設(shè)計
? ? ? ?公平獎勵員工,以吸引可靠高效的員工;同時基于動態(tài)實時員工評估機制懲罰和消除惡意員工。根據(jù)兩個指標表征工人的評估結(jié)果:1)貢獻和2)聲譽。貢獻衡量員工對系統(tǒng)的效用,聲譽是員工在一段時間內(nèi)產(chǎn)生有用更新的概率,兩者結(jié)合決定獎勵誠實員工(或懲罰攻擊者)的金額。
系統(tǒng)模型
1??聯(lián)邦學(xué)習
? ? ? ? ?多中心FL,在所有設(shè)備都中選擇M個設(shè)備成為服務(wù)器 。其基本訓(xùn)練流程為
? ? ? ? 1.1)局部訓(xùn)練以獲得局部梯度;
? ? ? ? 1.2)局部梯度分為M個切片;
? ? ? ? 1.3)工作者將并行的局部梯度切片發(fā)送到相應(yīng)的服務(wù)器;
? ? ? ? 2.1)每個服務(wù)器聚合一個梯度切片;
? ? ? ? 2.2)服務(wù)器并行地計算全局梯度切片;
? ? ? ? 1.4)服務(wù)器廣播全局梯度切片,工作人員下載它們;
? ? ? ? 1.5)工人重組全局梯度切片以獲得完整的全局梯度;
? ? ? ? 1.6)工人用全局梯度更新局部模型。
2??攻擊檢測-信譽-貢獻-獎勵四大模塊
? ? ? ?攻擊檢測模塊接收工人的梯度并消除有害的梯度。其次,聲譽模塊基于工人的歷史檢測結(jié)果的序列來測量工人的聲譽。之后,貢獻模塊計算工人的效用。最后,激勵模塊基于聲譽指標和貢獻指標確定員工獎勵的份額。所有中間結(jié)果和執(zhí)行人的簽名都存儲在區(qū)塊鏈中。
1)攻擊檢測模塊:旨在識別和消除攻擊者,通過檢查異常梯度識別攻擊者。
? ? ? 工人i的局部梯度表示為
? ? ? 其中N為工人數(shù),Di為工人i的訓(xùn)練數(shù)據(jù)集包含樣本數(shù)ni ?,(x,y)為特定訓(xùn)練樣本的對應(yīng)特征和標簽,θ為模型參數(shù),Li為i的損失,一個損失函數(shù),用于測量預(yù)測標簽F(θ,x)和真實標簽y之間的距離。
? ? ? 工人i的檢測分數(shù):
? ? ? ?其中Lt為測試損耗,Gi是要檢測的梯度;,G為誠實工人的基準梯度,Gi是i的局部梯度,?G,Gi? 是梯度的相似距離。
? ? ? 由于每個服務(wù)器聚合一個梯度切片,我們聚合來自服務(wù)器的檢測分數(shù)以生成無偏檢測結(jié)果。具體而言,工人i的全局檢測分數(shù)為:
? ? 其中 是評估工作者i的服務(wù)器j的檢測分數(shù), 是由工作者i產(chǎn)生并由服務(wù)器j聚合的梯度切片。
設(shè)置一個超參數(shù)閾值Sy來篩選攻擊者,即
? ? ? ? Sy在檢測攻擊者時控制檢測精度和誤報率之間的權(quán)衡,建議任務(wù)發(fā)布者在FL培訓(xùn)之前,通過驗證集上的簡短測試過程來確定Sy。
2)信譽模塊:SLM方法
? ? ? ? 使用 即(積極事件、消極事件和不確定事件)衡量員工的信譽。
? ? ? ? 由攻擊檢測模塊可知,ri=1則為積極事件;ri=0則是一個負事件;不確定事件包括網(wǎng)絡(luò)傳輸故障和無法識別的梯度。服務(wù)器統(tǒng)計每個周期內(nèi)積極事件、消極事件和不確定事件的數(shù)量,我們用Pn表示負面事件的數(shù)量,用Pt表示正面事件的數(shù)量。在工人i的梯度Gi的檢測結(jié)果為ri=0,則Pni=Pni+1,否則Pti=Pti+1。
? ? ? ? 工人i信任和不信任分數(shù)計算為:
? ? ? ? 其中St表示可信分數(shù),Sn表示不可信分數(shù),Su是梯度傳輸錯誤率。
? ? ? ? 工人i在一個時間間隔內(nèi)的聲譽計算為:
? ? ? ? ?其中αt、αn、αu是加權(quán)參數(shù)。
? ? ? ? 為了動態(tài)和客觀地衡量員工的聲譽,我們通過考慮時間衰減來擴展SLM。具體而言,較舊的事件權(quán)重較小,而最近的事件權(quán)重較大。將聲譽的時間衰減因子設(shè)置為γ。工人i在時間t+1的聲譽計算如下:
? ??
? ? ? ?其中Ri(t)是工人i在時間t的聲譽,γ控制聲譽對當前事件Ri(t+2)的敏感性
3)貢獻模塊:基于局部梯度和全局梯度之間的距離來計算工人的貢獻????
? ? ? ? 其中Dis()是歐幾里德范數(shù) 。
? ? ? ? 假設(shè)G0是所有值都為0的梯度,對系統(tǒng)沒有效用,為了計算相對貢獻,我們設(shè)置閾值,以區(qū)分正貢獻和負貢獻。
? ? ? 工人i的貢獻為:
? ? ? ? 其中如果bi≤ bh,貢獻為正,如果bi>bh,貢獻為負。
? ? ? ?對于閾值的設(shè)置,我們可以選擇一個合適工人i作為基準,則貢獻高于工人i的任何工人j可以獲得利潤,而其他工人無法獲得利潤。這一門檻有效地阻止了搭便車和效用低于要求的工人加入聯(lián)盟。
4)激勵模塊:信譽×獎勵
? ? ? ?貢獻是衡量每個迭代中工人效用的指標。聲譽是反映工人在產(chǎn)生有用梯度方面的可信度的指標。任務(wù)發(fā)布者將獎勵份額確定為貢獻和聲譽的乘積,工人i的獎勵份額為
文章來源:http://www.zghlxwxcb.cn/news/detail-781520.html
??????? 其中, 符號決定是否獎勵或懲罰工人, 是訓(xùn)練迭代中的總正貢獻,
是工人i貢獻的權(quán)重。文章來源地址http://www.zghlxwxcb.cn/news/detail-781520.html
到了這里,關(guān)于聯(lián)邦學(xué)習FL+激勵機制+區(qū)塊鏈論文閱讀3的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!