作者:中關(guān)村科金AI安全攻防實(shí)驗(yàn)室 馮月
金融行業(yè)正在面臨著前所未有的安全挑戰(zhàn),人臉安全事件頻發(fā),國(guó)家高度重視并提出警告,全行業(yè)每年黑產(chǎn)欺詐涉及資金額超過1100億元。冰山上是安全事件,冰山下隱藏的是“裸奔”的技術(shù)防御系統(tǒng),快速發(fā)展的生成式算法平均每1.5天就有一個(gè)新的變種出現(xiàn),而防御技術(shù)的迭代上線周期超過90天,零日漏洞風(fēng)險(xiǎn)敞口超過88.5天。
其中核心問題是攻擊數(shù)據(jù)的嚴(yán)重不足,“引擎缺乏燃料”,現(xiàn)有防御方法跟不上攻擊方法的演變速度,基于事件的專家防御體系強(qiáng)依賴于人工數(shù)據(jù)采集、標(biāo)注、處理的流程,以擴(kuò)大corner case規(guī)模,該過程占據(jù)了技術(shù)迭代更新過程中超過90%的時(shí)間成本。
行業(yè)迫切需要一個(gè)針對(duì)“零日漏洞”的“零日修復(fù)”方案縮小風(fēng)險(xiǎn)敞口,下一代防偽技術(shù)“金融領(lǐng)域的多模態(tài)防偽專有大模型”為此提供了一個(gè)新思路,大模型可以同時(shí)解決燃料和引擎問題,實(shí)現(xiàn)“tesla的跑車油改電”、“福特的汽車代馬車”。中關(guān)村科金通過使用超過2PB的海量數(shù)據(jù)對(duì)大模型進(jìn)行專項(xiàng)調(diào)優(yōu),增廣基礎(chǔ)攻擊數(shù)據(jù)類型、激發(fā)模型“涌現(xiàn)”潛能,激活其域外識(shí)別能力,將識(shí)別數(shù)量級(jí)從1個(gè)9提升到3個(gè)9,大幅縮小漏洞風(fēng)險(xiǎn)敞口。大模型是跨時(shí)代的產(chǎn)物,是當(dāng)下解決金融機(jī)構(gòu)面臨的生物識(shí)別“零日漏洞”頻發(fā)危機(jī)的唯一可行路徑。
人臉安全事件層出不窮,國(guó)家多部門發(fā)出緊急警告。
從具體事件來看,據(jù)媒體披露,2024年一家跨國(guó)公司香港分部的職員受“換臉、換聲”技術(shù)欺騙,將2億港元分別轉(zhuǎn)賬15次、轉(zhuǎn)到5個(gè)本地銀行賬戶內(nèi);2023年包頭警方發(fā)布一起利用“換臉、換聲”技術(shù)欺詐案例,福州市某科技公司法人代表郭先生10分鐘內(nèi)被騙430萬元;2021年交通銀行受到來自IP地址為中國(guó)臺(tái)灣的犯罪分子攻擊,7次通過了交通銀行的人臉識(shí)別,6次通過活體檢測(cè)。
從國(guó)家監(jiān)管預(yù)警趨勢(shì)看,公安部分兩次于2020年、2022年向頭部互聯(lián)網(wǎng)服務(wù)機(jī)構(gòu)發(fā)出預(yù)警,披露9種人臉安全風(fēng)險(xiǎn);國(guó)家網(wǎng)信辦于2021年、2023年發(fā)出警示,并要求各互聯(lián)網(wǎng)機(jī)構(gòu)提升人臉識(shí)別技術(shù)應(yīng)用安全管理水平;國(guó)家金融管理中心,原中國(guó)銀保監(jiān)會(huì),于2021年、2023年直接向金融機(jī)構(gòu)下達(dá)指示,警惕利用AI新型技術(shù)實(shí)施詐騙、加強(qiáng)人臉識(shí)別技術(shù)應(yīng)用安全管理。這只是冰山上的數(shù)字,如果我們下沉到海平面之下,深入到金融機(jī)構(gòu)中,一家普通規(guī)模的金融機(jī)構(gòu)一年就要面臨超過1萬次攻擊;據(jù)聯(lián)盟統(tǒng)計(jì),全行業(yè)每年黑產(chǎn)欺詐涉及資金超1100億元。
究其原因,金融是國(guó)民經(jīng)濟(jì)的血脈,也是被不法分子攻擊的首要目標(biāo),可謂“野火燒不盡、春風(fēng)吹又生”。
提升金融業(yè)技術(shù)防御水平已迫在眉睫,新攻擊方法層出不窮,而金融機(jī)構(gòu)科技建設(shè)嚴(yán)重滯后,形同“裸奔”。
從機(jī)構(gòu)建設(shè)速度看,最快更新時(shí)間需要90天。據(jù)公開招標(biāo)信息披露,過去2年間,以國(guó)股行為首的頭部金融機(jī)構(gòu)已經(jīng)完成了一輪技術(shù)升級(jí),但相較于上一次技術(shù)升級(jí),間隔在3-5年;而在金融機(jī)構(gòu)采買的服務(wù)中,最短的升級(jí)速度也在90天以上,更常見的是1年1次的更新服務(wù)。
從攻擊方法的創(chuàng)新速度看,平均1.5天就有一種新攻擊方法出現(xiàn)。國(guó)際頂會(huì)CVPR2023僅一年便發(fā)布超過130篇關(guān)于圖像、人臉、聲音的生成方法,2024年sora發(fā)布僅一周后,阿里便發(fā)布了EMO算法,精細(xì)的還原了一個(gè)人的聲音、面部表情、口型、舌動(dòng);在應(yīng)用市場(chǎng)中,新增注入攻擊、換臉換聲軟件超過百余種,包括uface、趣換臉、insightface、Xpression等。
從作案工具易得性看,在地下交易市場(chǎng)中,攻擊道具交易已頗具規(guī)模,通常200元就能買到一次定點(diǎn)攻擊服務(wù)。金融行業(yè)的技術(shù)更新速度已經(jīng)嚴(yán)重制約了金融安全防御體系的建設(shè),零日漏洞(0-day)已經(jīng)從操作系統(tǒng)、計(jì)算機(jī)網(wǎng)絡(luò)下沉到了人工智能中,并深度影響著金融行業(yè)的健康發(fā)展,在新型攻勢(shì)的88.5天(90-1.5)中,機(jī)構(gòu)防御手段如同“裸奔”。
金融機(jī)構(gòu)防御體系建設(shè)慢的核心問題是“攻擊數(shù)據(jù)的有效性不足”。
這一方面是“吃不飽”導(dǎo)致的。攻擊數(shù)據(jù)少是一個(gè)相對(duì)概念,是一種由認(rèn)知偏差導(dǎo)致的數(shù)據(jù)的動(dòng)態(tài)不足,而不是絕對(duì)數(shù)量的不足,“人不能知道自己不知道的東西(unconscious incompetence)”。防御方案需要針對(duì)攻擊特點(diǎn)來設(shè)計(jì),天然滯后于攻擊的發(fā)生,這就帶來了認(rèn)知的客觀時(shí)間差。金融機(jī)構(gòu)的技術(shù)更新就是典型樣例,防御升級(jí)通常圍繞事件展開,如通過巡檢、或者行業(yè)聯(lián)盟共享的素材,而這些事件所提供的負(fù)樣本數(shù)目非常少。這些數(shù)據(jù)是不足以支撐一次訓(xùn)練,也即無法提升專家模型的能力。因此,通常技術(shù)部門需要先對(duì)這些負(fù)樣本(corner case)進(jìn)行解析,分析其生成原理和特征,然后人工進(jìn)行數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注、數(shù)據(jù)處理,最后用于訓(xùn)練,驗(yàn)證,最終完成技術(shù)升級(jí),超過90%的時(shí)間成本被花在了數(shù)據(jù)的構(gòu)建上,這也直接造成了機(jī)構(gòu)“裸奔現(xiàn)象”。
更重要的,另一方面是“吸收少”導(dǎo)致的。從攻擊數(shù)據(jù)到模型性能存在一個(gè)“能量轉(zhuǎn)化率”,這是一種系統(tǒng)性能力不足,也可以比作“營(yíng)養(yǎng)失調(diào)”、“腸胃差”。專家模型的認(rèn)知方式與人有較大差異,從標(biāo)注方式來看,專家模型訓(xùn)練數(shù)據(jù)真值(ground truth)是在采集前確定的,全部都有真值;人的訓(xùn)練數(shù)據(jù)是先對(duì)海量無標(biāo)數(shù)據(jù)的歸納、然后通過極少數(shù)量的有標(biāo)數(shù)據(jù)啟發(fā)得來的。專家模型本身并不是擬合的“人的認(rèn)知”,而是擬合的“特定攻擊手法的作案特征”,這也就解釋了為什么專家模型在針對(duì)同類攻擊行為的檢出上遠(yuǎn)高于人類,但對(duì)新攻擊的識(shí)別遠(yuǎn)遜于人類。
業(yè)務(wù)目標(biāo)是更快的補(bǔ)全漏洞,如果我們“頭疼醫(yī)頭、腳痛醫(yī)腳”只能陷入被動(dòng),解決吸收問題更重要。因此,我們迫切需要一種劃時(shí)代的應(yīng)用,一個(gè)胃口好、消化好的“鐵胃”來解決“零日漏洞”頻發(fā)危機(jī)。
一種”零日修復(fù)“方案、下一代防偽技術(shù),“金融領(lǐng)域的多模態(tài)防偽專有大模型”提供了一個(gè)新思路。
更強(qiáng)的編碼能力。谷歌在2018年提出了預(yù)訓(xùn)練模型,transformer技術(shù)嶄露頭角,基于transformer的BERT技術(shù)向我們證明了一切專家問題本質(zhì)是編碼問題,編碼能力的提升直接影響著專家判斷的準(zhǔn)確性。
更強(qiáng)的數(shù)據(jù)承載能力。2020年,OpenAI發(fā)表了關(guān)于scaling laws的關(guān)鍵論文,并在2022年GPT3.0上證明了超大規(guī)模的數(shù)據(jù)可以產(chǎn)生“知識(shí)涌現(xiàn)”現(xiàn)象,如今大模型規(guī)模已經(jīng)突破100B。
“好胃口+好消化=超強(qiáng)的域外推理能力”,大模型增強(qiáng)了對(duì)沒見過問題的處理能力。2023年,google發(fā)布多模態(tài)大模型Gemini,中關(guān)村科金對(duì)其進(jìn)行了防偽能力的專項(xiàng)測(cè)試,發(fā)現(xiàn)其不僅可以指出圖片的真假,甚至可以講出圖片假在什么地方,如紋理、毛發(fā)、環(huán)境、一致性等。盡管此時(shí)的通用大模型能力還不如專有大模型,但我們快速將大模型引入了防偽體系建設(shè)中,我們?cè)诔^4億規(guī)模的真人圖像、音頻樣本數(shù)據(jù)集上,通過“基于超過100種基礎(chǔ)偽造攻擊算法實(shí)現(xiàn)的萬倍數(shù)據(jù)增廣方案”最終將數(shù)據(jù)集擴(kuò)大到2PB。經(jīng)過測(cè)試,“金融領(lǐng)域的多模態(tài)防偽專有大模型”相較于“傳統(tǒng)專家模型”能力有顯著提升,以針對(duì)“對(duì)抗樣本攻擊”的防御為例,我們將防御指標(biāo)從1個(gè)9(90%),提升到了3個(gè)9(99.9%),大幅縮小漏洞風(fēng)險(xiǎn)敞口。文章來源:http://www.zghlxwxcb.cn/news/detail-856213.html
大模型是跨時(shí)代的產(chǎn)物,是當(dāng)下解決金融機(jī)構(gòu)面臨的生物識(shí)別“零日漏洞”頻發(fā)危機(jī)的唯一可行路徑。?文章來源地址http://www.zghlxwxcb.cn/news/detail-856213.html
到了這里,關(guān)于大模型時(shí)代下的“金融業(yè)生物識(shí)別安全挑戰(zhàn)”機(jī)遇的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!