国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Jeddak-DPSQL 首次開源!基于差分隱私的 SQL 代理保護能力

這篇具有很好參考價值的文章主要介紹了Jeddak-DPSQL 首次開源!基于差分隱私的 SQL 代理保護能力。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

動手點關注

Jeddak-DPSQL 首次開源!基于差分隱私的 SQL 代理保護能力,sql,開源,數據庫,大數據,java

干貨不迷路

?

?1. 背景

火山引擎對于用戶敏感數據尤為重視,在火山引擎提供的數據分析產品中,廣泛采用差分隱私技術對用戶敏感信息進行保護。此類數據產品通常構建于 ClickHouse 等數據引擎之上,以 SQL 查詢方式來執(zhí)行計算邏輯,且查詢邏輯往往較為復雜,因此對差分隱私的應用提出了以下要求:

  • 零改造、零感知:最大程度避免影響業(yè)務現(xiàn)有查詢方式,最好做到業(yè)務零感知、零改造;

  • 良好、靈活的適配性:能夠適配不同數據引擎的查詢語法,以及能夠處理包含多層嵌套、多重計算、多表連接等情形的復雜 SQL 語句;

  • 安全性與可用性平衡:能夠根據業(yè)務數據質量要求,計算合理的隱私預算,在安全性和數據可用性之間保持平衡;

針對以上需求,火山引擎安全研究團隊開發(fā)了 Jeddak-DPSQL:一種基于差分隱私的 SQL 代理工具。Jeddak-DPSQL 能夠兼容多種數據引擎和SQL方言,內嵌多種差分噪聲擾動算法,具備隱私預算管理能力,并且能夠與底層數據引擎結合,在數據分析師無感的情況下,對 SQL 語句進行自動化分析和結果加噪處理。作為數據安全和隱私合規(guī)治理的標準能力之一,Jeddak-DPSQL 已經在抖音集團相關業(yè)務中得到了普遍應用與驗證。

在實際解決公司內部面臨的問題風險后,我們決定對 Jeddak-DPSQL 進行開源,希望能夠為同樣面臨該類問題的企業(yè)和個人提供一定參考和幫助,同時也希望能夠有更多的外部開發(fā)者能夠一起對該開源項目進行共建,完善 Jeddak-DPSQL 產品功能,共同構建更完備的應用生態(tài)。

2. 全面了解 Jeddak-DPSQL

2.1 Jeddak-DPSQL 介紹

Jeddak-DPSQL 采用中心化差分隱私 (Centralized Differential Privacy,簡稱 CDP,適用于數據管理者可信的場景) 模式,以中間件的形式接收 SQL 統(tǒng)計查詢請求,返回滿足差分隱私的查詢結果。一個典型的查詢請求處理流程如下:

  • 首先,核心服務接受客戶提交的 SQL 查詢語句,對該語句進行解析和重寫,以便于計算隱私噪聲(如將 AVG 計算改為 SUM/COUNT);

  • 然后,核心服務調用元數據管理服務,計算重寫后的 SQL 查詢所對應的數據表敏感度,同時在數據庫上執(zhí)行重寫后的 SQL 查詢,得到原始的查詢結果;

  • 最后,核心服務調用隱私預算管理服務得到為該查詢分配的隱私預算,并結合敏感度在原始的查詢結果中添加噪聲并返回。

Jeddak-DPSQL 首次開源!基于差分隱私的 SQL 代理保護能力,sql,開源,數據庫,大數據,java

2.2 Jeddak-DPSQL 解決的問題

案例背景

假設有一個數據庫 business,存儲用戶消費數據,使用 clickhouse 引擎,其中一個表 user 存儲用戶信息,表中存在以下列:uid,name,age,sex,city,代表用戶id、姓名、年齡、性別、城市。

查詢需求

我們要查詢用戶數量和平均年齡的城市分布,使用 SQL 語句 1:

SELECT??COUNT(*)?AS?cnt,AVG(age)?as?agev,?city
FROM?business.user
group?by?city

風險

如果不應用隱私保護技術,可能面臨差分攻擊的風險,比如攻擊者通過某渠道得知張三的 uid 為 803719,構造下面的 SQL 語句 2:

SELECT??COUNT(*)?AS?cnt,AVG(age)?as?agev,?city
FROM?business.user
WHERE?uid?!=?803719
group?by?city

通過執(zhí)行上面的 SQL 語句1和 SQL 語句2,可分別得到兩個查詢結果:

Jeddak-DPSQL 首次開源!基于差分隱私的 SQL 代理保護能力,sql,開源,數據庫,大數據,java

那么就可以通過比較兩次查詢結果得知張三所在的城市是北京,年齡大約 61 歲(120008x49.3276 = 5919706.62,120007x49.3275 = 5919645.29,5919706.62 - 5919645.29 約等于 61)

以上是一個簡單的例子,現(xiàn)實場景中,攻擊者可能通過背景知識構造更多樣、更復雜的查詢語句達到竊取隱私的目的。

因此,在上述 SQL 查詢場景下,可以通過接入 Jeddak-DPSQL 對 SQL 進行分析和重寫,最終執(zhí)行重寫后的 SQL 能夠保證返回給使用者的數據滿足差分隱私要求,進而達到對個人隱私保護的效果。

2.3 Jeddak-DPSQL 在火山引擎的應用驗證

  1. Jeddak-DPSQL已接入火山引擎的增長分析(finder)、A/B 測試等產品,間接服務300+外部客戶,日均處理查詢請求 200+。Jeddak-DPSQL服務不僅幫助業(yè)務滿足了隱私保護和業(yè)務合規(guī)的需求,同時也成為創(chuàng)新型隱私計算技術應用的典范案例。

  2. 開放隱私計算 OpenMPC 對外公布了“隱私計算 2021 年度優(yōu)秀應用案例 TOP 10”。火山引擎 云安全憑借“融合 差分隱私 的火山引擎 DPSQL 服務”案例,成功入選 TOP 10。

3. 如何使用 Jeddak-DPSQL

git 開源項目地址: https://github.com/bytedance/Jeddak-DPSQL

3.1 下載

git?clone?https://github.com/bytedance/Jeddak-DPSQL

3.2 快速部署

完成 Jeddak-DPSQL 下載后,按照 README 中的部署引導部分完成服務部署,整個部署過程包括以下步驟:

  • 服務依賴包安裝:進入項目根目錄,使用 pip install -r requirements.txt 安裝服務所需完整 pip 包

  • MetaData 存儲準備:在使用DPSQL 時,需要維護源數據表的 MetaData 信息,為后續(xù)加噪計算敏感度作準備。Jeddak-DPSQL 使用 Mysql 對相應元數據信息進行存儲,因此需要用戶提前在自己的Mysql數據庫中創(chuàng)建相應的表

  • 隱私預算消耗存儲準備:使用 Jeddak-DPSQL 系統(tǒng)過程,可以記錄對表級別的數據查詢時的隱私預算消耗。主要通過Mysql進行記錄,因此需要用戶提前在自己的Mysql數據庫中創(chuàng)建相應的表

  • 數據庫連接配置:Jeddak-DPSQL 中使用數據庫主要有 Mysql 和 Redis,因此需要對這兩個數據庫連接地址進行配置

  • 服務啟動:完成上述配置后可以在項目根目錄運行 bootstrap.sh 腳本啟動服務

3.3 正式使用

完成 Jeddak-DPSQL 部署后,按照 README 中的快速開始部分可以進行功能體驗,整個過程如下:

  • 選擇要測試的數據源(Hive 或 ClickHouse),導入要進行查詢測試的原始數據集

  • 初始化metadata和隱私預算

? ? 1.?生成 metadata

???2. 啟動dpsql服務后, 調用接口 /api/v1/metadata/generate,生成metadata,可參考:

def?meta_generate():
??args?=?{
??????"db_config":?{
??????????"host":?<hive_host>,
??????????"database":?<hive_dbname>,
??????????"username":?<hive_username>,
??????????"password":?<hive_password>
??????},
??????"table_name":?"us_accidents_dec21_updated",
??????"db_type":?db_type
??}
??route_path?=?"/api/v1/metadata/generate"#?local?service,??host:127.0.0.1,?port:5000url?=?"http://%s:%s/%s"?%?(host,?port,?route_path)
??headers?=?{"content-type":?"application/json"}
??r?=?requests.post(url,?json=args,?headers=headers)

if?__name__?==?'__main__':
???meta_generate()

3. 確認metadata 生成完成

4. 調用 /api/v1/metadata/get 接口,確認 metadata 生成完成

def?meta_get():
????args?=?{
????????"prefix":?<hive_host>,
????????"db_name":?<hive_dbname>,
????????"table_name":?"us_accidents_dec21_updated"
????}
????route_path?=?"/api/v1/metadata/get"#?local?service,??host:127.0.0.1,?port:5000url?=?"http://%s:%s/%s"?%?(host,?port,?route_path)
????headers?=?{"content-type":?"application/json"}
????r?=??requests.get(url,?json=args,?headers=headers)
????print(r.text)
  • ?調用隱私保護查詢接口,獲得經過差分隱私保護的查詢結果

def?query_sql_noise(sql,?data_source):
??????key?=?{
??????????"sql":?sql,
??????????"dbconfig":?{
??????????????"reader":?data_source,
??????????????"host":?<hive_host>,
??????????????"database":?<hive_dbname>,
??????????????"port":?<hive_port>
??????????},
??????????"queryconfig":?{
?????????????"traceid":?"traceid",
??????????}
??????}
??????route_path?=?"/api/v1/query"url?=?"http://%s:%s/%s"?%?(host,?port,?route_path)
??????headers?=?{"content-type":?"application/json"}
??????r?=?requests.post(url,?json=key,?headers=headers)
??????return?res
if?__name__?==?"__main__":
??????sql?=?"select?count(severityc)?from?menu_page?group?by?severity"
??????section?=?"hivereader"
??????res?=?query_sql_noise(sql,?section)
??????print(res)

更多接口使用方式可以參考項目 README 中的 API Documentation 部分

4. 后續(xù)計劃

由于當前是 Jeddak-DPSQL 的首個開源版本,因此還存在很多不完善的地方,希望大家能夠多多諒解。Jeddak-DPSQL 計劃進行長期維護,歡迎大家使用,也希望有更多的外部開發(fā)者能夠一起對該開源項目進行共建,完善產品功能,構建更完備的應用生態(tài)。

5. 關于安全研究

火山引擎安全研究部門的愿景是創(chuàng)新突破前沿安全理論技術,賦能數字經濟。部門當前以數據安全中心私有化單品-可信隱私計算產品 Jeddak 為載體,從可信計算、聯(lián)邦學習、多方安全計算、差分隱私、密文計算、共識計算等方向著手,開展隱私計算技術的前沿研究和應用探索。基于這些領域最新前沿理論技術,創(chuàng)新研發(fā)、突破瓶頸,實現(xiàn)數據全生命周期安全與隱私保護,以及可信隱私計算等應用服務落地:賦能業(yè)務、保駕護航;更進一步打破數據孤島,推動數據多源融合與流通交易,發(fā)揮數據價值。文章來源地址http://www.zghlxwxcb.cn/news/detail-567683.html

到了這里,關于Jeddak-DPSQL 首次開源!基于差分隱私的 SQL 代理保護能力的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!

本文來自互聯(lián)網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 【多方安全計算】差分隱私(Differential Privacy)解讀

    【多方安全計算】差分隱私(Differential Privacy)解讀

    差分隱私(Differential privacy)最早于2008年由Dwork 提出,通過嚴格的數學證明,使用隨機應答(Randomized Response)方法確保數據集在輸出信息時受單條記錄的影響始終低于某個閾值,從而使第三方無法根據輸出的變化判斷單條記錄的更改或增刪,被認為是目前基于擾動的隱私保護

    2024年02月06日
    瀏覽(16)
  • 《橫向聯(lián)邦學習中 PCA差分隱私數據發(fā)布算法》論文算法原理筆記

    《橫向聯(lián)邦學習中 PCA差分隱私數據發(fā)布算法》論文算法原理筆記

    論文地址:https://www.arocmag.com/article/01-2022-01-041.html 論文摘要 ?????為了讓不同組織在保護本地敏感數據和降維后發(fā)布數據隱私的前提下,聯(lián)合使用 PCA進行降維和數據發(fā)布,提出 橫向聯(lián)邦 PCA差分隱私數據發(fā)布算法 。引入隨機種子聯(lián)合協(xié)商方案,在各站點之間以較少通信代

    2024年02月08日
    瀏覽(21)
  • 首次公開開源PolarDB的總體結構設計和企業(yè)級特性

    首次公開開源PolarDB的總體結構設計和企業(yè)級特性

    3月2日,開源PolarDB企業(yè)級架構將迎來重磅發(fā)布!將首次公開開源PolarDB的總體結構設計和企業(yè)級特性,對PolarDB for PostgreSQL的存儲計算分離架構、HTAP架構、三節(jié)點高可用架構進行全面介紹。點此圍觀:開源PolarDB企業(yè)級架構重磅發(fā)布

    2024年02月16日
    瀏覽(22)
  • 阿里巴巴官方上線!號稱國內Java八股文天花板,首次開源!

    阿里巴巴官方上線!號稱國內Java八股文天花板,首次開源!

    繼續(xù)找工作,現(xiàn)在的很多程序員還在談技術,談這個就沒勁了其實,因為現(xiàn)在的失業(yè)是結構性失業(yè)。 比如說你到40歲了,你還有大廠履歷,那你畢業(yè)了以后,找工作的難度肯定會加大。一方面是新工作的待遇和薪資往往不及預期,另一方面就是競爭激烈。 而我認識的兩個獵頭

    2024年02月07日
    瀏覽(28)
  • 螞蟻集團開源可信隱私計算框架「隱語」:開放、通用

    螞蟻集團開源可信隱私計算框架「隱語」:開放、通用

    7 月 4 日,螞蟻集團宣布面向全球開發(fā)者正式開源可信隱私計算框架 “隱語”。 隱語是螞蟻集團歷時 6 年自主研發(fā),以安全、開放為核心設計理念打造的可信隱私計算技術框架,涵蓋了當前幾乎所有主流隱私計算技術。 據介紹,隱語內置 MPC、TEE、同態(tài)等多種密態(tài)計算虛擬設

    2024年02月15日
    瀏覽(34)
  • 探秘開源隱語:架構深度剖析與隱私計算技術之旅

    探秘開源隱語:架構深度剖析與隱私計算技術之旅

    隱語(SecretFlow)作為螞蟻集團開源的可信隱私計算框架,其架構設計具有多層次的特點,雖然具體分層名稱可能會根據實際描述略有差異,但我們可以依據已有的技術和信息對其進行結構化的拆解: 硬件層(或稱TEE層/TCS層) : 這一層主要涉及到硬件層面的安全保障,尤其

    2024年04月17日
    瀏覽(24)
  • PrimiHub 聯(lián)邦學習大模型開源,打破數據限制,保護數據隱私安全

    ChatGPT 掀起的大模型熱潮,讓各界人士對人工智能大模型的關注度極速提高。 什么是大模型?大模型是指具有大量參數的深度神經網絡模型,它們通??梢蕴峁└鼜姶蟮谋磉_能力和泛化能力,從而提升各種智能服務的性能和質量。大模型在訓練的過程中,會面臨一個重大挑戰(zhàn)

    2024年02月16日
    瀏覽(17)
  • Ubuntu 23.10 將首次推出基于 Flutter 的新 Ubuntu 商店

    Ubuntu 23.10 將首次推出基于 Flutter 的新 Ubuntu 商店

    導讀 Ubuntu 正在升級其軟件商店以提供順滑的體驗! 隨著不斷發(fā)展,Canonical 似乎全力以赴,將基于 Flutter 的元素整合到 Ubuntu 中。 在前段時間 Ubuntu 23.04 發(fā)布后,我們見到了基于 Flutter 的安裝程序 ,現(xiàn)在,Ubuntu 的另一個重要工具也接受了 Flutter 改造:一款新的軟件商店應用

    2024年02月11日
    瀏覽(18)
  • 正式開源 無恒實驗室推出 appshark 自動化漏洞及隱私合規(guī)檢測工具

    正式開源 無恒實驗室推出 appshark 自動化漏洞及隱私合規(guī)檢測工具

    隨著移動互聯(lián)網的高速發(fā)展,人們的生產生活也逐漸從 PC 電腦端轉移到手機等移動端,各類移動 App 也如雨后春筍般產生。受限于代碼的開發(fā)質量等原因, App 中或多或少的會存在安全漏洞或因開發(fā)設計不謹慎引入的違規(guī)收集個人信息等合規(guī)風險,帶漏洞運行的 App 將嚴重威脅

    2024年02月14日
    瀏覽(26)
  • Bsdiff,Bspatch 的差分增量升級(基于Win和Linux)

    Bsdiff,Bspatch 的差分增量升級(基于Win和Linux)

    目錄 ? ? ? ? ?背景 內容 準備工作 在windows平臺上 在linux平臺上 正式工作 生成差分文件思路 作用差分文件思路 在保持相同目錄結構進行差分增量升級 服務端(生成差分文件) 客戶端(作用差分文件) 12月6日更新(修復bug) 執(zhí)行分析 注意事項和關注的地方: 背景 像常見的Androi

    2024年02月07日
    瀏覽(19)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包