前面針對數(shù)據(jù)分類分級做了較為系統(tǒng)性的調(diào)研分析報告,具體內(nèi)容可點擊,不再做贅述:
數(shù)據(jù)安全-數(shù)據(jù)分類分級調(diào)研分析報告
前言
通過前期市場調(diào)研與分析,發(fā)現(xiàn)已經(jīng)有多家企業(yè)在數(shù)據(jù)分類分級方向發(fā)力,國家政策也是21年才正式發(fā)布,市場還處于早期階段,多家產(chǎn)品也是近一兩年才出爐,地方政府相關(guān)單位也在逐步出臺相關(guān)政策和做出動作。數(shù)據(jù)分類分級產(chǎn)品,還是大有市場的,那么我們來看一下針對分類分級方案的具體設計。
總體架構(gòu)思想
總體架構(gòu)思想如上圖
- 適配各種數(shù)據(jù)源,可以優(yōu)先考慮通用的csv、execel文件以及關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)源。
- 數(shù)據(jù)分類分級產(chǎn)品要做成通用的產(chǎn)品,需要根據(jù)行業(yè)標準及相關(guān)法規(guī),提供內(nèi)置規(guī)范化分類分級模版并達到自動分類分級的效果,同時需要支持基于已有的內(nèi)置行業(yè)分類分級規(guī)則自定義完善該規(guī)則。
- 實現(xiàn)自動分類分級,主要技術(shù)涉及正則表達式、關(guān)鍵字典、機器學習、NLP、文檔指紋等。
- 提供訪問API給外部服務或第三方產(chǎn)品使用。
核心流程
核心流程圖可看出,主要分為:數(shù)據(jù)源模塊、分類分級模版模塊和任務執(zhí)行模塊
細節(jié)流程
發(fā)起數(shù)據(jù)分類分級任務流程:
- 選擇數(shù)據(jù)源
- 選擇數(shù)據(jù)分類分級模版
a. 選擇內(nèi)置分類分級模版
b. 選擇自定義分類分級模版
ⅰ. 存在自定義分類分級模版則使用
ⅱ. 不存在自定義分類分級模版則需要去創(chuàng)建- 創(chuàng)建分類模版
- 定義分級規(guī)則
- 分類分級映射數(shù)據(jù)識別規(guī)則
a. 若數(shù)據(jù)識別規(guī)則存在則使用
b. 不存在則需要創(chuàng)建
- 用戶確定創(chuàng)建分類分級任務
- 數(shù)據(jù)分類分級任務執(zhí)行
a. 根據(jù)選定的數(shù)據(jù)源找到對應數(shù)據(jù)
b. 根據(jù)識別規(guī)則確定表數(shù)據(jù)的分類,根據(jù)識別規(guī)則確定表字段數(shù)據(jù)的分級
c. 產(chǎn)生一條分類分級后的數(shù)據(jù)進行落庫
d. 循環(huán)全部數(shù)據(jù)分析 - 數(shù)據(jù)分類分級任務執(zhí)行完畢
模塊
數(shù)據(jù)源管理模塊
- 支持文件導入數(shù)據(jù)庫
- 支持數(shù)據(jù)庫連接
任務管理管理
- 創(chuàng)建分類分級任務
- 選擇具體數(shù)據(jù)源下的單表或多張表,但不能跨庫
- 選擇分類分級模版
- 對數(shù)據(jù)表進行分類
- 分類下有數(shù)據(jù)最低密級,需要用戶確認或修改最低密級(方便表數(shù)據(jù)分級)
- 無法識別分類,強制用戶手動選擇
- 對表數(shù)據(jù)進行分級
- 無法識別分級,采用默認級別
- 查看分類分級任務進度與結(jié)果
- 未執(zhí)行任務可刪除
- 執(zhí)行中任務不可刪除
- 執(zhí)行完畢任務可刪除(但同時會刪除分類分級結(jié)果及相關(guān)數(shù)據(jù))
分類分級模版模塊
內(nèi)置分類分級模版
- 分類模版不可修改
- 模版名稱唯一
- 每個分類名稱必須唯一
- 每個分類有默認數(shù)據(jù)分級(默認為1級,用來限制分類下的數(shù)據(jù)分級)
- 內(nèi)置分類分級映射數(shù)據(jù)識別規(guī)則
內(nèi)置分級規(guī)則
- 密級(默認為4級,用戶可增刪密級,最多支持10級)
- 密級名稱(名稱唯一,可修改)
- 密級描述(可修改可為空)
用戶自定義分類分級模版
- 分類模版一旦被使用便不可修改
- 模版名稱唯一
- 每個分類名稱必須唯一
- 每個分類有默認數(shù)據(jù)分級(默認為1級,用來限制分類下的數(shù)據(jù)分級)
- 自定義分類分級映射數(shù)據(jù)識別規(guī)則
用戶自定義分級規(guī)則
- 密級(默認為4級,用戶可增刪密級,最多支持10級)
- 密級名稱(名稱唯一,可修改)
- 密級描述(可修改可為空)
數(shù)據(jù)識別規(guī)則模塊
- 內(nèi)置數(shù)據(jù)識別規(guī)則(主要技術(shù)涉及正則表達式、關(guān)鍵字典、機器學習、NLP、文檔指紋等)
- 識別規(guī)則一旦被使用便不可刪減,可增加
- 常用的如手機號、住址、身份證號,座機、姓名等各種證件號
- 用戶自定義識別規(guī)則(支持正則、關(guān)鍵字典、模糊匹配)
- 識別規(guī)則一旦被使用便不可刪減,可增加
- 樣本庫(為數(shù)據(jù)識別規(guī)則添加樣本庫)
- 字段名和字段值
- 匹配度
分類識別規(guī)則
- 匹配規(guī)則 識別表名和字段名
分級識別規(guī)則
- 匹配規(guī)則 識別字段名和字段值
常用的數(shù)據(jù)識別內(nèi)容
表設計
這里就有點涉密了,就不放表設計了,如果有同學需要了解可私聊一對一提供參考。
外部訪問api
入?yún)ⅲ嘿~戶信息、請求的庫表
出參:分類分級表list對象文章來源:http://www.zghlxwxcb.cn/news/detail-792096.html
[{
"字段名": "name",
"數(shù)據(jù)密級": 2,
"數(shù)據(jù)識別規(guī)則":""
}, {
"字段名": "tel",
"數(shù)據(jù)密級": 3,
"數(shù)據(jù)識別規(guī)則":""
}]
數(shù)據(jù)分類分級方案設計就到此一段落了,如果小伙伴有任何問題歡迎探討,接下來就是項目技術(shù)選型了,期待下一篇博客吧!文章來源地址http://www.zghlxwxcb.cn/news/detail-792096.html
到了這里,關(guān)于數(shù)據(jù)安全-數(shù)據(jù)分類分級方案設計的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!