目錄
引言
1 區(qū)塊鏈技術(shù)背景
2 區(qū)塊鏈數(shù)據(jù)可用性
2.1 區(qū)塊鏈的存儲(chǔ)模型
2.2 區(qū)塊鏈存儲(chǔ)的可擴(kuò)展性
2.2.1 鏈下擴(kuò)展方案
2.2.2 鏈上擴(kuò)展方案
2.3 討論
3 區(qū)塊鏈數(shù)據(jù)可信性
3.1 基于ADS的數(shù)據(jù)可信保障技術(shù)
3.1.1 基于哈希的ADS
3.1.2 基于密碼學(xué)累加器的ADS
3.1.3 小結(jié)
3.2 基于可信硬件的數(shù)據(jù)可信保障技術(shù)
3.3 討論
4 區(qū)塊鏈數(shù)據(jù)可流通性
4.1 主流的跨鏈機(jī)制
4.1.1 公證人機(jī)制
4.1.2 側(cè)鏈/中繼
4.1.3 哈希鎖定
4.1.4 混合機(jī)制
4.2 跨鏈數(shù)據(jù)流通的難題
5 區(qū)塊鏈數(shù)據(jù)可追溯性
6 結(jié)論與展望
摘要
【背景】?數(shù)據(jù)已然成為經(jīng)濟(jì)發(fā)展的基礎(chǔ)性戰(zhàn)略資源。要充分發(fā)揮數(shù)據(jù)要素作用,需要建立數(shù)據(jù)可信流通體系。【目的】?區(qū)塊鏈作為新型可信數(shù)據(jù)管理平臺(tái),能夠?qū)崿F(xiàn)數(shù)據(jù)可信流通的基本需求。因此,本文將探討基于區(qū)塊鏈的數(shù)據(jù)要素可信流通技術(shù)。【方法】?從建立數(shù)據(jù)可信流通體系的角度出發(fā),本文首先分析了構(gòu)建數(shù)據(jù)要素可信流通體系的基本要求,然后分析了基于區(qū)塊鏈實(shí)現(xiàn)數(shù)據(jù)可信流通的技術(shù)要點(diǎn),總結(jié)了目前區(qū)塊鏈研究領(lǐng)域中可用于實(shí)現(xiàn)上述目標(biāo)的研究工作,并對(duì)未來(lái)的研究方向提出展望。【結(jié)果】?著眼于增強(qiáng)數(shù)據(jù)可用、可信、可流通、可追溯4個(gè)方面,本文對(duì)現(xiàn)有區(qū)塊鏈系統(tǒng)研究中的存儲(chǔ)模型、系統(tǒng)性能擴(kuò)展方式、數(shù)據(jù)驗(yàn)證、跨鏈技術(shù)、溯源技術(shù)等方面進(jìn)行總結(jié)分析。【結(jié)論】?現(xiàn)有研究成果能夠基本實(shí)現(xiàn)數(shù)據(jù)要素可信流通體系,但在數(shù)據(jù)隱私、數(shù)據(jù)使用和數(shù)據(jù)表示方面仍存在諸多未解決的問(wèn)題。
關(guān)鍵詞:?區(qū)塊鏈;?數(shù)據(jù)要素流通;?數(shù)據(jù)管理;?數(shù)據(jù)存儲(chǔ);?分片;?跨鏈;?溯源
引言
數(shù)據(jù)具有推動(dòng)經(jīng)濟(jì)發(fā)展和產(chǎn)業(yè)變革的重大作用。從2017年到2021年,我國(guó)數(shù)據(jù)年產(chǎn)量從2.3ZB增長(zhǎng)至6.6ZB,全球占比9.9%,位居世界第二[1],然而,接近70%的數(shù)據(jù)價(jià)值未被激活。2019年10月,黨的十九屆四中全會(huì)將數(shù)據(jù)納入生產(chǎn)要素范疇,其原因在于它對(duì)推動(dòng)生產(chǎn)力發(fā)展顯現(xiàn)出的價(jià)值[2],是對(duì)數(shù)據(jù)價(jià)值定位不斷深化的體現(xiàn),強(qiáng)調(diào)了數(shù)據(jù)的重要性。然而,數(shù)據(jù)顯著推動(dòng)生產(chǎn)需要相應(yīng)的技術(shù)和產(chǎn)業(yè)基礎(chǔ)[2],并且與傳統(tǒng)生產(chǎn)要素不同,數(shù)據(jù)要素流通涉及個(gè)人隱私及安全[3],且具有可復(fù)制、可共享、無(wú)限增長(zhǎng)和供給的特點(diǎn)[2],對(duì)數(shù)據(jù)管理提出新的需求。國(guó)務(wù)院《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》中指出:構(gòu)建數(shù)據(jù)基礎(chǔ)制度,要建立數(shù)據(jù)可信流通體系,增強(qiáng)數(shù)據(jù)的可用、可信、可流通、可追溯水平[4]。
區(qū)塊鏈?zhǔn)且环N去中心化的新型數(shù)據(jù)管理平臺(tái)[5],在不可信網(wǎng)絡(luò)中進(jìn)行可信的數(shù)據(jù)存儲(chǔ)與事務(wù)處理。傳統(tǒng)區(qū)塊鏈系統(tǒng)可以在一定程度上滿足數(shù)據(jù)要素管理中的可用、可信、可流通、可追溯的要求:
(1)在數(shù)據(jù)可用性方面:區(qū)塊鏈系統(tǒng)是一種由多個(gè)節(jié)點(diǎn)運(yùn)行的冗余系統(tǒng),數(shù)據(jù)被分布式地存儲(chǔ)在眾多節(jié)點(diǎn)上。在傳統(tǒng)的區(qū)塊鏈系統(tǒng)中(例如:比特幣[6]、以太坊[7]、超級(jí)賬本[8]等),系統(tǒng)中的每個(gè)節(jié)點(diǎn)都存有完整的數(shù)據(jù)副本,即使某些節(jié)點(diǎn)出現(xiàn)系統(tǒng)故障或網(wǎng)絡(luò)故障,也不影響整個(gè)區(qū)塊鏈網(wǎng)絡(luò)的運(yùn)行,保證了數(shù)據(jù)的冗余備份和可靠性。
(2)在數(shù)據(jù)可信性方面:區(qū)塊鏈系統(tǒng)是一種去中心化的分布式系統(tǒng),無(wú)中心控制機(jī)構(gòu),避免依賴于機(jī)構(gòu)或個(gè)人的信用背書。通過(guò)共識(shí)機(jī)制,區(qū)塊鏈網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)都有權(quán)查看和驗(yàn)證區(qū)塊鏈上的數(shù)據(jù),數(shù)據(jù)一旦經(jīng)過(guò)驗(yàn)證并被添加到區(qū)塊中,將無(wú)法被單一或小部分惡意節(jié)點(diǎn)篡改和刪除。這種去中心化、不可篡改、不可刪除的特性保證了系統(tǒng)中數(shù)據(jù)的高度可信。
(3)在數(shù)據(jù)可流通方面:區(qū)塊鏈系統(tǒng)可以建立在多個(gè)互不信任的參與方之間,使數(shù)據(jù)能夠在不同組織和系統(tǒng)之間自由流通,打通了傳統(tǒng)系統(tǒng)之間的信息壁壘。
(4)在數(shù)據(jù)可追溯方面:區(qū)塊鏈將所有的交易記錄按照時(shí)間順序?qū)懭氲饺ブ行幕~本中,任何參與方都可以根據(jù)賬本記錄追溯數(shù)據(jù)的流轉(zhuǎn)途徑。每筆交易都使用數(shù)字簽名進(jìn)行認(rèn)證,從而確保交易的參與者是真實(shí)的,交易的內(nèi)容是不可篡改、不可否認(rèn)的。
與分布式數(shù)據(jù)庫(kù)相比,區(qū)塊鏈在安全和可流通性方面具有優(yōu)勢(shì),但是區(qū)塊鏈系統(tǒng)在數(shù)據(jù)管理方面仍面臨諸多問(wèn)題,阻礙了區(qū)塊鏈系統(tǒng)成為建立數(shù)據(jù)可信流通體系的核心。幸運(yùn)的是,區(qū)塊鏈和分布式數(shù)據(jù)庫(kù)系統(tǒng)存在很多相似的技術(shù)概念和解決方案,使雙方在安全、效率和隱私方面的優(yōu)勢(shì)得以結(jié)合[9]。本文將從區(qū)塊鏈系統(tǒng)的角度,綜述用于建立數(shù)據(jù)要素可信流通體系的關(guān)鍵技術(shù)。本文將從數(shù)據(jù)的可用、可信、可流通、可追溯4個(gè)方面綜述現(xiàn)有區(qū)塊鏈系統(tǒng)在數(shù)據(jù)管理方面的研究工作:
(1)在數(shù)據(jù)可用性方面:傳統(tǒng)區(qū)塊鏈系統(tǒng)主要采用鍵-值型存儲(chǔ)模型。數(shù)據(jù)要素場(chǎng)景中包含金融監(jiān)管、數(shù)字存證、政務(wù)服務(wù)等多種應(yīng)用場(chǎng)景,需要更加具有表達(dá)能力的存儲(chǔ)和查詢引擎。此外,相較于傳統(tǒng)分布式數(shù)據(jù)庫(kù),區(qū)塊鏈系統(tǒng)存儲(chǔ)的可擴(kuò)展性較差,難以面向大數(shù)據(jù)應(yīng)用場(chǎng)景。因此,本文將針對(duì)現(xiàn)有區(qū)塊鏈與數(shù)據(jù)的融合研究中用于提升區(qū)塊鏈數(shù)據(jù)可用性的關(guān)鍵技術(shù)進(jìn)行討論。
(2)在數(shù)據(jù)可信性方面:現(xiàn)有區(qū)塊鏈系統(tǒng)在數(shù)據(jù)查詢驗(yàn)證方面主要采用兩種策略。一種是基于密碼學(xué)技術(shù)的方式,通過(guò)全網(wǎng)共識(shí)的可驗(yàn)證數(shù)據(jù)結(jié)構(gòu)(Authenticated Data Structures, ADS)提供查詢證明,另一種是基于可信硬件保證事務(wù)執(zhí)行可信。本文主要針對(duì)現(xiàn)有系統(tǒng)中ADS所支持的查詢種類和驗(yàn)證性能,以及基于可信硬件的事務(wù)執(zhí)行方式進(jìn)行討論。
(3)在數(shù)據(jù)可流通方面:在實(shí)際應(yīng)用中,不同的業(yè)務(wù)系統(tǒng)往往采用相對(duì)獨(dú)立的區(qū)塊鏈系統(tǒng),因此便產(chǎn)生了多鏈環(huán)境。然而,鏈與鏈之間的共識(shí)協(xié)議并不相通,數(shù)據(jù)賬本也不共享,這就產(chǎn)生了數(shù)據(jù)孤島問(wèn)題。區(qū)塊鏈跨鏈技術(shù)可以實(shí)現(xiàn)不同區(qū)塊鏈之間的安全、高效的數(shù)據(jù)傳遞,進(jìn)一步促進(jìn)了數(shù)據(jù)的交換和流通。區(qū)塊鏈跨鏈技術(shù)仍然是區(qū)塊鏈研究領(lǐng)域中的一個(gè)熱點(diǎn)話題,因此本文將對(duì)目前研究領(lǐng)域中多種區(qū)塊鏈跨鏈技術(shù)的機(jī)制和難點(diǎn)進(jìn)行討論。
(4)在數(shù)據(jù)可追溯方面:區(qū)塊鏈的去中心化及保留全部歷史數(shù)據(jù)的特點(diǎn)為數(shù)據(jù)可信追溯提供支持。然而,傳統(tǒng)區(qū)塊鏈系統(tǒng)上數(shù)據(jù)回溯的效率低,溯源結(jié)果及演變過(guò)程的真實(shí)性難以驗(yàn)證,溯源數(shù)據(jù)上鏈過(guò)程缺乏有效管理。本文將對(duì)目前區(qū)塊鏈研究工作中用于提升溯源查詢和驗(yàn)證效率及保證溯源信息的準(zhǔn)確性兩個(gè)方面的研究進(jìn)行總結(jié)與討論。
1 區(qū)塊鏈技術(shù)背景
區(qū)塊鏈的概念起源于中本聰提出的比特幣[6],其本質(zhì)上是一種把數(shù)據(jù)塊按照時(shí)間順序連接而成一種鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu)。以比特幣為例,區(qū)塊在網(wǎng)絡(luò)中所有節(jié)點(diǎn)以一致的方式順序連接并存儲(chǔ),新的區(qū)塊只能被添加到鏈表的末尾。在此過(guò)程中,區(qū)塊是區(qū)塊鏈的基本結(jié)構(gòu)單元,由包含元數(shù)據(jù)的區(qū)塊頭和包含事務(wù)數(shù)據(jù)的區(qū)塊體組成。具體來(lái)說(shuō),區(qū)塊頭由區(qū)塊高度、前一個(gè)區(qū)塊的哈希值、時(shí)間戳、nonce、礦工簽名和Merkle Tree根哈希等信息組成,而區(qū)塊體可以被視為由多個(gè)事務(wù)組成的事務(wù)記錄的集合。在比特幣中,區(qū)塊由哈希值連接,區(qū)塊中數(shù)據(jù)的任何變化都會(huì)導(dǎo)致該區(qū)塊的哈希值發(fā)生變化,進(jìn)而影響到該區(qū)塊之后所有區(qū)塊的有效性,因此在區(qū)塊鏈中篡改數(shù)據(jù)會(huì)隨著區(qū)塊鏈的增長(zhǎng)而愈加困難,保證了數(shù)據(jù)存儲(chǔ)的安全性。
隨著人們對(duì)區(qū)塊鏈的理解不斷加深,目前的區(qū)塊鏈創(chuàng)新融合了密碼學(xué)、P2P通信、共識(shí)機(jī)制、智能合約等多種計(jì)算機(jī)前沿技術(shù),已經(jīng)發(fā)展成為利用鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu)來(lái)驗(yàn)證與存儲(chǔ)數(shù)據(jù)、利用分布式共識(shí)算法來(lái)生成和更新數(shù)據(jù)、利用密碼學(xué)的方式保證數(shù)據(jù)傳輸和訪問(wèn)的安全、利用由自動(dòng)化腳本代碼組成的智能合約來(lái)編程和操作數(shù)據(jù)的一種全新的分布式基礎(chǔ)架構(gòu)與計(jì)算范式[10],具有分布存儲(chǔ)、不可篡改、可追溯、可編程等技術(shù)特征,構(gòu)建了獨(dú)特的信任機(jī)制,在數(shù)據(jù)可信流通領(lǐng)域得到了廣泛應(yīng)用。
而在功能架構(gòu)方面,區(qū)塊鏈系統(tǒng)可以自下而上分為以下5層,為區(qū)塊鏈的各種功能奠定基礎(chǔ):
(1)數(shù)據(jù)層。為了有效地組織區(qū)塊鏈中的各種數(shù)據(jù),數(shù)據(jù)層包含數(shù)據(jù)結(jié)構(gòu)、事務(wù)模型、索引數(shù)據(jù)、狀態(tài)數(shù)據(jù)和持久存儲(chǔ)方案等元素。
(2)網(wǎng)絡(luò)層。為了滿足去中心化網(wǎng)絡(luò)中各節(jié)點(diǎn)之間的通信,P2P協(xié)議在網(wǎng)絡(luò)層起著重要的作用。節(jié)點(diǎn)間傳輸?shù)膬?nèi)容主要由事務(wù)數(shù)據(jù)和區(qū)塊數(shù)據(jù)組成。
(3)共識(shí)層。與中心化管理的數(shù)據(jù)庫(kù)不同,區(qū)塊鏈?zhǔn)褂梅植际焦沧R(shí)算法來(lái)確保網(wǎng)絡(luò)中互不信任的節(jié)點(diǎn)可以在同一賬本上達(dá)成一致。共識(shí)算法的使用提高了區(qū)塊鏈應(yīng)對(duì)崩潰容錯(cuò)或拜占庭容錯(cuò)的能力,使區(qū)塊鏈比傳統(tǒng)數(shù)據(jù)庫(kù)具有更高的安全性。
(4)合約層。包含各種腳本、算法和智能合約,是區(qū)塊鏈可編程性的基礎(chǔ)。
(5)應(yīng)用層。用戶可以使用區(qū)塊鏈提供的API很容易地開發(fā)新的去中心化應(yīng)用程序。
2 區(qū)塊鏈數(shù)據(jù)可用性
區(qū)塊鏈技術(shù)承擔(dān)著數(shù)據(jù)要素可信流通過(guò)程中的存儲(chǔ)、交易與共享等關(guān)鍵環(huán)節(jié),主要支撐數(shù)據(jù)存儲(chǔ)和查詢功能。本文從區(qū)塊鏈的存儲(chǔ)模型和可擴(kuò)展性兩個(gè)方面來(lái)探討區(qū)塊鏈的數(shù)據(jù)可用性。存儲(chǔ)模型是系統(tǒng)設(shè)計(jì)中至關(guān)重要的層次,與查詢密切相關(guān);可擴(kuò)展性是系統(tǒng)能否面向大數(shù)據(jù)應(yīng)用場(chǎng)景的重要技術(shù)指標(biāo)。
2.1 區(qū)塊鏈的存儲(chǔ)模型
早期的區(qū)塊鏈系統(tǒng)主要應(yīng)用于加密數(shù)字貨幣[6-7]及金融服務(wù)領(lǐng)域[11],用于存儲(chǔ)數(shù)字資產(chǎn)。這些系統(tǒng)主要使用鍵-值型存儲(chǔ)模型,其優(yōu)勢(shì)在于:(1)鍵-值型存儲(chǔ)模型足以滿足以賬戶模型為主的數(shù)字資產(chǎn)存儲(chǔ)需求;(2)鍵-值型存儲(chǔ)模型通常不需要復(fù)雜的數(shù)據(jù)結(jié)構(gòu)來(lái)存儲(chǔ)數(shù)據(jù),能夠帶來(lái)較高的查詢處理性能。
隨著區(qū)塊鏈在數(shù)據(jù)管理領(lǐng)域逐漸得到人們的關(guān)注,廣泛應(yīng)用于金融監(jiān)管、數(shù)字存證、政務(wù)服務(wù)和溯源防偽等場(chǎng)景中,單一的鍵-值型存儲(chǔ)模型已經(jīng)不能滿足多樣化的業(yè)務(wù)需求,存在查詢語(yǔ)義缺失、查詢能力不足等問(wèn)題[12]。研究者們開始探索在區(qū)塊鏈系統(tǒng)中實(shí)現(xiàn)數(shù)據(jù)庫(kù)的存儲(chǔ)模型。目前的研究主要分為兩種方式:一種方式是不改變區(qū)塊鏈原有的存儲(chǔ)引擎,通過(guò)改變數(shù)據(jù)的存儲(chǔ)格式,并引入多種索引,在區(qū)塊鏈系統(tǒng)之上構(gòu)建了支持各種查詢功能的抽象數(shù)據(jù)庫(kù)層;另一種方式是將成熟的數(shù)據(jù)庫(kù)系統(tǒng)作為區(qū)塊鏈的新型存儲(chǔ)引擎,并修改區(qū)塊鏈所提供的查詢處理接口,從而使區(qū)塊鏈系統(tǒng)具備數(shù)據(jù)庫(kù)的查詢處理能力。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-840017.html
SEBDB[12,13]?屬于第一種實(shí)現(xiàn)方式,將關(guān)系型語(yǔ)義添加到區(qū)塊鏈存儲(chǔ)中,通過(guò)重新定義區(qū)塊鏈交易的數(shù)據(jù)格式實(shí)現(xiàn)了一種表格存儲(chǔ)模式,并將每條交易作為一項(xiàng)數(shù)據(jù)記錄。具體來(lái)說(shuō),交易包含兩種屬性類型:系統(tǒng)級(jí)屬性和應(yīng)用級(jí)屬性。系統(tǒng)級(jí)屬性包括交易ID、簽名、時(shí)間戳、交易發(fā)送者、交易類型等,由系統(tǒng)自動(dòng)添加,其中交易類型用于區(qū)分該條記錄所屬的表格。應(yīng)用級(jí)屬性由用戶在表格創(chuàng)建時(shí)進(jìn)行顯示定義。為提升鏈上數(shù)據(jù)的查詢效率,SEBDB定義了3種基本查詢操作:(1)根據(jù)區(qū)塊號(hào)、交易記錄編號(hào)或時(shí)間戳來(lái)獲取區(qū)塊數(shù)據(jù);(2)根據(jù)交易類型獲取全部交易記錄;(3)獲取滿足特定條件的交易記錄。隨后提出3種索引來(lái)優(yōu)化上述查詢:(1)以(block_id, first_tx_id, ts)文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-840017.html
到了這里,關(guān)于基于區(qū)塊鏈的數(shù)據(jù)要素可信流通技術(shù)綜述的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!