作者:Lewis Liao,Zonff Partners
當(dāng)我們?cè)谡?Web3 數(shù)據(jù)的時(shí)候,在談些什么?想要弄清楚這個(gè)問題,首先我們要弄清楚,在 Web2 中數(shù)據(jù)是什么樣的。本文將從數(shù)據(jù)的產(chǎn)生、收集、存儲(chǔ)、管理和使用的全生命周期來展開討論。在此之前,我們首先明晰數(shù)據(jù)是如何被定義的。
中國全國信息安全標(biāo)準(zhǔn)化技術(shù)委員會(huì)出臺(tái)的《網(wǎng)絡(luò)安全標(biāo)準(zhǔn)實(shí)踐指南 – 數(shù)據(jù)分類分級(jí)指引》(征求意見稿 – v1.0 – 202109)中,將數(shù)據(jù)分類為個(gè)人信息、公共數(shù)據(jù)和法人數(shù)據(jù)。
其具體定義與實(shí)例如下表,
在每個(gè)類別之上,又根據(jù)數(shù)據(jù)泄露的危害對(duì)象和程度分為 5 個(gè)級(jí)別:公開級(jí)(1 級(jí))、內(nèi)部級(jí)(2 級(jí))、敏感級(jí)(3 級(jí))、重要級(jí)(4 級(jí))和核心級(jí)(5 級(jí))。對(duì)于公開級(jí)的數(shù)據(jù),它更像是一個(gè)公共產(chǎn)品,是非競爭性和非排他性的。這種類型的數(shù)據(jù)一般由政府/公共組織提供,收益歸其所有,如天氣預(yù)報(bào)、宏觀經(jīng)濟(jì)數(shù)據(jù)等等。
1.1 數(shù)據(jù)的產(chǎn)生、收集和存儲(chǔ)
公共數(shù)據(jù)、個(gè)人數(shù)據(jù)和法人數(shù)據(jù)大部分是在我們?nèi)粘J褂糜?jì)算機(jī)應(yīng)用程序時(shí)產(chǎn)生的,其中與普通用戶切身相關(guān)的是個(gè)人數(shù)據(jù)和法人數(shù)據(jù)。
那么個(gè)人數(shù)據(jù)和法人數(shù)據(jù)是如何產(chǎn)生和被收集的呢?一個(gè)高度抽象的互聯(lián)網(wǎng)產(chǎn)品系統(tǒng)架構(gòu)圖如下所示,
Web2 應(yīng)用架構(gòu)
圖片來源:Zonff Partners
最底層的數(shù)據(jù)庫存儲(chǔ)著來自于后端傳遞過來的,用戶與前端互動(dòng)產(chǎn)生的數(shù)據(jù)。廣義上說,這些都是用戶數(shù)據(jù)。
就移動(dòng)端應(yīng)用來說,數(shù)據(jù)大概可以分為以下幾類:
用戶信息,用戶使用應(yīng)用服務(wù)記錄下來的與用戶相關(guān)的信息,包括用戶的身份信息、設(shè)備、網(wǎng)絡(luò)、地理位置甚至移動(dòng)設(shè)備上安裝的應(yīng)用列表等,由服務(wù)端數(shù)據(jù)表和埋點(diǎn)進(jìn)行收集;
內(nèi)容數(shù)據(jù),用戶使用應(yīng)用服務(wù)生產(chǎn)的數(shù)據(jù),這些包括用戶任何主動(dòng)在應(yīng)用上交互寫入的非個(gè)人信息內(nèi)容數(shù)據(jù),屬于應(yīng)用服務(wù)的一部分,一般由服務(wù)端數(shù)據(jù)表直接收集;
行為數(shù)據(jù),用戶使用應(yīng)用期間交互產(chǎn)生的數(shù)據(jù),這些包括用戶在使用應(yīng)用期間的行為習(xí)慣,如觀看時(shí)長、點(diǎn)擊率、滲透率、滑動(dòng)情況等等,一般由埋點(diǎn)進(jìn)行收集;
日志數(shù)據(jù),用戶使用應(yīng)用期間應(yīng)用本身產(chǎn)生的數(shù)據(jù),這些包括應(yīng)用的崩潰日志等;
代碼數(shù)據(jù),非用戶交互的數(shù)據(jù)包括前端與后端代碼,這些數(shù)據(jù)與用戶數(shù)據(jù)一樣,都是存儲(chǔ)在某個(gè)地方的中心化服務(wù)器上;
在這個(gè)分類當(dāng)中,用戶信息屬于個(gè)人信息數(shù)據(jù),日志和代碼數(shù)據(jù)屬于法人數(shù)據(jù)。其中值得討論的是內(nèi)容數(shù)據(jù)和行為數(shù)據(jù),它們?cè)?Web2 時(shí)代更多被中心化實(shí)體劃分為自身的業(yè)務(wù)數(shù)據(jù),即法人數(shù)據(jù)。
在 Web3 的應(yīng)用中有什么不一樣嗎?Preethi Kasireddy 這張 Web3 產(chǎn)品架構(gòu)可以幫助我們理解。
Web3 產(chǎn)品架構(gòu)
圖片來源:Preethi Kasireddy
與 Web2 應(yīng)用相比,用戶終端與前端是幾乎沒有什么變化的,不一樣在于后端與數(shù)據(jù)庫。用戶通過前端與節(jié)點(diǎn)提供商互動(dòng)(而不是某臺(tái)中心化服務(wù)器),訪問布置在以太坊等區(qū)塊鏈上的合約代碼(而不是服務(wù)器上的后端環(huán)境),并進(jìn)行交互。在這個(gè)過程同樣會(huì)產(chǎn)生上述幾種類型的數(shù)據(jù),由于技術(shù)架構(gòu)的區(qū)別,Web3 產(chǎn)生的數(shù)據(jù)并不是由一臺(tái)中心化服務(wù)器存儲(chǔ),對(duì)于不同方式產(chǎn)生的數(shù)據(jù)其存儲(chǔ)的方式或有異同之處。
其中凡是智能合約交互產(chǎn)生的數(shù)據(jù),都發(fā)布在區(qū)塊鏈上,任何人可以都訪問,它因此成為一種公共產(chǎn)品,這些包括資產(chǎn)信息、交易數(shù)據(jù)和合約代碼。理論上,只要區(qū)塊鏈塊空間夠大,任何數(shù)據(jù)都可以存儲(chǔ)在區(qū)塊鏈上,甚至也有的項(xiàng)目在嘗試將區(qū)塊鏈作為數(shù)據(jù)庫來存儲(chǔ)數(shù)據(jù)。
目前階段,一個(gè) Web3 應(yīng)用產(chǎn)生的數(shù)據(jù),除以上三類數(shù)據(jù)以外,大多數(shù)仍然采用中心化服務(wù)器的存儲(chǔ)方式,這些包括前端代碼、用戶信息、內(nèi)容數(shù)據(jù)、行為數(shù)據(jù)和日志數(shù)據(jù)。這是由于目前相關(guān)存儲(chǔ)基礎(chǔ)設(shè)施并不完善,項(xiàng)目方或受限于技術(shù)問題,或?yàn)榱吮WC訪問速度等原因采取了中心化方案。隨著基礎(chǔ)設(shè)施的不斷發(fā)展,有很多功能越來越強(qiáng)大的存儲(chǔ)基建的出現(xiàn),如 IFPS、Stroj、Filecoin 和 Ceramic 等,也有越來越多應(yīng)用已經(jīng)開始將自身部署在去中心化存儲(chǔ)上面,如將前端網(wǎng)站布置在 IPFS 上然后通過 ENS 訪問,從而搭建一個(gè)去中心化網(wǎng)站前端以及將 NFT 項(xiàng)目對(duì)應(yīng)的圖片等文件數(shù)據(jù)用 Arweave 進(jìn)行永存等等。
總的來說,在搭建一個(gè) Web3 應(yīng)用的時(shí)候,對(duì)于應(yīng)用數(shù)據(jù)的存儲(chǔ),開發(fā)人員通常可以有 3 種選擇:
將其存在區(qū)塊鏈上,這種選擇非常昂貴,會(huì)導(dǎo)致應(yīng)用盡可能的簡單,并且數(shù)據(jù)完全公開,好處是最為直接保護(hù)了應(yīng)用主權(quán);
將智能合約邏輯存在區(qū)塊鏈上,其他存在傳統(tǒng)后端上。這種方法會(huì)犧牲用戶的主權(quán)性,同時(shí)有中心化的風(fēng)險(xiǎn)。這是目前大多數(shù) Web3 應(yīng)用采用的方式;
將智能合約邏輯存在區(qū)塊鏈上,其他存在 IPFS、Arweave 和 Ceramic 等存儲(chǔ)上,通過智能合約管理和更新數(shù)據(jù),這種方法較為昂貴(Ceramic 目前免費(fèi))且暫時(shí)較為緩慢,但這種方法可以保護(hù)應(yīng)用的主權(quán)性;
目前,絕大多數(shù) Web3 應(yīng)用是通過第 2 種方式進(jìn)行搭建的,也有一些特定應(yīng)用,目前已經(jīng)可以使用第 3 種方式進(jìn)行搭建,極少數(shù)應(yīng)用是通過第 1 種方式進(jìn)行搭建的。那么,我們應(yīng)該選擇哪種方式存儲(chǔ)呢?什么樣的存儲(chǔ)方式是趨勢(shì)呢?
1.2 趨勢(shì):去中心化存儲(chǔ) – 數(shù)據(jù)和應(yīng)用主權(quán)
當(dāng)談到搭建 Web3 應(yīng)用的 3 種方式時(shí),這有一個(gè)關(guān)鍵詞:主權(quán)(sovereign)。這個(gè)詞是當(dāng)我們聊到 Web3 的特點(diǎn)時(shí)一個(gè)繞不開的話題,一般來說會(huì)包括數(shù)據(jù)主權(quán)和應(yīng)用主權(quán)。那么主權(quán)重要嗎?這是另一個(gè)話題,本文不作探討,感興趣可以閱讀相關(guān)文章,如「Web3 數(shù)據(jù)市場展望」和「Web3 – Let the “right to data” awaken」。這里想從數(shù)據(jù)的角度,切入 Web3 主權(quán)確立的必經(jīng)之路,并推演基礎(chǔ)設(shè)施發(fā)展的方向和重點(diǎn)。
關(guān)于數(shù)據(jù)主權(quán),包括數(shù)字資產(chǎn)主權(quán)和用戶數(shù)據(jù)主權(quán),「 縱向流動(dòng)性:價(jià)值如何互聯(lián)互通」一文中有談到關(guān)于代幣可以定義用戶的數(shù)字資產(chǎn)主權(quán)(身份、關(guān)系與物權(quán)),這是由一個(gè)難以篡改的廣泛共識(shí)所決定的。最基礎(chǔ)的,這些權(quán)利的定義由區(qū)塊鏈本身就能完成,如一個(gè)代幣歸屬于哪一個(gè)地址。可一旦涉及到更復(fù)雜的數(shù)字產(chǎn)品權(quán)利歸屬,就會(huì)有很多問題出現(xiàn),比較典型的就是 NFT 對(duì)應(yīng)的圖片(或文章等)的存儲(chǔ)問題,「NFT:數(shù)字所有權(quán)的革命」中對(duì)這個(gè)問題進(jìn)行過討論。大多數(shù) NFT 的現(xiàn)狀是其對(duì)應(yīng)的數(shù)字產(chǎn)品存儲(chǔ)在某個(gè)地方的中心化服務(wù)器上,一旦服務(wù)器崩潰或者被黑,那么用戶所擁有的就只是一串鏈上哈希,哈希背后真正的 “物品” 則隨時(shí)可以被偷竊或者替換,變得毫無價(jià)值。
此外,用戶數(shù)據(jù)主權(quán)作為 Web2 與 Web3 最為明顯的分界線之一,是為 Web3 創(chuàng)新與進(jìn)步所吶喊的旗幟。就此,Ceramic 設(shè)想了一個(gè)數(shù)據(jù)宇宙,一個(gè)可組合的、網(wǎng)絡(luò)級(jí)規(guī)模的數(shù)據(jù)生態(tài)系統(tǒng),由每個(gè)人擁有,但不被任何人獨(dú)有。用戶數(shù)據(jù)跟隨用戶從一個(gè)應(yīng)用到另一個(gè)應(yīng)用,用戶作為中心控制自己的數(shù)字宇宙。目前,幾乎還沒有應(yīng)用可以實(shí)現(xiàn)這一點(diǎn),Cyberconnect 作出了很好的嘗試,它創(chuàng)造了一個(gè)去中心化社交圖譜協(xié)議,希望在應(yīng)用間實(shí)現(xiàn)用戶社交關(guān)系數(shù)據(jù)的可互操作性。但目前來講,該應(yīng)用并沒有保證用戶的數(shù)據(jù)主權(quán),盡管他們已經(jīng)開始轉(zhuǎn)移到 Ceramic 之上進(jìn)行建設(shè),但一切仍然還在路上。
關(guān)于應(yīng)用主權(quán),有人把主權(quán)應(yīng)用稱為 “超級(jí)結(jié)構(gòu)”,它擁有不可停止、免費(fèi)、有價(jià)值、可擴(kuò)展、無許可、正外部性和可信中立等特征,這些綜合起來提供了一個(gè)數(shù)字世界的公共產(chǎn)品,打造了 “元宇宙”(如果你信的話)的基礎(chǔ)設(shè)施。目前絕大多數(shù)所謂 Web3 的應(yīng)用其應(yīng)用主權(quán)程度都不高,它們不是真正的公共產(chǎn)品,它們可以很容易被強(qiáng)權(quán)制裁與改變,Tornado Cash 事件非常直接地說明了這個(gè)問題。主要原因之一是因?yàn)殡m然這些應(yīng)用協(xié)議層的合約代碼都發(fā)布在區(qū)塊鏈上,但如前端、域名等組件仍然由第三方中心化的實(shí)體所控制。
為了實(shí)現(xiàn)數(shù)據(jù)主權(quán)和應(yīng)用主權(quán),Web3 應(yīng)用的構(gòu)建方式至關(guān)重要,其基礎(chǔ)出發(fā)點(diǎn)就是存儲(chǔ),數(shù)據(jù)存在哪里,怎么存才能保證用戶能夠擁有主權(quán)?總的來說,根據(jù)用戶的數(shù)據(jù)類型不同,可以有不同的解決方案:
用戶的資產(chǎn)信息、交易數(shù)據(jù)應(yīng)為公共賬本數(shù)據(jù),存在鏈上保證可驗(yàn)證性是最重要的,但 Aztec 這樣的應(yīng)用出現(xiàn)用來保障用戶鏈上交易的隱私性是非常有價(jià)值的;
用戶的用戶信息、內(nèi)容數(shù)據(jù)和行為數(shù)據(jù)作為個(gè)人信息,保證用戶的控制權(quán)非常重要,在用戶的同意之下,可以選擇性對(duì)這些數(shù)據(jù)進(jìn)行公開,作為公共產(chǎn)品以發(fā)掘正外部性;
日志數(shù)據(jù)和代碼數(shù)據(jù)作為法人數(shù)據(jù),私有化是可以接受的,也有一定的必要性,但涉及到 “超級(jí)建筑” 類的 Web3 基礎(chǔ)設(shè)施類應(yīng)用,它應(yīng)當(dāng)具有公共基礎(chǔ)設(shè)施的特性,應(yīng)用代碼的存儲(chǔ)應(yīng)當(dāng)公開且具備超過平臺(tái)級(jí)的抗審查能力;
目前,大多數(shù) Web3 應(yīng)用采用「將智能合約邏輯存在區(qū)塊鏈上,其他存在傳統(tǒng)后端上」的原因是目前沒有足夠好用的去中心化基礎(chǔ)設(shè)施可以替代原本的中心化基礎(chǔ)設(shè)施方案。
首先,IPFS、Filecoin 與 Arweave 等去中心化存儲(chǔ)都是靜態(tài)存儲(chǔ),這使得其缺乏計(jì)算和狀態(tài)管理能力,無法實(shí)現(xiàn)更高級(jí)的類似數(shù)據(jù)庫的功能(如可變性、版本控制、訪問控制和可編程邏輯),而雖然 Ceramic 是動(dòng)態(tài)存儲(chǔ),一定程度解決了這些問題,但 Ceramic 目前的訪問速度仍然較為緩慢,且開發(fā)套件不夠完善,并且其去中心化程度也一直為人詬病。
IPFS、Filecoin 與 Arweave 等去中心化存儲(chǔ)的主要作用是靜態(tài)存儲(chǔ)了如圖片、文檔和靜態(tài)代碼等文件非結(jié)構(gòu)化數(shù)據(jù),因?yàn)槠潆y以被篡改的特性一定程度上的保障了如 NFT 之類的數(shù)字主權(quán),鏈上哈希代碼與鏈下去中心化存儲(chǔ)地址之間的聯(lián)系一旦建立,就很難被外力以非常的手段影響。而前端代碼搭建在上面也促進(jìn)了應(yīng)用主權(quán)的完整性,但由于目前階段的存儲(chǔ)技術(shù)僅僅是存儲(chǔ)而已,計(jì)算能力的缺乏導(dǎo)致其功能支持遠(yuǎn)遠(yuǎn)落后于中心化的服務(wù)器方案。
目前市面上的主流去中心化存儲(chǔ)情況如下表所示,本表格參考「Web3 去中心化存儲(chǔ)進(jìn)化史」總結(jié)更新,
數(shù)據(jù)來源:CoinmarketCap
時(shí)間:2022 年 8 月 23 日
目前來說,大多數(shù)的存儲(chǔ)方案只是實(shí)現(xiàn)了一個(gè)「去中心化硬盤」,這滿足了最基本的需求,更高級(jí)一些的如基于存儲(chǔ)的計(jì)算需求并未完全滿足,這些計(jì)算包括本地開發(fā)環(huán)境渲染、數(shù)據(jù)流的插入與提取等等,這些都是目前 Web2 應(yīng)用最常用和最必要的功能模塊。Ceramic 基于數(shù)據(jù)流存儲(chǔ)的創(chuàng)新使得數(shù)據(jù)的權(quán)限管理、版本控制、動(dòng)態(tài)存儲(chǔ)和可組合性得以實(shí)現(xiàn), Stratos 則正在嘗試提供一個(gè)更完善的、全套的解決方案,包括數(shù)據(jù)庫存儲(chǔ)、靜態(tài)存儲(chǔ)、計(jì)算和共識(shí)等多個(gè)模塊。此外,Arweave 和 Filecoin 也意識(shí)到了計(jì)算的重要性,正在自己或者鼓勵(lì)生態(tài)建設(shè)相關(guān)模塊,如 Filecoin 已經(jīng)推出了 FVM 以支持在 Filecoin 上的計(jì)算 。
2.1 數(shù)據(jù)的管理
將 Web3 應(yīng)用建立在去中心化存儲(chǔ)之上,使得他們更加不容易被外力干擾,打破了壟斷與強(qiáng)權(quán)。但僅僅是存儲(chǔ)還不夠,還需要存儲(chǔ)環(huán)境的渲染計(jì)算、數(shù)據(jù)處理、權(quán)限配置和隱私保護(hù)等等技術(shù)的支持,才能夠保證應(yīng)用的主權(quán)、用戶的數(shù)據(jù)主權(quán),從而實(shí)現(xiàn)數(shù)字世界個(gè)人主權(quán)的崛起。尤其是權(quán)限控制和隱私保護(hù)問題,它們應(yīng)該用一個(gè)高級(jí)別的主權(quán)技術(shù)方案實(shí)現(xiàn)。Web2 應(yīng)用中這些級(jí)別數(shù)據(jù)都是按照不同的安全防護(hù)級(jí)別,保存在某些具體的中心化服務(wù)器上,其安全性由網(wǎng)絡(luò)安全保障,其主權(quán)性由平臺(tái)保障(如企業(yè)平臺(tái)、政府平臺(tái)等等)。這種數(shù)據(jù)管理模式下,用戶服從于超級(jí)管理員,對(duì)于數(shù)據(jù)本身,用戶沒有任何權(quán)利。此外,數(shù)據(jù)安全也受制于超級(jí)管理員這一中心化實(shí)體,如前段時(shí)間某地區(qū)的公安數(shù)據(jù)泄露事件,一個(gè)超級(jí)管理員將其私鑰泄露,使得上億人的個(gè)人私密信息泄露。
Web3 的數(shù)據(jù)管理應(yīng)當(dāng)具有以下兩大特性:
數(shù)據(jù)主權(quán)保障。這應(yīng)該是超越平臺(tái)級(jí)的甚至是世界級(jí)的,通過世界級(jí)的共識(shí)保障數(shù)字世界用戶共同的權(quán)力。傳統(tǒng)世界這方面的保障是平臺(tái)級(jí)的,而且規(guī)則來自于非共識(shí),一家平臺(tái)級(jí)公司就可以掌控所有的規(guī)則制度,并隨時(shí)可以更改,從而隨時(shí)可以侵犯用戶個(gè)人主權(quán);
數(shù)據(jù)隱私保障。通過密碼學(xué)從數(shù)學(xué)上對(duì)用戶數(shù)據(jù)隱私安全進(jìn)行保障,而不是通過數(shù)據(jù)庫網(wǎng)絡(luò)安全的方式進(jìn)行保護(hù),用戶控制的選擇性加密是用戶數(shù)據(jù)主權(quán)的基本權(quán)利之一;
如何對(duì) Web3 數(shù)據(jù)進(jìn)行管理,取決于該數(shù)據(jù)是如何存儲(chǔ)的。
IPFS 和 Filecoin 以內(nèi)容為中心,通過 Content ID(CID)來訪問存儲(chǔ)的內(nèi)容,在此基礎(chǔ)之上通過搭建第三方應(yīng)用進(jìn)行數(shù)據(jù)管理,如通過 ChainSafe Files,可以本地化方式解決單點(diǎn)登錄問題后,可以方便地通過非對(duì)稱加密對(duì)數(shù)據(jù)進(jìn)行加密存儲(chǔ)。以內(nèi)容為中心的管理模式,使得用戶管理變得困難,如何給數(shù)據(jù)定所有權(quán)變得較為復(fù)雜。Filecoin 除了提供存儲(chǔ)之外,它的生態(tài)的拓展性會(huì)比其他的底層來說要高得多。特別是接下來 FVM 推出之后,可能會(huì)有一些針對(duì)數(shù)據(jù)存儲(chǔ)數(shù)據(jù)檢索方面的一些垂直領(lǐng)域推出特色的工具,能幫助用戶幫助企業(yè)更好地去管理它的一些數(shù)據(jù),保證數(shù)據(jù)的安全,然后開發(fā)很多的一些新的應(yīng)用。
Ceramic 也是基于 IPFS,但以用戶為中心,基于 IDX Protocol,3ID DID 方法(CIP – 79)構(gòu)建了 Ceramic-native 的賬戶體系,可用于對(duì) Ceramic 進(jìn)行身份驗(yàn)證,用戶可以使用區(qū)塊鏈錢包控制 3ID DID 在數(shù)據(jù)流上執(zhí)行交易并管理自己的數(shù)據(jù)。這是通過將 DID 與數(shù)據(jù)關(guān)聯(lián)后存儲(chǔ)進(jìn)數(shù)據(jù)模型實(shí)現(xiàn)的,數(shù)據(jù)模型定義了用戶數(shù)據(jù)的格式(schema),只要使用同一個(gè)數(shù)據(jù)模型的應(yīng)用都共享該數(shù)據(jù)格式。
Arweave 是一個(gè)一次付費(fèi)、永久存儲(chǔ)的鏈上數(shù)據(jù)去中心化存儲(chǔ)項(xiàng)目,數(shù)據(jù)公開透明地存儲(chǔ)在鏈上,任何人都可以訪問,通過 Arweave 區(qū)塊鏈瀏覽器可以瀏覽存在鏈上的數(shù)據(jù)。這種模式下的數(shù)據(jù)管理與管理鏈上數(shù)據(jù)一模一樣,沒有訪問權(quán)限控制,以及對(duì)原來數(shù)據(jù)的 “熱更新”,每次更新數(shù)據(jù),其索引地址都會(huì)發(fā)生變化,這一點(diǎn) IPFS 和 Filecoin 不存在問題,但其好處是數(shù)據(jù)歸屬于哪一位用戶非常明確,有利于對(duì)于數(shù)據(jù)權(quán)益進(jìn)行回溯。
Stratos 也是基于區(qū)塊鏈共識(shí)的存儲(chǔ),會(huì)專門維護(hù)一個(gè)索引樹,記錄數(shù)據(jù)存儲(chǔ)的路徑,從而保持對(duì)數(shù)據(jù)更新的追蹤。與 Arweave 不同的是,Stratos 每一個(gè)存儲(chǔ)節(jié)點(diǎn)(Resource Node)被設(shè)計(jì)成同時(shí)擁有計(jì)算能力、存儲(chǔ)和內(nèi)容訪問控制服務(wù),項(xiàng)目方自己會(huì)搭建基于區(qū)塊鏈本身的數(shù)據(jù)庫用于數(shù)據(jù)的動(dòng)態(tài)吞吐,其形態(tài)和管理模式接近于去中心化云計(jì)算機(jī)。
2.2 趨勢(shì):去中心化數(shù)據(jù)市場
在用戶擁有數(shù)據(jù)所有權(quán)的情況下,數(shù)據(jù)市場是一個(gè)必然趨勢(shì),數(shù)據(jù)作為資本要素在其中流通。在 Filecoin 上就曾經(jīng)有過數(shù)據(jù)市場的嘗試,F(xiàn)ivehive 由去中心化應(yīng)用開發(fā)工作室 OB1 搭建并維護(hù),是一個(gè)開源市場,支持?jǐn)?shù)據(jù)集的上傳、維護(hù)、購買和(或)轉(zhuǎn)讓。該項(xiàng)目 Github 已經(jīng)在兩年前就停止了更新和維護(hù),大概率是失敗了。
Ceramic 的數(shù)據(jù)模型市場
Ceramic 在其數(shù)據(jù)宇宙中提到了他們要打造的開放數(shù)據(jù)模型市場,因?yàn)閿?shù)據(jù)需要互操作性,它能夠極大地促進(jìn)生產(chǎn)力的提升。這樣的數(shù)據(jù)模式市場是通過對(duì)數(shù)據(jù)模型的緊急共識(shí)實(shí)現(xiàn)的,就類似于以太坊中的 ETC 合約標(biāo)準(zhǔn),開發(fā)人員可以從中選擇作為功能模板,從而擁有一個(gè)符合該數(shù)據(jù)模型的所有數(shù)據(jù)的應(yīng)用程序。目前來說,這樣的市場并不是一個(gè)交易市場。
關(guān)于數(shù)據(jù)模型,一個(gè)簡單的例子是,在去中心化社交網(wǎng)絡(luò)當(dāng)中,數(shù)據(jù)模型可以簡化為 4 個(gè)參數(shù),分別是:
PostList:存儲(chǔ)用戶帖子的索引
Post:存儲(chǔ)單個(gè)帖子
Profile:存儲(chǔ)用戶的資料
FollowList:存儲(chǔ)用戶的關(guān)注列表
那么數(shù)據(jù)模型如何在 Ceramic 上進(jìn)行創(chuàng)建、共享和重用,從而實(shí)現(xiàn)跨應(yīng)用程序數(shù)據(jù)互操作性呢?
Ceramic 提供了一個(gè)數(shù)據(jù)模型注冊(cè)表(DataModels Registry),這是一個(gè)開源的、社區(qū)共建的、用于 Ceramic 的可重用應(yīng)用程序數(shù)據(jù)模型的存儲(chǔ)庫。在這里,開發(fā)人員可以在其中公開注冊(cè)、發(fā)現(xiàn)和重用現(xiàn)有數(shù)據(jù)模型 – 這是構(gòu)建在共享數(shù)據(jù)模型上的客戶操作應(yīng)用程序的基礎(chǔ)。目前,它基于 Github 存儲(chǔ),未來它將分散在 Ceramic 上。
添加到注冊(cè)表的所有數(shù)據(jù)模型都會(huì)自動(dòng)發(fā)布到 @datamodels 的 npm 插件包下面。任何開發(fā)人員都可以使用 @datamodels/model-name 安裝一個(gè)或多個(gè)數(shù)據(jù)模型,使這些模型可用于在運(yùn)行時(shí)使用任何 IDX 客戶端存儲(chǔ)或檢索數(shù)據(jù),包括 DID DataStore 或 Self.ID。
此外,Ceramic 還基于 Github 搭建了一個(gè) DataModels 論壇,數(shù)據(jù)模型注冊(cè)表中的每個(gè)模型在該論壇上都有自己的討論線程,社區(qū)可以通過它來評(píng)論和討論。同時(shí),這里還可以供開發(fā)人員發(fā)布關(guān)于數(shù)據(jù)模型的想法,從而在將其添加到注冊(cè)表之前征求社區(qū)的意見。目前一切都在早期階段,注冊(cè)表中的數(shù)據(jù)模型并不多,收納進(jìn)入注冊(cè)表中的數(shù)據(jù)模型應(yīng)當(dāng)通過社區(qū)的評(píng)定成為 CIP 標(biāo)準(zhǔn),就像以太坊的智能合約標(biāo)準(zhǔn)一樣,這為數(shù)據(jù)提供了可組合性。
Ocean 的數(shù)據(jù)交易市場
Ocean Protocol 以數(shù)據(jù)交易市場為核心,建立了一個(gè)去中心化的數(shù)據(jù)服務(wù)供應(yīng)鏈網(wǎng)絡(luò)。下圖顯示了創(chuàng)建數(shù)據(jù)服務(wù)供應(yīng)鏈所需的主要服務(wù),提供數(shù)據(jù)、算法、計(jì)算、存儲(chǔ)、分析和策劃。這些組件與服務(wù)執(zhí)行協(xié)議(如服務(wù)等級(jí)協(xié)議)、安全計(jì)算、訪問控制和許可綁定在一起。
圖片來源:Ocean Protocol
主要的參與角色為數(shù)據(jù)使用者、服務(wù)提供者、市場、服務(wù)發(fā)布者、驗(yàn)證者和策展人。Ocean 提供了全套數(shù)據(jù)科學(xué)工具,數(shù)據(jù)使用者可以在 Ocean 上建立數(shù)據(jù)服務(wù)管道以自動(dòng)化運(yùn)行數(shù)據(jù)算法從而對(duì)數(shù)據(jù)進(jìn)行加工處理以及價(jià)值發(fā)現(xiàn)。在這個(gè)過程中,數(shù)據(jù)使用者無法下載全部數(shù)據(jù)集以及看到全部數(shù)據(jù)集,因此保護(hù)了數(shù)據(jù)集不被盜取,使用者購買的是數(shù)據(jù)集的使用權(quán),而非擁有該數(shù)據(jù)集。
來源:Ocean Protocol
除此之外,Ocean 還和其他機(jī)構(gòu)合作建立數(shù)據(jù)市場,如它與梅賽德斯-奔馳的去中心化數(shù)據(jù)市場 [Acentrik] (https://acentrik.io/) 在其最近推出的 Enterprise Release 中聯(lián)手。Acentrik Marketplace 由 OceanONDA V4 智能合約和庫驅(qū)動(dòng),可以發(fā)布數(shù)據(jù)服務(wù)、部署和鑄造數(shù)據(jù)代幣和 Acentrik 資產(chǎn)管理代幣,并通過花費(fèi)來消費(fèi)數(shù)據(jù)服務(wù)。
3.1 數(shù)據(jù)的使用與堆棧
基于以上內(nèi)容的理解,我們提出了 Web3 數(shù)據(jù)堆棧,見下圖,
最底層是數(shù)據(jù)源所存儲(chǔ)的地方,包括去中心化存儲(chǔ)、鏈上和鏈下數(shù)據(jù)等;
其次是針對(duì)這些數(shù)據(jù)的管理應(yīng)用,包括數(shù)據(jù)庫、數(shù)據(jù)表、索引中間件以及數(shù)據(jù)市場等;
在一定的數(shù)據(jù)管理范式下,能夠?qū)?shù)據(jù)進(jìn)行挖掘,包括算法建模、統(tǒng)計(jì)分析和數(shù)據(jù)可視化等;
Web3 數(shù)據(jù)堆棧
圖片來源:Zonff Partners
目前行業(yè)內(nèi)關(guān)于 Web3 的數(shù)據(jù)使用,絕大多數(shù)是鏈上數(shù)據(jù),層出不窮的數(shù)據(jù)分析工具與索引工具出現(xiàn),鏈上數(shù)據(jù)這個(gè)巨大的金礦已經(jīng)被充分地挖掘,上圖的數(shù)據(jù)表和分析應(yīng)用分類中絕大多數(shù)都是鏈上數(shù)據(jù)的挖掘,只有少部分涉及到鏈下數(shù)據(jù)??偟膩碚f,數(shù)據(jù)的使用鏈路是一個(gè) ETLA(Extract、Transform、Load、Analysis)的過程,每個(gè)節(jié)點(diǎn)上都具有代表性的項(xiàng)目。提取(Extract)項(xiàng)目的代表是 The Graph,而轉(zhuǎn)換(Transform)成可用數(shù)據(jù)表和加載(Load)環(huán)節(jié)的項(xiàng)目代表是 Dune 和 Luabsae,分析(Analysis)的代表是 Nansen 和 NFTGO。
而在去中心化存儲(chǔ)上 ETLA 整個(gè)流程的支持項(xiàng)目幾乎還是荒漠,只有一些提取類項(xiàng)目,這里存在巨大的機(jī)遇和挑戰(zhàn)。The Graph 和 Ceramic 社區(qū)本身正致力于提取 Ceramic 上的數(shù)據(jù),Orbis 的創(chuàng)始人也嘗試做了一個(gè) Cerscan 用于瀏覽 Ceramic 上的數(shù)據(jù)。Arweave 已經(jīng)可以通過 The Graph 用子圖讀取和管理 Arweave 存儲(chǔ)的數(shù)據(jù),F(xiàn)ilecoin 上也有相關(guān)第三方項(xiàng)目在做這件事情。但 TLA 的過程目前還無人問津,其中最大的原因是存儲(chǔ)在不同去中心化存儲(chǔ)上的數(shù)據(jù)異質(zhì)性很高,很難有一個(gè)統(tǒng)一的模式去挖掘這些數(shù)據(jù)的價(jià)值,其中最有希望踏出這一步的是 Ceramic,這是因?yàn)槠鋽?shù)據(jù)模型的存在使得 Ceramic 上數(shù)據(jù)的異質(zhì)性指數(shù)級(jí)降低,從而使得數(shù)據(jù)的可利用性變得更高。
除了鏈上數(shù)據(jù)以外,還有很多項(xiàng)目在嘗試將鏈上數(shù)據(jù)與鏈下數(shù)據(jù)進(jìn)行打通,這類項(xiàng)目可以看作為 “鏈改” 型項(xiàng)目。
類型分類有:
Web2 數(shù)據(jù)主權(quán)賦予與交易市場:Itheum、Navigate、Swash 和 Phyllo 等。這類項(xiàng)目主要是將傳統(tǒng)互聯(lián)網(wǎng)數(shù)據(jù)與鏈上數(shù)據(jù)相結(jié)合,希望把 Web2 與 Web3 之間的信息交互打通,常見做法是將 Web2 數(shù)據(jù)導(dǎo)出再導(dǎo)入指定數(shù)據(jù)池或者直接綁定傳統(tǒng)互聯(lián)網(wǎng)社交賬號(hào)等等;
企業(yè)數(shù)據(jù)共識(shí):Authtrail,該項(xiàng)目通過與企業(yè)內(nèi)部數(shù)據(jù)庫進(jìn)行整合,加入共識(shí)層從而做到企業(yè)內(nèi)數(shù)據(jù)的防篡改與可追蹤等;
鏈上與鏈下數(shù)據(jù)組合:Space and Time,該項(xiàng)目和 Authtrail 一樣會(huì)做鏈下數(shù)據(jù)庫的整合,但無共識(shí)層,更多是鏈下與鏈上數(shù)據(jù)的共同計(jì)算,此外 Pool 也在做類似的事情;
Web3 數(shù)據(jù)的使用范式和 Web2 存在明顯的不同,其主要在于數(shù)據(jù)聚集在一起的方式,即不同類型的數(shù)據(jù)其存儲(chǔ)、索引、提取、整合和利用的方式都會(huì)存在差別。根據(jù)前文的分類,這里做一些簡單的總結(jié):
公開數(shù)據(jù):包括《網(wǎng)絡(luò)安全標(biāo)準(zhǔn)實(shí)踐指南 – 數(shù)據(jù)分類分級(jí)指引》分類中的公共數(shù)據(jù)和部分法人數(shù)據(jù)。作為公共產(chǎn)品,是可以被公開挖掘價(jià)值的數(shù)據(jù),接入無需許可,但可以追溯用戶所有權(quán),從而追溯空投分潤,典型的例子是鏈上數(shù)據(jù)和存儲(chǔ)在去中心化存儲(chǔ)上的非加密應(yīng)用數(shù)據(jù)(如用戶帖子、點(diǎn)贊和評(píng)論等)。其使用最重要的上游支持是索引應(yīng)用,如 The Graph,或 Web3 原生數(shù)據(jù)庫的應(yīng)用,如 Tableland。
私密數(shù)據(jù):包括《網(wǎng)絡(luò)安全標(biāo)準(zhǔn)實(shí)踐指南 – 數(shù)據(jù)分類分級(jí)指引》分類中的個(gè)人信息和部分法人數(shù)據(jù)。作為需要加密存儲(chǔ),且需要一定隱私權(quán)限配置的數(shù)據(jù)類型,其接入有許可,不可被公開獲取,若存儲(chǔ)在去中心化存儲(chǔ)和區(qū)塊鏈上,則需要可權(quán)限配置的加密存儲(chǔ)?;蛲ㄟ^其他手段,如 ZK、MPC 和 TEE 等隱私技術(shù)手段保護(hù)。其使用最重要的上游支持是數(shù)據(jù)庫應(yīng)用,如 Kwil 和 Ceramic 等。
2鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。