今天小編分享的财經經驗:2023,大數據交易所的“集體焦慮”能解嗎?,歡迎閱讀。
文 | 潘程
編輯 | 真梓
01
大數據交易的變局與期待
2023 年,大數據合規交易的熱鬧似乎還在繼續。
最近,北方大數據交易中心在天津揭牌成立,嘗試通過一種 " 新的知識數據產品 " 在垂直領網域進行變現;而貴陽大數據交易所則與南方電網及相關技術方合作,希望通過電力數據與產業數據融合,為金融機構提供決策輔助等支持;廣州數據交易所則上線了集成式算力資源共享平台,面向 16 個重點行業密集發布近 40 款數據產品。
從這波操作中不難發現,曾經在各細分領網域中建樹不多的數據交易所(中心),在持續找尋突破。
其實在 2021 年左右,國内數據交易所就如雨後春筍般出現。產生這一現象的首要原因,與近幾年密集發布的政策有關。
2020 年 4 月,中央檔案《中共中央國務院關于構建更加完善的要素市場化配置體制機制的意見》正式将 " 數據 " 劃歸為第五大生產要素;2022 年 12 月," 數據二十條 " 進一步明确了國家将建立合規高效、場内外結合的數據要素流通和交易制度;今年 3 月,國家數據局的組建,則将主要職責設定為負責協調推進數據基礎制度建設等。
而今年還有一個更大的不同,便是随着 AI 大模型爆火," 數據 " 的熱度正不斷攀升。
《中國人工智能大模型地圖研究報告》統計顯示,目前國内已經發布了 79 個參數規模在 10 億以上的大模型。而且有研究團隊認為,在 AI 三要素(算法、算力、數據)中,數據是直接影響大模型在垂直行業落地效果的關鍵。
北京、深圳也已陸續發布 AI 相關支持政策。
5 月 30 日,北京市提出将 " 加強公共數據開放共享 "、" 推動公共數據與市場化數據平台對接 " 等作為主要任務之一;5 月 31 日,深圳市強調将 " 培育高質量數據要素市場 "、" 研究出台數據要素市場培育政策措施,進一步做大深圳數據交易所交易規模 "。
據 36 氪不完全統計,從 2020 年 4 月至今全國各地新成立的大數據交易所(中心)已有 20 餘家。它們紛紛将重點投向解決此前數據交易過程中數據安全難保障、場内交易難持續、撮合模式附加值太低等困境。
但過去幾年的實踐表明,從根本上破除數據交易中的一系列難題并非易事。
02
大數據交易所的集體焦慮
對數據交易所而言,探索出成功的市場化經驗是一直以來的目标。
2015 年 4 月,貴陽大數據交易所作為全國第一家交易所,曾被寄予厚望。彼時,在貴陽市政府的支持下,貴陽大數據交易所确定了 " 布局全國 30 家交易中心 " 的戰略,并以 " 匯集 1 萬家大數據交易會員、每年數據清洗交易量 1 萬 PB、大數據交易年總額 3 萬億、圍繞交易所平台的創業公司超過 1 萬家 " 作為中長期目标。
貴陽大數據交易所高管甚至暢想," 如果有一天,數據的交易體量非常大了,也許會跟證券、期貨等相媲美。"
而事實上,貴陽大數據交易所的實際交易額與曾經定下的目标相差了 2000 多倍。
今年 5 月 27 日的一組最新數據顯示:貴陽大數據交易所累計集聚 " 數據商 "" 數據中介 " 等市場主體 589 家,上架交易產品 1017 個,累計完成交易 776 筆,累計交易額達 13.87 億元。
或許,貴陽大數據交易所的經歷已經說明理想與現實之間的差距,那是用八年時間都較難彌合的。
最先,貴陽交易所也曾探索過交易傭金制,但很快便遇到交易規則問題。
由于場内數據交易在 2015 年還是一個新鮮事物。它所具有的 " 新鮮、低頻 " 特點,再疊加當時數據确權難、定價難,市場交易主體互信難、入場難、監管難等一系列痛點,導致交易所很難從交易傭金(按單次交易金額收取傭金)的模式中獲得利潤。
于是,貴陽大數據交易所在 2016 年切換成了 " 增值式交易服務模式 ",即交易平台跳出中間人身份,部分承擔數據清洗、數據标識、數據挖掘、數據融合處理等數據服務商的職能和角色。但在一些觀點看來,這一定位與眾多數據科技公司的功能重合,導致交易所始終沒有獨特性。
其次是數據質量和數據產品形态問題。早期不少數據產品的數據來源復雜,有政府公開數據,有企業内部數據,也有網絡爬蟲數據等。這些數據質量參差不齊,導致相應的數據產品質量不高且難以标準化。
數據產品的形态在多年内也進展不大。即便當前已是 2023 年,但市面上的主流產品依然以數據集、數據包以及數據報告為主,輔以數據服務和數據工具,產品形态相對簡單、溢價空間較低。
比如貴陽大數據交易所的數據產品,就包含數據集、離線數據包、數據服務等,在此基礎上又疊加了算力和算法模型的相關產品;深圳數據交易所的數據產品則有 API 數據、加密數據、數據集、數據分析報告、數據應用程式等,在此基礎上又增加了數據服務和數據工具兩大類;上海數據交易所的產品也以數據集、數據服務兩大類為主。
此外,數據安全問題依然嚴峻。
最新的《2023 年 Q1 數據資產洩露分析報告》顯示,"Q1 發生近 1000 起數據洩露事件,涉及 1204 家企、38 個行業,黑產的數據交易主要集中在更加隐蔽和便利的匿名社交平台。" 而未來,各地的數據交易所能否在安全問題上把好關,仍是個長期挑戰。
03
新模式,仍在路上
要解決上述難題,如今各家的探索還處于起步階段。
2022 年,深圳交易所通過引入隐私計算技術,開啟探索數據要素的安全流通。深圳數據交易有限公司副總經理王騰曾透露,要 " 運用隐私計算、區塊鏈等關鍵技術,将有效限制敏感數據被無限復制,防止數據洩露和濫用,增強數據的共享意願 "。
上海數據交易所則把視野投向國際市場,并于近日公布數據出境安全評估案例,通過在國際板中組織全球的合規數據產品流通交易,為國際企業的 " 引進來 " 和國内企業的 " 走出去 " 服務。
而北方大數據交易中心,則表示自己試圖帶動垂直領網域中交易三方(供給方、需求方、平台方)共建共享生态的方式,将數據轉化為資產并讓數據產品自然留存到北數的平台進行交易。
在近期的一次交流中,北方大數據交易中心(天津)有限公司總經理李基亮向 36 氪介紹,這個模式可以将北方大數據交易中心理解為生态中的 " 中間人 " 角色,它既能夠了解數據需求方的實際需求,并提供相關咨詢服務,還能帶着具體需求幫助客戶進行 " 數據尋源 ",鎖定生态中真正有能力提供相關數據價值的 " 賣方 ",接下來交易中心會通過隐私計算與大模型技術的加持,生成 " 知識數據產品 ",并讓知識數據產品的交易動作自然停留在該平台上進行。
整個過程,将最終形成一條 " 數據資產化 - 數據知識化 - 知識服務化 - 數據貨币化 - 業務智能化 " 的完整數實融合交易鏈。
圖注:北方大數據交易中心的 " 數實融合交易鏈 "
從中不難看出,北方大數據交易中心在連接供需雙方中,正試圖擺脫簡單的 " 撮合者 " 角色,通過引入數據交易前期的免費咨詢服務、數據交易中期的數據尋源服務以及數據交易中後期的數據知識產品 " 加工 " 服務,向供需雙方強調:" 買方和賣方都離不開我 " 的理念。
在李基亮的設想中,一旦買家離開 " 北數 " 也許并不能真正了解自己的需求,以及就算知道需求也未必能精準尋找到有優質數據的賣家;一旦賣家離開 " 北數 " 則有可能沒有辦法将自己的數據 " 產品化 ",更無法确保自己的一份數據可以通過生成不同客戶需求的產品,持續產生收益。
這樣看來,北方大數據交易中心的 " 市場化 " 思路已初步形成,但就目前行業狀況,落地或許也是場長期攻堅戰。
其中," 垂直領網域生态圈 " 能否成功搭建是決定成敗的關鍵。具體而言,垂直領網域生态圈中的數據質量、數據產品授權、數據產品效果等細節均是重要影響因素。
而在數據質量方面,垂直領網域生态圈中數據大戶非頭部企業莫屬,現階段雖然有 " 數據入表 " 的政策鼓舞,但大部分頭部企業的數據治理工程還在提升的路上。
在數據產品的授權方面,龍頭企業是否同意由 " 北數 " 進行產品化更新,不僅考驗着 " 北數 " 的資源拓展與合作能力,更對北數的安全技術、產品附加值等方面提出更高要求。
在數據產品的效果方面,由于北數剛剛成立,具體的知識化產品效果如何仍有待時間驗證。
結尾
一批又一批數據交易所的市場化探索,正呈現出業務逐步 " 做重 " 的趨勢。比如,參與方似乎都在探索利用技術解決數據交易的安全性問題;再加上通過對大數據的 " 再加工 ",如形成數據報告、知識數據產品等,提高數據產品的附加值;通過引入更豐富的行業生态角色,拓展數據的價值空間。
但數據治理動力不足、交易中心附加值驗證難度高、數據產品效果不确定等問題,仍需要時間給出答案。