今天小编分享的互联网经验:虚拟币犯罪遇上“克星”,这家公司将机器学习模型用于区块链合规,欢迎阅读。
图片来源:视觉中国
【本文来自钛媒体特色栏目「快公司」】
"AI 诈骗 " 冲上热搜,又掀起一轮对新技术的担忧。诚然,技术发展不仅为创新者带来机遇,也让恶意使用者有了可乘之机。每当新技术更迭,往往会出现新一轮犯罪技术、犯罪形式的更新,火热一时的区块链技术也不例外。
相较于监管较成熟的 web2.0,web3.0 中利用区块链进行犯罪资金转移不受时间、空间限制,且隐蔽性很强,打击难度被迫更新。区块链生态还未尽善尽美,公安机关打击虚拟币犯罪缺乏互联网、金融专业知识,存在数据处理与使用等技术门槛,需要突破身份识别、资金追踪、数据统计分析等难题。
在国内围绕实现区块链自主可控的热点话题下,业界也一直赋予区块链安全以关注。区块链安全公司中科链源某高管告诉钛媒体 App,目前区块链安全主要关注点为区块链中的合规安全,与以往安全赛道中的数据安全、网络安全专注技术打击并不相同。他们主要通过 TO G 业务,将技术能力产品化,帮助公安、执法机关在涉虚拟币犯罪的全流程中进行打击。
网赌如何狂飙区块链?
中科链源 SAFEIS 研究院根据公开判决文书统计,2022 年,中国涉虚拟币犯罪案件金额高达 348.49 亿元人民币。从犯罪活动的逻辑来看,现有的涉虚拟货币案件主要是五大类型:网络赌博和色情直播类、诈骗和盗窃类、传销类、洗钱类和黑灰产类。这其中,网赌则是典型的涉虚拟币犯罪类型,也是公安机关的重点打击对象。
其实网赌一词并不新鲜,这基本是二代互联网时期普遍存在的赌博方式。但网赌为什么要从 web2 发展到 web3 的区块链?原因离不开区块链本身。
金融结算是区块链中重要的应用场景之一,网络赌博将虚拟币作为独立的支付结算方式,高频出现在上游犯罪活动中。此外,区块链的去中心化、匿名性等技术特性,也成为了犯罪分子的违法漏洞。
" 去中心化 " 即去除了中心管制,第二代互联网中的第三方管理机构或硬體设施不复存在,所有数据都掌握在用户自己手中——用户拥有了对个人数据的控制权。如此,对比以往公安机关通过银行等掌握用户数据的第三方机构就能调取相关犯罪信息,进行资金追踪、IP 地址追踪,在区块链上则根本行不通。
" 匿名性 " 的技术特点又让犯罪分子将身份保密。区块链采用非对称加密的技术,存储在区块链上的交易信息是公开的,但是账户身份信息是高度加密的,只有在数据拥有者授权的情况下才能访问到。在区块链上,各区块节点的身份信息不需要公开或验证,信息传递、资金往来均可以匿名进行,对违法者的身份识则别成为难题。
通常,完整的网赌环节为 " 注册 - 充值 - 赌博 - 退筹 ",区块链中的网赌也是如此。但从案情分析的角度来看,在区块链上则会产生大量的入境地址、归集地址、下游地址等,这也是警方查案所需的重要信息。
具体来看,首先,犯罪分子通过将虚拟币打入网赌集团提供的钱包来获得相应筹码,这里会产生大量的入境地址;其次是进行赌钱,最后再结算,这一过程中产生了归集地址。整个流程中,众多的入境地址会流入归集地址,在归集地址后又形成许多下游地址。下游地址之后的步骤会涉及到变现,而变现需要经过中心化的交易机构,犯罪分子的真实身份信息则由此暴露。
中科链源高管讲解到:" 入境地址是案件突破的线索,归集地址则是网赌犯罪集团的起点。" 公安机关会根据这些线索情报进行立案,而这些线索等都需要通过技术手段进行数据挖掘、数据分析与处理。
数据底座与机器学习来帮助案件侦破
链上的资金流转会和很多区块链钱包关联,相应的,案件侦破流程中需要用到的入境地址、归集地址、下游地址等信息,必然会形成海量难以处理的数据,而海量数据中真正有用的信息还需要通过主动挖掘才能获得。
如何获取大量数据形成数据积累?如何对海量数据进行整理分析、筛选出办案所需要的有用信息?中科链源自主研发了一个服务公司内部的数据中台—— SAFEIS 安数,主要提供大数据技术、分析计算,以及机器学习的能力。
钛媒体 App 了解到,数据来源的竞争壁垒一直存在,中科链源主要有两种数据获取方式。其一是自己建设全节点,将从全节点上的数据提取出来解析清楚进行使用。中科链源高管表示,全节点上获取的数据在解析之前是无法直接看懂的,解析的工作则考验着技术团队和数据团队对于储存的这些数据的底层理解。其二是接入了第三方——做基建的数据公司的底层数据。但这些数据获取到之后,根据实际需求进一步的取哪些数据,怎么去加工,以及如何应用,都需要不断研究探索。
截止目前,中科链源的数据覆盖了以太坊、波场、币安智能链等三条犯罪行为最集中的链;此外,从区块链诞生之初到现在百亿级别的交易信息中,中科链源积累了大概十亿级别的交易地址的标签,通过这些标签能够获取合约地址、交易所地址,从而获得犯罪分子的真实身份信息。
而在积累了海量数据之后,SAFEIS 安数同时借鉴行业专家的业务经验,通过机器学习模型,挖掘海量数据中的隐含信息,最终训练成具备判别能力的模型,辅助专家做出更加迅速精准的业务判断。
与 GPT 所使用的 LLM 大语言模型不同,中科涟源机器学习模型更多是基于图计算。根据链上的数字等数据信息,机器学习的模型会用机器去看几万个地址,看几十万个交易记录,从而学习不同类型犯罪模式的特征,以方便未来高效的去判定这些模式。这些模型也会随着犯罪手法的更新而不断更新,除了网赌的模型外,中科链源还有针对传销的模型,针对色情网站的模型等。
基于服务于公司内部的 SAFEIS 安数,中科链源叠加了 TO G 的产品 SAFEIS 安士,将安数中的海量数据包装成用户看得懂的形式,在产品页面上直观呈现为网状图。
据了解,机器学习模型在安士中也有体现,其形成了智能查找的工具,通过点击某个节点,可以查找从这个点出发的下面的资金流向,判断哪些节点和这个点的关系较大,有助于警方高效判断。通过机器学习模型,能将原本需要几天时间才能完成的工作量,缩短至十分钟到二十分钟。此外,中科链源也在设想基于 GPT 推出问答的智能助手,进一步降低使用的门槛,提升使用效率。
中科链源高管告诉钛媒体 App,目前的行业共识都更加注重安全。" 以前的舆论观感不太好,阻碍了大量的用户进入行业,那么大家现在也越来越重视安全,有很多公司开始做这块的业务,我们希望大家能够一起把整个行业的安全做起来,这样用户真的可以放心的,不要被割韭菜,不要被偷窃,不要被钓鱼,安心在(区块链)上面使用产品。"
合规的生态搭建好了,才会有更多资本与机会涌入区块链赛道。在战略地位上,中科链源对 SAFEIS 安数还有分阶段的构想:第一步,短期内继续在公司内部发挥数据中台的作用,为 G 端、C 端的需求提供支持;第二步,基于数据能力、机器学习能力,让 SAFEIS 安数成为独立自负盈亏的,能够孵化新产品能力的公司;第三步,是远期来看,能够形成 API 接口去提供给需要这个能力的公司,一起搭建生态。未来是否能如中科链源所愿,还有待时间验证。(本文首发钛媒体 APP 作者 | 贾雨微 编辑 | 秦聪慧)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App