龚鸣:非基于KYC的区块链反洗钱技术探讨
作者:龚鸣
本文以美国联邦调查局调查取缔以比特币买卖非法麻醉品的非法黑市“丝绸之路”为切入点,通过捕获交易信息模式、构建一套图表分析框架来追踪集合用户活动,试图利用区块链本身的特性,来建立一种非基于KYC思想的全新反洗钱系统。
反洗钱是指为了预防通过各种方式掩饰、隐瞒毒品犯罪、黑社会性质的组织犯罪、恐怖活动犯罪、走私犯罪、贪污贿赂犯罪、破坏金融管理秩序犯罪等犯罪所得及其收益的来源和性质的洗钱活动。常见的洗钱途径广泛涉及银行、保险、证券、房地产等各种领域。反洗钱是政府动用立法、司法力量,调动有关组织和商业机构对可能的洗钱活动予以识别,对有关款项予以处置,对相关机构和人士予以惩罚,从而达到阻止犯罪活动目的的一项系统工程。
从全球来看,反洗钱毫无疑问是金融监管中非常重要的工作。但随着区块链技术的广泛应用,以比特币为主的数字货币,以及越来越多基于区块链技术的数字资产开始出现。而类似于比特币这样的数字货币,尽管在绝大多数国家都没有将其视为法币,但是的确已经在全球中获得越来越多的使用场景。并且由于其设计的架构具有一定的匿名性,经常被认为可能会与违法犯罪行为相关。而目前,全球金融监管部门在试图对比特币等相关数字货币进行监管时,也主要将监管对象设置为比特币与法币的交易场所,即数字货币交易所。显然,在目前全球绝大部分交易所已经纳入到监管体系中,只要比特币和法币进行相互交易,只要交易所能够严格地执行KYC(Know your customer,充分了解你的客户)政策,就能够对相关交易对象进行追踪。而在最近央行对于中国比特币一些交易所的规范当中,也是把严格执行KYC政策作为主要规范的内容。但是,如果比特币一旦不和法币有任何关联,仅仅是数字货币之间进行交易,那对于监管机构而言,就往往难以进行追踪。
事实上,这是许多金融机构对数字货币敬而远之的主要原因之一,如果不能够对其进行有效的监管,包括不能将其纳入现有的反洗钱系统中,那一但数字货币大规模进入现有的金融体系,有可能带来巨大的潜在风险。所以,目前唯一的办法就是敦促交易所制定足够严格的KYC政策,来强制让数字货币接入到反洗钱系统中。但我们发现,随着越来越多的场外交易所出现,已经很难确保这些场外交易机构和场外交易者严格执行KYC。而另一个值得我们关注的是,在数字货币的世界,随着比特币市值越来越大,其价格相对于早期已经稳定很多了,很多交易已经不再需要法币的接入,交易双方都开始愿意接受和持有比特币。一旦数字货币的交易形成闭环,这对金融监管可能会带来更大的挑战。
考虑到基于区块链技术的数字货币尽管其所有的数据都放在区块链上是公开透明的,但其地址和持有人之间没有确定的关系,所以往往被认为具有很强的匿名性。一个人可以同时控制成千上万的地址进行交易,在一般情况下每笔交易都可以转换新地址来避免被追踪。曾经也有人提出“绿地址”(Green Address)这样的白名单方式,在一定范围内要求所有地址必须经过实名制单机才可以使用。但这种基于传统KYC思想的监管方案事实上很难执行,特别是如果监管仅仅只能局限在很小的范围内,这其实是让监管失去了其本身的意义。
所以也许我们可以利用区块链本身的特性,来建立一种全新的反洗钱系统。即完全放弃现有必须基于KYC的思想,而是通过区块链所有数据都在链上的特性,对所有链上的数据重新进行挖掘,通过建立一个多维度的数据模型来构建一个不基于KYC思想的全新反洗钱系统。
那如何从匿名的数据中获得我们需要的数据结果呢?目前我们主要是通过两层研究方法:(1)通过连接数字货币公钥及其真实所有人,在公共交易图表上加注解—明确的或者是通过统计得出;(2)在图表分析框架中运行加注了的图表来查找、总结已知及未知用户的交易活动。比如,我们将比特币交易图表注释系统分为两部分来呈现。首先,开发一套系统来搜集互联网上的比特币地址。其次,引入了一套机制,通过不完整的交易信息来匹配用户及其交易。例如,假设我们听到甲对乙说昨天中午转了100美元的比特币给乙,虽然我们不知道交易的具体时间(中午差不多是11:50到12:10),我们也不知道确切的交易数额(因为汇率一直在大幅波动),但是我们还是能够生成候选交易对以及相关匹配概率。
我们能够建立一套图表分析框架来追踪集合用户活动。例如,框架把2013年10月25日美国联邦调查局在事先不知道自己及非法黑市“丝绸之路”公钥的情况下没收了其资产这件事标注为“值得关注”的事件。在标注系统辅助下,就可以发现“丝绸之路”及真正用户之间的联系,通过将无数不相关的加密ID同某一真实用户联系起来,搜索所有公共信息渠道,就可以获得人们有意无意泄露的比特币地址信息。另外,通过“监听”某已知用户不严密的交易,比如在公开论坛截获这样的对话“乙,我是甲,我昨天中午给你转了价值100美元的比特币”,一旦分析出这一交易对,就能够获得交易双方的真实姓名以及一些大概的交易信息。
很多用户尤其是早期采用者都希望能够推动比特币成为主流,其中一个方法就是促进交易。比较常见的做法就是把比特币地址以签名形式负载邮件或者论坛发言后面。尤其在论坛里,很多社区贡献者,如提供新的挖矿软件或者比特币入门教程之类的,会在签名栏留下比特币地址,希望得到帮助的人会给点小费。这个举动也给了我们线索,能够轻松地将用户信息同其在区块链中交易绑定起来。通过使用Scrapy套件索引来提取并分析论坛页面,然后写了一个爬虫程序,以广度优先的方式浏览bitcointalk.org网页,寻找带有比特币地址的签名。之后提取字符串并验证是否为合法比特币公钥(比特币地址有一个嵌入的总和检查码)来省去那些可能不会出现在区块链中的节点。
我们发现有大量论坛用户可以直接与交易表中的密钥对上。这里我们会分析要采集交易时间及价值相关信息并同实际交易匹配的方式。例如,如果我们偷听到甲告诉乙昨天中午转了100美元,那么就可以检测出在区块链中找到匹配交易的难度。假设昨天比特币对美元汇率波动在1美元以内,中午这个时间戳的误差在5分钟内,之后会得到一组候选交易来检测。参考每日市场价格,将美元换成比特币。之后,我们会检查99到101美元以及上午11:55到中午12:05区间内的所有交易。为了从该案例中得出普遍结论,我们可以检查区块链中的每笔交易,然后创建一个时间及美元价格窗口,通过改变数额来看其他交易是否满足这一较低的窗口标准。比特币越来越普及,在交易中使用的次数越来越多,因此将会出现更多符合某一美元数及时间标准的候选交易。
在上述案例中,可以确认甲的公钥,并且有1/10的把握他们的谈话发生在2012年3月。无论是通过指纹验证工具还是从网络来源搜查数据,都可以在区块链上标注出额外的用户确认信息。在之前的案例中,注释还会包括相关概率。
我们还会开发一套图表分析机制来揭开匿名用户的身份(从公共信息来源获得,比如论坛用户)以及比特币交易信息。
从区块链提取交易记录后,我们就可以构建交易图表了,从而让大家对比特币在公钥地址间流动的情况有个大概了解。更确切地说,交易图表是较直观的图表,其中节点显示了匿名个体或“实体”的公共地址,以及某一特定交易的直接区间边界(即从来源地址到目标地址)。由于来源地址和目标“实体”都可以随意为之后的每一笔交易生成新的公钥私钥对,所以公钥地址只会在交易图表中出现一次或少数几次。
通过交易图表,创建了一个代理图表,即用户图表。其中用户或实体就是在不同交易中采集到的公钥地址。我们把有多个输入项的交易都联系起来,看是否出自同一用户。然后就可以通过披露交易中出现的公钥地址组来创建用户图表。通过现有工具来创建实体/用户图表,其中极点代表现实中的用户实体,而边界代表交易来源用户与目标用户之间的交易。虽然有大量用户是追踪不到的,还是可以看到一些不同的活动及网络布局的,例如社区、某个实体以及大型交易。
我们发现,由于比特币交易在直接用户图表汇总展现出的本质,与搜索引擎直接产生的图表相似。大多数搜索引擎,如谷歌,都采用PageRank来进行网页重要性排名。从直观上看,算法会选择处理直接图表中的节点,因为这些图表最容易获得,或者先处理接收到足够多流量来表明其重要性的节点。我们决定采用类似于PageRank来标注确定最有关注价值的节点,并用图表中的用户来进一步调查其与已知论坛用户的联系。结果发现大部分用户是不相连的,说明这些节点并不重要,所以不值得追踪。但是通过BlockChain.info的一些比较流行的公钥地址,确定了其中一个实体节点有较高的输入及输率,它来自一家叫做SatoshiDICE的比特币赌博网页。
有一个事件关注度尤为高,那就是联邦调查局(FBI)的一个公开地址没收“丝绸之路”资金的事,联邦调查局通过445笔交易,没收了324个比特币。我们的图表算法提取了FBI这个地址,标注为非常重要的用户(页面排名高的节点)。这样可以验证我们的算法,看其是否正确挑选有特定关注度的节点,并且还能进一步调查这些排名考前的节点。
通过这一信息以及网上论坛搜索到的信息,我们还追踪了这些交易,来公开那些离“丝绸之路”节点不远的比特币论坛用户。这说明,比特币论坛中的用户可能和与“丝绸之路”有过直接交易的用户有过往来。随着“丝绸之路”的主谋落网,我们分析了其资产被没收前七个月的交易(从2013年3月25日到10月25日)。此外,我们发现多个比特币论坛用户与SatoshiDICE有过直接交易,说明他们可能在过去七个月间有过赌博行为。有趣的是,我们还发现论坛里有用户和维基解密有过直接交易。
图1显示了网页前几个节点以及首单边界,并且标注了网页搜索结果。其中有几笔值得关注的活动,包括某个已知的FBI地址没收了“丝绸之路”的比特币,这些活动都和排名考前的节点有关。
几乎,目前所有的反洗钱系统的基础都是KYC,至少是整个系统的大部分用户是纳入严格的KYC要求内的。而在一个完全无法实现KYC的场景中,我们其实可以通过大数据分析来实现这个全新的反洗钱系统。事实上,这样的非KYC反洗钱系统也可以应用于常规的法币反洗钱系统中。当然,到目前为止,基于区块链技术的数字货币和数字资产在整个金融体量中仅仅占有一小部分,但是在未来也许会变得愈加重要。而如何对其进行恰当的监管,特别是如何在不影响其发展的前提下,还能够及时防止出现任何潜在金融风险和违法犯罪行为,是整个行业必须面对并需要克服的难题。因为,这是区块链行业以及数字资产行业能够进行健康发展的前提。因此,在针对区块链上的大数据分析将会是一个非常重要的工作,也是需要金融监管与业界一起努力探索的主要方向之一。
(龚鸣为区块链铅笔创始人、北京区块链技术应用协会副会长。本文编辑/王蕾)