ChainNet: Learning on Blockchain Graphs withTopological Features

链网:在具有拓扑特征的区块链网络图上学习

摘要

       随着区块链技术与相关加密货币(如比特币)的出现,理解区块链网络背后的网络动态成为一个急需解决的研究方向。与股票和货币交易等其他金融网络不同,基于区块链的加密货币具有公众可以访问的整个交易图(即所有的交易都可以下载和分析)。最后带来的一个问题是:是否动态的交易网络能够影响底层加密货币的价格?但是我们发现一个标准的图的特征(比如交易网络图中节点的度的分布)可能并不能足以捕捉网络动态及其对比特币价格波动存在的潜在影响。相反,利用持久同源性工具从区块链网络中计算出来的拓扑特征在预测比特币价格动态方面表现出很好的效果。

       索引术语:区块链、比特币、持久同源性、图(网络)

一、导言

       最近比特币价格的上涨导致了关于比特币和加密货币的未来以及其对全球金融市场的潜在影响的激烈讨论[13]。一个有趣的方面,这些流行的加密货币(如比特币)的每笔交易都被记录在一个称为区块链的分布式公共账本上了。这些被记录的交易能被任何人访问和分析。此外,所有的交易能够被一张图表示,这张图称为“区块链图”。区块链图的存在带来了一些重要的问题,如: 区块链网络结构是怎么影响底层加密货币的价格?

       在本文中,我们通过提出表示区块链的图模式的方法来尝试解决这一问题:同时我们使用这一模式来构建用于比特币价格预测的机器学习模型。

       我们首先想到的是利用区块链中图的结构来提取传统图的特征,比如度分布、模体计数(motif count)和聚类系数(clustering coefficients),并在机器学习模型中使用这些图形特征,例如随机森林算法,以评估它们在价格预测中的效用。

       我们实验结果的证实了以前的研究(例如[8,12,16])所观察到的结果的正确性。交易数量、交易的数额以及它们与底层图形结构的关系,这些重要的数据并不能被这些一般图的基本特征捕捉。由于这些基本方法没有提供关于区块链动态网络图及其在加密货币价格上的影响的结论性见解,我们提出了由拓扑数据分析(TDA)启发的新技术,特别的是能够解释高阶相互作用的持久同源性。

       持久的同源性允许我们从区块链网络图中提取出来拓扑信息,并揭示了其功能背后的一些关键特性。最值得注意的是,持久的同源性捕获了多尺度层次的图组件之间的相互作用,而传统的分析方法在很大程度上是无法实现的。这种做法带来了以下重要好处:第一,我们在不同的维度上系统地解释了区块链网络图拓扑和几何结构的变化,无论是在交易模式还是相关的交易量(这一句不是很懂)。第二,通过计算一系列尺度值的拓扑特征,我们绕过了最优尺度选择问题,也就是说,我们系统地从区块链图中导出拓扑信息,并利用其的动态变化来对加密货币进行价格预测。第三,多尺度的方法允许我们有效地区分真正的拓扑特征和噪声特征,使用一个鲁棒性的方法,基于特征寿命的范围跨尺度值(third,the multi-scale approach permits us to effectively distinguish true topological feature lifespan across scale values)。此外,一些关于TDA在其他类型网络中的应用的研究表明,基于持久同源性的特征在网络分类和分割中优于传统的图特征(中间性中心性betweenness centrality、聚类系数和程度中心性)

       我们的贡献可以概括如下:

  • 据我们所知,我们是第一个在加密货币预测分析上使用持久同源性。此外,我们还将基于同源性的区块链拓扑特征与机器学习相结合,以预测比特币价格。

  • 我们引入了一个称为 Betti derivative(B导数)的新概念。 Betti derivative捕捉了发生在区块链网络图的拓扑结果的变化率。我们展示了 Betti derivative在比特币价格方面预测上的实用性。

  • 通过广泛的实证分析,我们证明了包含了我们提出的基于持久性同源性方法的机器学习模型能够显著地优于(即,在均方根误差方面高达38%的改进)过去只使用了过去的价格和标准(一般)特征(如交易总数)的模型。

  • 这个工作的扩展版本和我们的算法模型的详细解释可以在网上找到。

二、基于图的学习和拓扑特征

       问题陈述:令表示一组在比特币区块链上计算出来的特征。令表示观察到的数据,其中表示相对应的比特币的美元价格。在时间点t上,估计比特币的价格是,其中。我们为我们的研究问题提供了两种解决方案:graph filtration(FL)和Betti sequences。第一中方法基于图过滤。也就是说,我们通过增加比特币数量的阈值来过滤交易网络,并且创建网络的多个realization。然后,我们合并这个这些realization来训练一个模型。第二种方法使用拓扑摘要来捕捉Betti 序列和Betti 导数的持久特征。
       Betti 方法是基于严格的数学基础的代数拓扑和提供了一个多镜头的系统的观点,而图过滤是一种启发式,允许手动选择数量阈值和相关的过滤网络。下一步,我们将详细地介绍这两个方法。

A.学习图的表示
       我们首先介绍现有的区块链网络模型和解释他们的缺点。接下来我们描述我们的子结构模型的区块链图和提取图过滤特征。

       在一个典型的区块链网络中,例如比特币中使用的网络,多个地址的所有者可以将它们组合在一个交易中,并将这些coin送到多个输出地址。因此,比特币区块链中包含两种类型的节点:交易,和作为交易输入/输出的地址(如图1)。在我们的方法中,我们遵循[1]并构造了一个具有地址和交易节点的异构区块链网络图。

       使用这些输入和输出的地址,每一个交易代表了一个不可变的决策,该决策被编码成子结构。