【复杂网络】关于复杂网络中的动力学系统重构的文献资料整理( 三 )


1. 通用方法
目前,人们开发出的通用方法也有很多,但是它们基本上可以划分为如下几类 。我们将大体按照时间顺序进行罗列、综述 。
1. 相关性方法
所谓的相关性方法就是只根据相关性来度量构建网络 。例如,有多个时间序列,那么,可以计算任意两个时间序列的相关性,这就构成了这两个时间序列(节点)之间的一条连边 。
比较早地运用相关性建立网络的文章可以参考这篇的文章:A Gene-forof,它讨论了3182种从人类、果蝇、蠕虫和酵母菌中通过测序得到的基因表达的数据所构建的相关性网络 。其中,有22163种这样的共表达关系是在进化中被保留的,这意味着这些基因对传递了一种选择的优势,它们是彼此功能相关的 。
A Gene-forofM. ,Eran Segal, . (2003)
在经济和金融领域,相关性也是一种常用的方法,例如,文章"in"利用股票时间序列构建了一个加权网络,然后再利用最小生成树的方法,获得股票之间的层级结构信息 。
inR. N. .TheB -and(2012)
除此之外,也有利用平面图的方式来将关联矩阵转换成网络的方式:
A tool forinM. , T. Aste, T. Di .ofofof(2005)
另外,当考虑到相互影响的延迟效应的时候,也可以考虑用两个时间序列的延迟相关性 。比如,我们考虑雾霾从A地传播到B地,那么如果仅仅计算A(t)和B(t)这两个时间序列,它们的相关性也许并不大 。但是,如果我们计算时间序列 A ( t ? τ ) A(t-\tau) A(t?τ)与 B ( t ) B(t) B(t),那么它们的相关性就会很高 。这是因为雾霾的传播需要时间 。
下面的文献就计算了这种延迟相关性,它的思路就是暴力搜索所有可能的 τ \tau τ的取值,从而选择让两个时间最大的一种 τ \tau τ,同时如果相关性足够大,就给出相应的连边:
Time- cross-stock : AofL. , J. Kerte ?sz, K. Kaski.E (2002)
下面这篇文献给出了在快速变化噪声的情境下,如何根据时间延迟相关性来重构网络:
ofwith time-in theof fast-Z. Zhang, Y. Chen, Y. Mi.E (2019)
这篇文章利用一种时间对齐的方法来重构短时间序列之中的因果联系:
Innerforfrom Short TimeS. , A. , J. .(2011)
2. 基于信息论的方法
与相关系数的方法相比,利用信息论提供的指标是一种更好的度量相关性的手段,因为相关系数只能反映两个变量是否线性相关,而这些信息论指标则能够应对更一般的情形 。
比如,常用的一种方法是互信息( ),它提供了相关性的另一种度量 。
互信息定义为: I ( X ; Y ) = ∑ y ∈ Y ∑ x ∈ X p ( x , y ) l o g ( p ( x , y ) p ( x ) p ( y ) ) I(X;Y)=\sum_{y\in Y} \sum_{x\in X}p(x,y)log(\frac{p(x,y)}{p(x)p(y)}) I(X;Y)=y∈Y∑?x∈X∑?p(x,y)log(p(x)p(y)p(x,y)?)
这篇文章用互信息的方法定义了全球气候网络:
Theof the[2009]J. F. , Y. Zou, N. , J.
另外一个常用于时间序列的方法是传递熵( ),它能够刻画引入另一个变量对预测当前变量的贡献,因此它可以在一定程度上衡量因果联系 。
在信息理论中,信息是根据不确定性定义的,这种不确定性是根据等式 H ( X ) = ? ∑ x ∈ X p ( x ) log ? 2 p ( x ) H(X)=-\sum_{x\in X}p(x)\(x) H(X)=?∑x∈X?p(x)log2?p(x)中定义的概率来衡量的 。回顾熵和互信息的概念,从它们来看,可以建立与方差和协方差的统计量度相似的关系 。方差和熵是多样性的度量,而协方差和互信息建立了变量之间的关联程度 。从这个类比来看,我们注意到与协方差或相关性相同,互信息不能暗示变量之间的因果关系,而是一种对称度量,揭示了相互的影响 。
andareof , whileandtheof. From thiswethat the same asor ,can’t imply a cause-,it is athat.