生活中处处有网络模型的存在,从传染病的传播到网络中站点连接,都可以抽象成一张张网络,将不同的节点连接起来。这篇将走进网络的基本结构,帮助大家理解一些生活中的现象。

网络的基本术语

网络是由节点组成的。每一个节点都可以通过边的连接到达另一个节点,这两个节点互为邻居。如果从一个节点可以到任意一个节点,我们称之为连接的网络。

在无向网络中,我们对于每个节点的连接数可以定义为节点的度(degree)。度分布可以告诉我们某个节点是不是比其他的节点连接的更多。

路径长度是指两个节点中的最短路径长度,与度成反比。当增加边的时候,就缩短了节点之间的平均长度。介数是指通过该节点的最小路径的百分比。在社交网络中,介数得分高的人掌握更多信息并且拥有更多权力。

最后一个基本术语是聚类系数,这个统计了一个节点的邻居们互相连接的比例。例如,一个人有10个朋友,这些朋友可以组成45个对。如果在这45个对当中,有15个对本身也是朋友,那么这个人的聚类系数就等于1/3。如果所有这45对都是朋友,那么这个人的聚类系数就等于1,这也是最大的聚类系数。整个网络的聚类系数等于各个节点聚类系数的平均值。

下面用中心辐射网络和地理网络举个例子:

中心辐射网络是所有节点和中心节点相连,但是都不互相连接。其基本的统计术语也比较好理解。

地理网络是每个节点都连接到位于它右侧和左侧的两个节点。每个节点具有相同的度,都是4。由于网络是对称的,所以每一个节点的介数也是相同的。这里一共12个节点,可以组成 12*11/2 = 66 个邻居对。其中一个节点是有6对邻居经过其是最短路径,所以介数是1/12。每个节点都有4个邻居,可以构成6个对。在这6个对中,恰好有3对是相互连接的:直接靠着该节点的左右两个节点分别连接到再外一点的节点,并相互连接。因此,聚类系数等于1/2。

常见的网络结构

常见的网络结构有以下几种:

  • 随机网络
  • 地理网络
  • 幂律网络
  • 小世界网络

随机网络就是边和节点的连接都是随机的。如果想检验这个网络是不是随机网络,可以通过蒙特卡洛的方法生成很多随机网络之后把这个网络代入,进行标准的统计检验,以确定是否接受随机的假设。

地理网络就是一个节点和自己的东南西北节点相连接,一个特点就是每个节点的度比较低。

幂律网络就是度的分布是幂律的。少数节点的度很大,同时大多数节点的连接则很少。

小世界网络则是结合了地理网络和随机网络的特征。可以从地理网络开始,然后重新安排节点之间的边。如果重新安排边的概率是1,那么就是随机网络,如果概率是0,就是地理网络。如果概率在0和1之间就会得到小世界网络。这是小集群通过随机连接到其他集群的网络,社交网络类似于小世界,每个人都有一些关系紧密的朋友,以及一些关系比较远的随机的朋友。

网络的应用

这里介绍一个友谊悖论:

如果网络中任何两个节点的度不同,那么平均而言,节点的度会低于其相邻节点。换句话说,平均而言,人们的朋友比他们自己更受欢迎。

举个极端一点的例子,在辐射网络中,12个人中的每个人都只有一个朋友,1个人有12个朋友。平均来说,所有人只有不到两个朋友,然而同时每个人的朋友都有超过11个朋友。

友谊悖论适用于任何网络:电子邮件网络、学术引文网络、银行网络和国际贸易网络等。平均而言,一篇学术论文引用的参考文献被引用的次数比这篇文章本身更多;与一个国家的贸易伙伴进行贸易的国家数量,要比与这个国家进行贸易的国家更多;食物网络中与单一物种相连接的多个物种的连接比该物种自身更多。

友谊悖论的逻辑可以扩展到任何与朋友数量相关的性质。如果活跃、快乐、聪明、富有和友善的人平均而言会拥有更多的朋友,那么一个人的朋友平均来说会更活跃、更快乐、更聪明、更富有、更友善。

另外一个应用就是6度分隔理论,也就是地球上的任何两个人都可以通过6个或更少的朋友联系到一起。。这个术语源于美国社会心理学家斯坦利·米尔格兰姆(Stanley Milgram)在20世纪60年代进行的一项实验。米尔格兰姆向内布拉斯加州奥马哈市和堪萨斯州威奇托市的296人寄出了一些包裹,那些包裹最终需要转寄给在马萨诸塞州波士顿市的一个人。收到包裹的人必须遵守相同的规则:所有参与者只能通过邮政系统将包裹寄给他们认识且他们认为更有可能认识那个波士顿人的人,并附上同样的指示。每个参与实验的人都要在一份记录路径的名册上签名,并邮寄明信片给研究者,以便研究者可以跟踪链条上的断点。最终,有64个包裹抵达了波士顿。这些抵达波士顿的包裹所经历的平均路径长度略小于6,因此就有了“六度分隔”这种说法。

在这里,我们可以构建了一个简化版的小世界网络,以便直观地理解六度分隔理论。这个小世界网络假设每个人都有一个由若干个圈内好友构成的小群体,这些人彼此认识,而且每个人都拥有不属于这些圈内的朋友,我们把这些圈子外的朋友称为“随机朋友”(random friends)。可以看上图,某人(用黑色圆圈表示)有5个圈内好友和两个随机朋友。它还显示了这个节点的朋友(用浅灰色圆圈表示)的部分“朋友圈”。

这些随机朋友也可以认为是一种弱关系,他们可以将你连接到其他群体的人。我们的弱关系,也就是网络中的随机朋友,由于连接了具有不同兴趣和信息的社区,从而发挥了重要的信息作用。因此,社会学家很强调弱关系的力量。

小结

通过研究网络的一些基本特点,可以帮助我们对于生活中的一些现象进行合理的解释。