数学家和物理学家在研究网络的时候,为了抓住本质,通常进行一定的抽象,表现在既不关心节点的特定物理位置、大小,也不在意边的长短、曲直、相交与否,只关心节点和节点间是否相连。
例如,欧拉在解决哥尼斯堡七桥问题的时候,虽然1736年讨论长短大小的几何学是主流,而不考虑长短大小、不牵涉量计算的情形几乎没人研究,但他却撇开研究对象的长短、大小、面积、体积等度量性质和数量关系,把2座小岛和河的两岸分别抽象成4个点,而把7座桥抽象这4个点之间的连线,开创了拓扑研究的先河。
当人们把网络抽象成这种不依赖于节点的位置、大小和边的具体形态,所得到的性质就成为网络的拓扑性质,相应的结构称作网络的拓扑结构。
在自然界和人类社会中存在各种各样的网络,像作为基础设施的铁路、公路、航空等交织而成的交通网、电力网,近年来广泛应用的技术网络万维网、对等传输(P2P)网络、互联网等。一个典型的网络由许多节点和连接节点的边组成,通常节点代表真实世界中的个体或组织,而它们间的关系用边来表示。
例如,在互联网中,可以用点来表示自治系统(AS autonomous system),边来表示其间的连接关系,即形成自治系统级的网络拓扑;如果把互联网中的路由器看成节点,而路由器间的连接关系看成边,这样就形成了路由器级的互联网拓扑。
网络结构分析在社会网、技术网、生物网的研究和实践中都已发挥了重要作用,互联网就是一个典型的例子。作为一个真实网络,互联网从最初的4个节点,发展成为当今世界的信息基础设施,其应用的深入发展和无处不在的广泛性深刻地改变了人们的工作、生活和学习方式,己成为一个名副其实的具有复杂结构的巨大系统。
互联网拓扑结构具有“健壮而又脆弱”(robustyet fragile)的双重特性,在不同尺度上,其形成机理不同。在自治系统级层面上同时表现出对节点随机失效的健壮性和在有意攻击情况下,只要移除少数重要节点,全网就会招致瘫痪,即表现为十分脆弱。这种脆弱性,也被称作阿基琉斯之踵(Achilles’heel),其根源在于度分布的不均匀性。
但在路由器级拓扑上,表现为互联网可以有效容忍在设计时考虑到的不确定因素,具有健壮性,而对设计时未被考虑的不确定因素(如IP前缀劫持、分布式拒绝服务)变得非常脆弱。其双重特性是由于考虑到网络设计与优化等因素形成的,根源不在网络的度分布。
近几年随着国内外互联网行业发展迅速,许多人从中发现商机,有不法分子利用互联网的脆弱性来攻击网络从中获取利益,基于此种社会现状,如何提高互联网络的抗攻击性能成了关注的重点。早些年对互联网拓扑的研究很少有,但是随着互联网结构越来越庞大,近几年随着对互联网拓扑结构的研究也在不断深入。
在今年3月22日发表的一篇文章中,加州大学圣迭戈分校(UCSD)的计算机科学家们,针对全球75个市场区域开展了一线全面的大规模研究。
研究一作、UCSD 计算机科学专业博士 Alexander Gamero Garrido 表示:“我们对互联网的拓部结构开展了研究,以期找到基础设施遭到破坏时的最薄弱环节”。结果发现,世界上约 1/4 的互联网用户都依赖于易受攻击的基础设施,远超研究前的预估。从区域分布来看,许多面临风险的市场区域都位于南半球,大致包括拉美、亚洲、非洲、以及大洋洲。
研究配图 :影响因子
世界上不同地区的互联网连接结构不尽相同,比如以美国为代表的诸多发达国家,就有大量互联网接入服务提供商(ISP)竞相为广大用户提供服务。
边界网关协议(BGP)中未观察到的路径
这些网络相互交织、支持直连交换内容(又称直接对等互连),且所有ISP能够直接接入全球性的互联网基础设施。
各地区前五 ASes 的 CTI 线框分布图
然而在许多其它地区(大多为发展中国家),ISP都未采用直接对等的互联网接入方式 —— 通常只有屈指可数的几家服务提供商可选,且头部效应明显(某个大型ISP为绝大多数用户提供服务)。
重叠条形图展示了排名靠前的五大 ASes 的 CTI 值
不仅如此,这些提供商还依赖数量有限的“流量自治系统”(通常为国有),以访问全球互联网和其它国家或地图的通信流量。
头部AS的CTI值
研究人员指出,这种情况使得拥有此类互联网基础设施的地区特别容易受到攻击,因为攻击者只需削弱其盯上的少数流量自治系统。
本土/国有AS的CTI与部分区域 本土/国有AS的CTI与部分区域
在最糟糕的情况下,某些地区只有一套中转自治系统为所有网民提供服务(比如古巴和塞拉利昂)。但在对私营ISP持较开放态度的地区,其流量自治系统就要相对宽裕得多(比如孟加拉国从2家增加到了 30多家)。
研究收集到的国有来源地址空间(橙条)/ CTIn(蓝条)
此外研究人员惊讶地发现,许多海底互联网光缆都为国有运营商所有,且南半球的互联网拓补结构中遗留了不少殖民时代的影子 —— 比如法国运营商Orange在部分非洲国家有着强大的影响力。
国家级流量权重分布
据悉,研究人员借助边界网关协议(BGP)数据追踪了互联网上自治系统之间的路由与可达信息交换。不过这些数据无法完整反映全球互联网的全貌,因而本文分享的研究结果也只能作为一个大致的参考。
我们再来看一下擎天神的网络拓扑图,从擎天神中我们可以看到美、德、英等西方国家的AS域和IP地址比较多,网络拓扑图也较为复杂。
而亚洲、非洲国家的AS数量就较少,无法构成庞大的网络拓扑关系,这也从另一个角度印证了Alexander Gamero-Garrido博士的部分结论,一些国家的网络拓扑和互联网基础建设确实比较薄弱。
互联网是网络科学领域的一个典型的网络实例,对其拓扑结构知识的深入研究与应用可以丰富网络科学的内涵,推动网络科学这个新兴学科的发展。正如弄清事物的结构是人类认识一个事物和对其进行改造过程中首先面临的基本问题一样,对网络结构的掌握也是认识和改进网络的基础。
互联网拓扑结构是互联网信息基础设施最基本的内在属性。对互联网拓扑特征和知识的发现及其应用正在快速发展中。当前全球数字化建设的信息系统工程领域(如云计算、三网融合、智慧地球、社会计算、物联网等)都离不开互联网这个信息基础设施。