加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据中心网络架构与技术演进(一)

发布时间:2022-11-02 17:00:36 所属栏目:大数据 来源:互联网
导读: 现代社会已经进入了信息化社会 ,每天都会产生海量的数据。当你每天刷抖音、看淘宝直播带货时,其实这些应用的背后都离不开云计算技术的支撑。
数据中心是云计算的核心基础设施。以中国移

现代社会已经进入了信息化社会 ,每天都会产生海量的数据。当你每天刷抖音、看淘宝直播带货时,其实这些应用的背后都离不开云计算技术的支撑。

数据中心是云计算的核心基础设施。以中国移动、中国电信、中国联通等为代表的电信运营商和以百度、阿里巴巴、腾讯为代表的互联网企业都在大力发展云数据中心,来提供更好的云计算服务。

数据中心网络在云计算基础设施中具有关键地位。云数据中心网络是连接数据中心大规模服务器的桥梁, 也是承载网络化计算和网络化存储的基础。 云计算的核心价值在于大数据的集中处理和资源的统计复用。由于大规模云计算任务往往伴随着服务器之间的海量数据交互,数据中心网络性能的高低决定了云计算的服务质量。

在介绍数据中心网络架构时需要明确一点,无论是虚拟化网络、SDN、NFV等新兴网络技术如何发展,所有的网络报文最终都是在物理网络上传输。物理网络的带宽、时延、扩展性等都会对虚拟网络性能和功能产生很大的影响。

一、传统数据中心网络架构

传统的大型数据中心网络沿用了园区网络,这个模型包含以下三层。

接入层(Access Layer) :接入交换机通常位于机架顶部,所以它们也被称为ToR(Top of Rack)交换机,主要负责物理机和虚拟机的接入、VLAN标记,以及二层流量转发。

汇聚层(Aggregation Layer) :汇聚交换机连接接入交换机,同时提供其他的服务大数据架构,例如安全,QoS,网络分析等。

核心层(Core Layer) :核心交换机为进出数据中心的流量提供高速的转发,同时为多个汇聚层提供连接性。

大数据三种架构_大数据架构_大数据架构详解 pdf

如上图所示,汇聚交换机通常作为二层网络与三层网络的分界点,汇聚交换机以下是二层网络,以上是三层网络。每组汇聚交换机管理一个PoD(point of delivery),每个PoD内都是独立的VLAN。服务器在PoD内迁移不必修改IP地址和默认网关,因为同一个PoD对应一个二层广播域。

大数据架构_大数据架构详解 pdf_大数据三种架构

如上图所示汇聚交换机和接入交换机之间通常使用STP(Spanning Tree Protocol)生成树协议。由于STP算法为了防止链路出现环路,在交换机有多条可达链路时只保留一条链路,其它链路作为冗余只在故障时启用。因此在水平扩展性上不足,加入多台汇聚层交换机只有一台工作。一些私有的协议,例如Cisco的vPC(Virtual Port Channel)可以提升汇聚层交换机的利用率。

总体而言三层网络架构实现简单、配置的工作量低、广播控制能力较强等优势在传统数据中心网络中心网络中大量应用。但是在云计算背景下,传统的网络架构已经无法满足云数据中心对网络的述求。主要的原因有以下两点。

1、无法支撑大二层网络构建

三层网络架构可以对广播进行有效的控制,在汇聚层通过VLAN将广播控制在一个PoD内。但是在云计算背景下,计算资源已经资源池化,这就要求虚拟机能够在任意地点创建、迁移,而不能对其IP地址或者网关进行修改,因此必须构建一个大二层网络来满足虚拟机迁移的需求。

大数据三种架构_大数据架构详解 pdf_大数据架构

虚拟机迁移是计算资源池化的重要诉求,如上图所示虚拟机VM需要在数据中心内部任意的迁移。简单理一下虚拟机需要迁移的场景:a、物理机器硬件系统的维护,故障修复和升级(upgrade),但运行在这台物理机器上的虚拟机不能关机,因为用户重要的服务跑在上面。b、物理机器软件系统升级,打补丁(patch),为了不影响上面跑的虚拟机,在升级和打补丁之前,需要把虚拟机迁移到别的物理机器上。c、一个物理机器上的负载太重,需要减少一些虚拟机来释放资源。d、跨域环境下,有的域里有的物理机上的虚拟机太多,有的域里物理机上虚拟机较少,做一下资源平衡。因此构建大二层网络来满足迁移需求成为架构演进的必然。

另外汇聚层作用也因为安全、QoS、网络分析等业务的外移而弱化。最后三层网络架构在进行横向扩展时,只能通过增加PoD的方式进行扩展,但是汇聚层设备的增加给核心层设备带来巨大压力,并且依赖厂家对于设备更新。

2、无法支持流量的无阻塞转发

数据中心流量可以分为以下几种:

a、南北向流量:数据中心之外的客户端与数据中心内部服务器之间的流量,或者数据中心内部服务器访问外部网络的流量。

b、东西向流量:数据中心内部服务器之间的流量。

c、跨数据中心流量:不同数据中心之间的流量。

在传统数据中心中业务往往采用专用模式进行部署,业务会部署在一台或者几台物理机上。所以在传统数据中心,东西向流量比较少,南北向流量占据数据中心整体流量80%左右。而在云数据中心,业务架构逐渐转变为“Web-App-DB”模式,分布式技术开始在企业应用中流行。一个业务组件通常分布在多个虚拟机或者容器当中。这就导致了东西向流量的快速增长。另一方面,大数据业务的逐渐兴起,使得分布式计算成了云数据中心的标配。数据分布在成白上千的服务器中,并行计算也导致了流量的大幅提升。

大数据架构详解 pdf_大数据三种架构_大数据架构

传统三层网络架构是以传统数据中心南北向流量为主前提下设计的(如上图所示),面对大量东向西流量显得力不从心。两大主要原因:

1、很多东西向流量都需要经过汇聚层和核心层进行转发,数据经过了许多不必要节点(如图所示跨网段三层转发需要经过5台设备路径过长)。由于收敛比的存在(通常为了提高设备的使用效率,一般会设置1:10~1:3的带宽收敛),每多经过一个节点,都会导致性能衰减。2、东西向流量经过层级较多可能会导致来回路径不一致,不同路径时延不同,使得整体流量时延难以预测,对于大数据类对时延要求非常敏感业务来说不可接受。

因此,企业部署数据中心网络时,为了保证东西流量需要更高性能的汇聚交换机和核心交换机,增加了企业的成本。

基于以上传统三层网络架构的缺点并不适合作为云数据中心的网络架构,一种基于Clos架构的两层Spine-Leaf架构已经在云数据中心网络中流行。下一篇将着重介绍Spine-Leaf架构。

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!