office免费下载-bln

盒式交换机
2023年4月4日发(作者:为什么无法连接到itunes store)

1设备虚拟化,让网络更简单

前期的“闲话大二层网络”已经清晰地阐述了数据中心因为虚拟机

(VM)的动态迁移而要求网络支持大范围的二层域,但传统网络STP

的能力却不足以支撑大二层网络的需求。

图1-1传统二三层网络

简单理下脉络就是网络冗余备份的需求带来了环路问题,为了解决环路

问题从而STP破环协议诞生了,但是STP本身在功能和性能方面的缺陷

却导致二层大不起来。

(至于为什么STP不适应大二层网络的原因可以参考前期的“闲话大二

层网络”,本文不做太多描述。)

1.2化繁为简

既然STP没法用,那只能从解决环路问题方面入手喽。问题不得不再次

回归到为什么会产生环路上来。为了提高网络可靠性,通常设备和链路

都是冗余备份的,而这样就不可避免的形成了环路。如果是单设备和单

链路组成的树型网络,是没有环路问题的,如图1-2,但是出于可靠性

考虑很少有这么干的。

图1-2树型网络及冗余环路网络

那么有没有什么办法在设备、链路冗余的基础上又保持树型网络的结构

呢?这样既能保证可靠性,又天然无环。

基于这样的设想,简单粗暴、直接有效的网络设备虚拟化技术出现了。

设备虚拟化技术就是将相互冗余的两台或多台物理设备组合在一起,虚

拟化成一台逻辑设备,在整个网络中只呈现为一个节点,如图1-3。

(本文中的网络虚拟化技术特指多虚一的技术,另外也有一虚多的技

术,比如华为的VS技术,可以把一台网络设备虚拟成多台网络设备使

用,但是本文中不涉及这种虚拟化。)

图1-3虚拟化前后的逻辑网络

虚拟化后的设备之间相互冗余备份,单台物理设备故障时,其他设备可

以接管控制,避免因单点故障导致业务中断。设备虚拟化再配合链路聚

合技术,就可以把原来的多节点、多链路的结构变成逻辑上单节点、单

链路的结构,完美兼容高可靠性和无环。

1.3技术的演进

最早出现的设备虚拟化技术——堆叠,例如华为的CSS/iStack、Cisco的

VSS和H3C的IRF等,可以将同一网络层次上的同类型或同型号交换

机多虚一,如图1-4所示,又称为横向虚拟化。

横向虚拟化技术从低端盒式设备到高端框式设备都已经被广泛应用,具

备了相当的成熟度和稳定度。

图1-4横向虚拟化示意图

相对于传统的xSTP+VRRP组网方案,堆叠+链路聚合网络具有一些明

显的优势:

简化管理和配置

堆叠建立后,多物理设备虚拟成为一台设备,用户可以通过任何一

台成员设备登录堆叠系统,对所有成员设备进行统一的配置和管

理,使网络需要管理的设备节点减少一半以上。

其次,组网变得简洁,不再需要配置xSTP、VRRP等协议,简化了

网络配置。

带宽利用率高

采用链路聚合的方式,带宽利用率可以达到100%(STP会阻塞链

路)。

快速的故障收敛

相对于STP秒级的故障收敛时间,链路聚合的故障收敛时间可控制

在10ms内,大大降低了网络链路或节点故障对业务的影响。

扩容方便、保护**

随着业务的增加,当用户进行网络升级时,只需要增加新设备既

可,在不需要更改网络配置的情况下,平滑扩容,很好的保护了

**。

虽然横向虚拟化技术在一定程度上优化了网络结构、减少了管理节点,

但是做的还不够彻底。一方面是横向虚拟化后依然没有减少网络的层

级;另一方面是依然没有彻底解决管理节点较多的问题。大规模的数据

中心都有高密度接入的特点,有大量的接入交换机,为了可靠性一般是

多台接入交换机虚拟化(多是2台虚拟化),这样即使在做了横向虚拟

化后管理节点的数量也是相当可观的。假设接入层有40台接入交换

机,每两台交换机做虚拟化,那么依旧还是有多达20个管理节点。

随着设备虚拟化技术的发展,一种更加极致的“纵向虚拟化”技术出现

了——混堆,例如华为的SVF、Cisco的FEX、H3C的IRF3。纵向虚拟

化可以将不同网络层次、不同类型的交换机多虚一,如图1-5所示。

图1-5纵向虚拟化示意图

相比较横向虚拟化,纵向虚拟化具有更好的简化网络结构、简化管理等

作用,可以将虚拟化进行的更彻底。纵向虚拟化可以将汇聚层、接入层

的交换机融合进一个更大的逻辑系统,只有一个管理、控制面。管理员

只需要管理一台逻辑交换机,不再有复杂的拓扑,以及大量重复的配置

工作。通过纵向整合,网络简化效果也非常明显,结构更加简明清晰。

这样的网络是不是更符合数据中心对大二层的需求?

此外,纵向虚拟化还可以简化物理布线,降低网络成本。

图1-6TOR和EOR布线示意图

如图1-6所示,传统的数据中心TOR布线方案中,每个服务器机柜的上

端部署1-2台接入交换机,服务器直接接入机柜内的交换机上,交换机

上行端口通过光纤、铜缆接入到网络机柜中的汇聚交换机上。TOR布线

机架间布线简单,但是接入设备成本高,管理节点多。

采用EOR布线方案时,每排或每两排机柜的最边端/中间放2个网络机

柜,其他服务器机柜里的服务器直接通过跳线连接至网络机柜中的交换

机。虽然减少了接入交换机成本,但是每个机架都需要布置大量的线缆

至网络机柜,机架之间布线数量大。

建立SVF后,接入交换机采用TOR的方式就近服务器部署,作为控制

节点的交换机集中部署,在布线及管理方面兼顾TOR及EOR/MOR的

优点。另外,相对于普通TOR交换机,SVF中接入交换机对性能的要

求更低,使用低成本的交换机代替高成本的TOR交换机,进一步降低

了网络部署成本。

1.4不得不说的痛

前文描述了那么多设备虚拟化技术给网络带来的优势,估计会给部分读

者造成设备虚拟化技术简直堪称完美的错觉,其不仅釜底抽薪式的解决

了环路问题,还兼诸多优点。对此笔者只能轻叹一声,十来年的辩证思

维教育告诉我们——完美的事物是不存在的。设备虚拟化技术的确算是

一把利器,但却不是无往不利的,它有着一定的局限性。

一方面是各自为战,设备虚拟化技术是各个厂家私有的,彼此之间不兼

容,因此没办法使用不同厂家的设备来进行多虚一(甚至于同一厂家的

不同设备之前也可能无法多虚一)。对于存在多厂家设备的网络,该问

题直接无解(至少目前是这样的,至于以后么,也不用想太多,且不说

技术上是否可行,各厂商会愿意彼此分享是如何实现该技术的么)。

另一方面更重要的是虚拟化系统本身的规模限制。虚拟化后所有设备的

控制平面合一,只有一个主控节点,其它都是备份角色,控制平面是

1:N备份的(1+1=2在这里不适用)。因此,整个系统的物理节点规模

就受限于主控节点的处理能力,不是想做多大就做多大的。例如框式设

备虚拟化一般<4台,盒式设备一般<20~30台。目前最大规模的虚拟化

系统大概可以支持接入1~2万台主机,可以从容应付一般的中、小型

数据中心,但对于一些超大型的数据中心来说,就显得力不从心了。这

也就是为什么接下来会出现TRILL、VXLAN等大二层技术的原因了。

(试想下,如果虚拟化技术能够做到极致,支持无限或超多台设备虚拟

化,那么只要把网络中所有设备都虚拟成一台逻辑设备,以上说的一切

问题都将迎刃而解,也就没有TRILL、VXLAN啥事了。关于TRILL、

VXLAN等大二层技术后续会有详细的介绍,此处不做赘述。)

此外,设备虚拟化后控制面合一,系统被当做一台设备来管理,这还有

可能会带来可靠性方面的隐患。例如管理员不小心误操作了(比如整机

重启),就有可能导致大范围网络故障,这样比误操作单一物理设备带

来的影响更大(当然,这个是低概率事件,不是限制其发展的主要原

因)。

1.5小结

数据中心大规模二层网络的需求目前已经非常的清晰,各厂商都提出了

有针对性的技术和方案,满足大二层的当前要求和未来扩展需求。网络

设备虚拟化技术已经存在了很多年,虽然当初在出现的时候,并不是为

了满足大二层的需求,但是却可以达到大二层网络的效果,所以虚拟化

技术在数据中心中有着广泛的应用。虽然设备虚拟化技术有着一定的不

足,但从实际应用情况来看,由于其简单易用、成熟度高的优势,依然

是中小规模数据中心的优选方案。

下文就对CloudEngine系列交换机支持的堆叠和SVF技术进行详细介

绍。

2横向虚拟化——堆叠

2.1堆叠技术的分类

堆叠技术一般是将同形态或同型号的多台交换机虚拟化成一台交换机。

物理上讲,交换机可以分为框式交换机和盒式交换机两种形态。因此堆

叠又可简单分为框式交换机堆叠(又称集群CSS)与盒式交换机堆叠

(又称iStack),如图2-1所示。

图2-1CSS和iStack示意图

框式交换机堆叠多用于网络核心层或汇聚层,而盒式交换机堆叠一般用

于汇聚层或接入层。

2.2堆叠物理连线

交换机之间正确的物理连线是建立堆叠的基本前提。框式、盒式交换机

由于物理形态、堆叠数量的差异,因此堆叠连线方式也有所不同。

2.2.1框式交换机堆叠连线

框式交换机由两台设备通过相互连线组成堆叠系统,连接方式有主控板

直连和业务板直连两种:

图2-2框式交换机物理连线示意图

主控板直连方式里,堆叠链路由两部分组成,一部分是通过主控板上的

SIP口连接的管理链路,另一部分是通过接口板上的业务口连接的转发

链路。其中,管理链路负责堆叠系统管理报文及维护报文的转发,转发

链路则负责跨框业务数据报文的转发。

转发链路的业务口是被捆绑在一个堆叠逻辑端口(Stack-port)中的,一

个堆叠逻辑端口里可以绑定多个业务口,这些业务口也可以跨板。

在业务板直连方式里,管理链路和转发链路是合一的,只需要连接接口

板上的业务口即可,不需要连接主控板上的SIP口。

两种连接方式各有优劣,具体对比可参见表2-1。

表2-1两种连接方式的优缺点比较

特征主控板直连方式业务板直连方式

管理链路与转发链路

关系

分离,无相互影响合一,有相互影响

管理报文是否占用带

不占用占用

系统复杂度较低高

堆叠成员设备之间通

信时延

短较长

堆叠管理通道潜在故

障点数目

少较多

是否需要额外部署线

需要不需要

综合可靠性高较低

2.2.2盒式交换机堆叠连线

盒式交换机是由两台或者多台交换机之间两两连线组成堆叠系统。其管

理链路和转发链路是合一的,通过业务口连接。业务口被捆绑在堆叠逻

辑端口中,一个堆叠逻辑端口里可以绑定多个业务口。

因为盒式交换机可以是多台堆叠,且每台盒式交换机有两个堆叠逻辑端

口,因此盒式交换机堆叠拓扑可以分成链形和环形两种,如图2-3所

示。

图2-3盒式交换机物理连接示意图

两种连接拓扑同样各有优劣,对比如下:

连接拓扑优点缺点适用场景

链形连接首尾不需要有

物理连接,适

合长距离堆

叠。

可靠性低,其

中某条堆叠链

路出现故障,

就会造成堆叠

分裂。

堆叠链路带宽

利用率低,整

个堆叠系统只

有一条路径。

堆叠成员交换

机距离较远

时,组建环形

连接比较困

难,可以使用

链形连接。

环形连接可靠性高:当

其中某条堆叠

链路出现故障

时,环形拓扑

变成链形拓

扑,不影响堆

叠系统正常工

作。

堆叠链路带宽

利用率高,数

据能够按照最

短路径转发。

首尾需要有物

理连接,不适

合长距离堆

叠。

堆叠成员交换

机距离较近

时,从可靠性

和堆叠链路利

用率上考虑,

建议使用环形

连接。

2.3堆叠里的角色划分

多台交换机在堆叠后,表现为一台逻辑交换机,换个角度理解那就是

“控制平面合一,统一管理”。那么很明显,这些交换机彼此之间必须

要分出个高下来,谁管谁得有个说法,不能有组织无纪律。

堆叠系统将交换机分成了主交换机、备交换机、从交换机三种角色,如

图2-4所示,简单对号入座理解就是山寨里的一个“大当家”,一个

“二当家”,再加一群“小弟”。主交换机就是那个“大当家”,又称

“堆叠主”或“系统主”,负责整个系统的控制和管理。备交换机很明

显就是那个“二当家”,又称“堆叠备”或“系统备”,它的一个重要

职责就是随时准备替代“大当家”,在“大当家”出事后立即上位,管

理那帮“小弟”。除了一个“大当家”,一个“二当家”,其它的自然

都是“小弟”。

图2-4堆叠成员角色示意图

框式交换机一个框内有两块主控板,一块是主用,一块是备用。如图2-

4所示,两台框式交换机堆叠后,在控制平面上,主交换机的主用主控

板成为堆叠的系统主用主控板,作为整个系统的管理主角色;备交换机

的主用主控板成为堆叠的系统备用主控板,作为系统的管理备角色;主

交换机和备交换机的备用主控板作为堆叠的冷备用主控板,不具有管理

角色,只作为冷备板。

图2-5框式交换机堆叠后主控板角色

2.4堆叠的系统管理

2.4.1成员管理

堆叠系统使用成员编号(MemberID,又常称堆叠ID)来标识和管理成

员设备,堆叠中所有设备的成员编号都是唯一的。

成员编号会被引入到接口编号中,便于用户配置和识别成员设备上的接

口。框式交换机未运行堆叠功能时,接口编号采用三维格式“槽位号/子

卡号/端口号”,例如10GE1/0/1;当设备运行堆叠功能时,接口编号会

变成四维格式“堆叠成员编号/槽位号/子卡号/端口号”,如果堆叠成员

ID为2,则该接口的编号将变为10GE2/1/0/1。

盒式交换机的接口编号采用“堆叠成员编号/子卡号/端口号”的形式

(盒式交换机默认使能堆叠,因此其初始就带有堆叠成员编号)。

2.4.2配置管理

多台设备虚拟成的堆叠系统可以看作是单一实体,用户可以使用

Console口或者Telnet方式登录到任意一台成员设备,对整个堆叠系统

进行管理和配置。主交换机作为堆叠系统的管理中枢,负责响应用户的

登录、配置请求,即用户无论使用什么方式,通过哪台成员交换机登录

到堆叠系统,其实最终登录的都是主交换机并通过主交换机进行配置。

堆叠具有严格的配置文件同步机制,用来保证堆叠中的多台交换机能够

像一台设备一样在网络中工作。主交换机作为堆叠系统的管理中枢,负

责将用户的配置同步给备交换机,从而使堆叠内各成员交换机的配置随

时保持一致。通过即时同步,堆叠中的所有成员交换机均保持相同的配

置。即使主交换机出现故障,备交换机仍能够按照相同的配置执行各项

功能。

2.4.3版本管理

在堆叠系统里,所有成员设备都必须使用相同版本的系统软件。堆叠具

有版本同步的功能,组成堆叠的成员交换机不需要具有相同的软件版

本,只需要版本间兼容即可。当主交换机选举结束后,如果其它交换机

与主交换机的软件版本号不一致,会自动从主交换机下载系统软件,使

用新的系统软件重新启动后再加入堆叠。

2.5堆叠典型场景

下面的几个堆叠场景以盒式交换机为例进行描述,框式交换机的场景与

其类似(可以理解框式交换机为2台堆叠的特殊场景)。

2.5.1堆叠建立场景

图2-6堆叠建立示意图

堆叠建立是指所有成员交换机重新上电组建堆叠的场景,如图2-5所

示。该情形通常是所有成员交换机完成堆叠软件配置后下电,然后连接

堆叠线缆,最后将所有成员交换机上电。此后这些交换机进入堆叠建立

流程,分为以下几步:

1.各成员交换机通过堆叠链路发送链路探测报文,并进行堆叠链路合

法性检测。

2.各成员交换机之间相互发送堆叠竞争报文,并根据选举原则选举出

主交换机。选举规则如下(依次从第一条开始判断,直至找到最优

的交换机才停止比较):

运行状态比较,最先完成启动,并进入堆叠运行状态的交换机优

先竞争为主交换机。

堆叠优先级比较,堆叠优先级高的交换机优先竞争为主交换机。

软件版本比较,软件版本高的交换机优先竞争为主交换机。

主控板数量比较,有2块主控板的交换机优先只有1块主控板的

交换机竞争为主交换机(仅框式交换机堆叠才进行此项比

较)。

桥MAC地址比较,桥MAC地址小的交换机优先竞争为主交换

机。

3.主交换机选举完成后,其它成员交换机向主交换机发送成员信息报

文。如果成员交换机之间ID有冲突或者与主交换机的版本不一

致,成员交换机将重新修改ID或者同步主交换机的版本。

4.主交换机收集所有成员交换机的信息并计算拓扑,然后将成员信息

和拓扑信息同步至其它成员交换机。

5.主交换机根据选举规则选举一台备交换机,并将备交换机信息同步

至其它成员交换机。

至此,堆叠系统建立成功。

2.5.2堆叠成员加入与退出场景

堆叠成员加入是指向已经稳定运行的堆叠系统中添加一台新的交换机,

如图2-6所示。这种情形一般是新加入的交换机不带电加入的情况,即

新加入的交换机完成堆叠软件配置后先断电,然后连接堆叠线缆,最后

上电交换机(如果是带电加入,可以理解为堆叠合并场景,该场景下面

会有说明)。

图2-7堆叠成员加入示意图

在加入场景,为了不影响已有堆叠系统的运行,新加入的交换机会作为

从交换机加入,堆叠系统中原有主、备、从角色不会变动。

堆叠成员退出与加入相反,是指成员交换机从堆叠系统中离开。根据退

出成员交换机角色的不同,对堆叠系统的影响也有所不同:

如果是主交换机退出,备交换机升级为主交换机,重新计算堆叠拓扑

并同步到其他成员交换机,指定新的备交换机,之后进入稳定运行

状态。

如果是备交换机退出,主交换机重新指定备交换机,重新计算堆叠拓

扑并同步到其他成员交换机,之后进入稳定运行状态。

如果是从交换机退出,主交换机重新计算堆叠拓扑并同步到其他成员

交换机,之后进入稳定运行状态。

2.5.3堆叠合并场景

堆叠合并是指稳定运行的两个堆叠系统合并成一个新的堆叠系统,如图

2-7所示,通常在以下两种情形下出现:

待加入堆叠系统的交换机配置了堆叠功能,在不下电的情况下,使用

堆叠线缆连接到正在运行的堆叠系统。

堆叠链路或设备故障导致堆叠分裂,链路或设备故障恢复后,分裂的

堆叠系统重新合并。

图2-8堆叠合并示意图

堆叠系统合并时,两个堆叠系统的主交换机会进行竞争,选举出一个更

优的作为新堆叠系统的主交换机(与堆叠建立场景竞争主交换机的原则

相同)。竞争胜出的主交换所在的堆叠系统将保持原有主、备、从角色

和配置不变,业务也不会受到影响;而另外一个堆叠系统的所有成员交

换机将重新启动,走堆叠加入的流程重新加入新堆叠系统。

2.5.4堆叠分裂场景

堆叠分裂是指一个稳定运行的堆叠系统分裂成了多个堆叠系统,如图2-

8所示。这种情形一般是因为线缆、单板故障,或者错误配置导致成员

交换机之间断开了堆叠连接,而分裂开的多个堆叠系统依然保持带电运

行。

图2-9堆叠分裂示意图

根据原堆叠系统主、备交换机分裂后所处位置的不同,堆叠分裂可分为

以下两类:

其一是堆叠分裂后,原主、备交换机在同一个堆叠系统中。这时原主

交换机会重新计算堆叠拓扑,将移出的成员交换机的拓扑信息删

除,并将新的拓扑信息同步给其他成员交换机;而移出的成员交换

机会因为丢主丢备且自身是从交换机,将自动复位,重新进行选

举,形成新的堆叠系统。

另一种情况是堆叠分裂后,原主、备交换机在不同的堆叠系统中。这

时原主交换机所在堆叠系统会重新指定备交换机,重新计算拓扑信

息并同步给其他成员交换机;原备交换机所在堆叠系统将发生备升

主,原备交换机升级为主交换机,重新计算堆叠拓扑并同步到其他

成员交换机,并指定新的备交换机。

堆叠分裂后地址冲突检查

在网络运行中,一个堆叠分裂时,会产生有多个全局配置完全相同的堆

叠系统,这些堆叠系统会以相同的IP地址和MAC地址(堆叠系统

MAC地址)与网络中的其它设备交互。这样就导致IP地址和MAC地

址冲突,引起整个网络故障。所以在堆叠发生分裂后,必须进行冲突检

测和处理。

双主检测DAD(Dual-ActiveDetect)就是一种检测和处理堆叠分裂的协

议,可以实现堆叠分裂的检测、冲突处理和故障恢复,降低堆叠分裂对

业务的影响。

堆叠系统配置双主检测后,主交换机会周期在检测链路上发送DAD竞

争报文。一旦发生分裂,分裂成多部分的堆叠系统都会在检测链路上互

发竞争报文,并将接收到的竞争报文信息与本部分竞争信息做比较。如

果本部分竞争胜出,则不做处理,正常转发业务报文;如果本部分竞争

失败,则关闭除保留端口外的所有业务端口,停止转发业务报文。

DAD竞争规则如下(依次从第一条开始判断,直至找到最优的交换机才

停止比较):

堆叠优先级比较,堆叠优先级高的交换机优先竞争胜出。

设备MAC地址比较,MAC地址小的交换机优先竞争胜出。

堆叠分裂故障修复后,分裂成多部分的堆叠系统进行堆叠合并,原竞争

失败的部分将重新启动,同时将被关闭的业务端口恢复正常,整个堆叠

系统恢复。

2.5.5堆叠主备倒换场景

参考框式交换机上主控板的主备倒换概念,堆叠主备倒换就是指堆叠系

统里主、备交换机角色的变换。通常主交换机故障、重启,或者管理员

执行主备倒换功能后会产生堆叠主备倒换。

图2-10主备倒换前后成员交换机角色的变化

如图2-9所示,主备倒换时,备交换机会升级为主交换机,并指定新的

备交换机。原主交换机会重启后走成员加入流程加入堆叠系统(如果是

框式交换机系统主用主控板故障导致的主备倒换,也可能不重启)。

2.6流量本地优先转发

如果没有流量本地优先转发,进入堆叠的流量会有一部分HASH选路到

跨设备的接口进行转发,流量会经过堆叠线缆。由于堆叠线缆带宽有

限,跨设备转发流量增加了堆叠设备之间的带宽承载压力,同时也降低

了流量转发效率。

为了提高转发效率,减少跨设备转发流量,堆叠需要支持Eth-Trunk接

口流量本地优先转发。即从本设备进入的流量,优先从本设备的出接口

转发出去;如果本设备的出接口故障,则流量从其它成员交换机的接口

转发出去图2-10所示。

图2-11流量本地优先转发示意图

注:仅已知单播流量支持本地优先转发,BUM(广播、组播和未知单

播)流量不支持本地优先转发。

2.7堆叠典型应用部署

2.7.1堆叠构建三层架构数据中心网络

如图2-11所示的三层数据中心组网中,核心层由两台CE12800组成,

两台设备间通过2条10GE链路聚合,从而保证链路的高可靠性。汇聚

层、接入层分别由CE12800交换机、CE6800交换机堆叠实现冗余备

份,堆叠与上下游设备间通过跨框Eth-Trunk连接。同时,通过Eth-

Trunk的流量本地优先转发功能减少框间链路的带宽承载压力。汇聚层

通过创建VRF隔离业务网段路由与公网路由,采用旁挂方式部署防火

墙,两台防火墙进行双机热备份,保证高可靠性。

图2-12基于堆叠的三层架构数据中心组网图

2.7.2堆叠构建二层架构数据中心网络

如图2-12所示的数据中心组网,采用接入层+核心层的两层方式部署。

为了简化网络并提高可靠性,核心层由两台CE12800组成CSS,接入层

由多台CE6800组成iStack。接入层与核心层之间通过跨设备Eth-Trunk

连接,消除二层环路。同时,通过Eth-Trunk的流量本地优先转发功能

减少框间链路的带宽承载压力。核心层通过创建VRF隔离业务网段路由

与公网路由,采用旁挂方式部署防火墙,两台防火墙进行双机热备份,

保证高可靠性。

图2-13基于堆叠的二层架构数据中心组网图

3纵向虚拟化——SVF

3.1SVF技术的分类

SVF(SuperVirtualFabric)可以将接入、汇聚等不同层次的交换机虚拟

成一台逻辑交换机,进行集中管理,如图3-1所示。

图3-1SVF虚拟化示意图

SVF中有两类交换机角色:

Spine,也称父交换机,是整个SVF系统的核心,负责整个系统的控

制和管理。

Leaf,也称叶子交换机,是纵向扩展设备,可以理解为Spine的远程

接口板,由Spine进行统一管理。

根据父交换机形态的不同,SVF可以从形态组合上简单划分为盒盒SVF

和框盒SVF。顾名思议,盒盒SVF就是指盒式交换机+盒式交换机组成

的SVF,父交换机和叶子交换机都由盒式交换机担任;框盒SVF就是指

框式交换机+盒式交换机组成的SVF,框式交换机作为父交换机,盒式

交换机作为叶子交换机(因为叶子交换机是作为低成本的拓展设备,因

此都是由盒式交换机担任)。

3.2SVF物理连线

无论盒盒SVF,还是框盒SVF,父交换机与叶子交换机之间都通过

Fabric-port口相连,一个叶子交换机对应连接一个Fabric-port,如图3-2

所示。Fabric-port是一种类似堆叠里Stack-port的逻辑口,可以绑定多个

物理成员口,通过多条链路的聚合,可以为SVF链路提供更高的带宽及

可靠性。父交换机上Fabric-port中的成员口可以跨设备(针对盒盒

SVF)或跨板(针对框盒SVF)。

图3-2SVF物理连接示意图

由于盒盒SVF与框盒SVF中支持的最大父交换机数量不同,因此盒盒

SVF与框盒SVF的组网拓扑也有些区别(目前盒盒SVF规格是2+24,

即父交换机最多是2台,叶子交换机最多24台;框盒SVF的规格是

1+32)。

3.2.1.2盒盒SVF拓扑

图3-3盒盒SVF拓扑

盒盒SVF中,父交换机最多可以由2台设备组成(图3-3右一)。这2

台父交换机组建为堆叠(iStack),可以实现控制平面的冗余备份,保

证系统可靠性。叶子交换机双归连接2台父交换机,服务器可以主备或

双活接入多台叶子交换机。

当然,父交换机如果是单机设备也是可以的(图3-3左一),但很显然

这种组网SVF系统可靠性较低,如果父交换机故障则服务器流量会中

断。

3.2.1.3框盒SVF拓扑

看完盒盒SVF的组网拓扑介绍,估计有读者不禁要问了:既然单父交换

机不那么可靠,那框盒SVF又是如何保证网络可靠性的呢?看规格框盒

SVF可最多只有1台父交换机。

不错,单父交换机是不能保证SVF系统的可靠性,但是我们可以使用双

SVF系统来保证业务流量的可靠性,类似VRRP那样。再结合另一神器

——跨设备链路聚合M-LAG,就可以实现链路备份及流量的负载分

担。如图3-4(右一)所示,通过在两个SVF之间组建M-LAG,服务器

就可以双活接入至两个SVF系统的叶子交换机。

图3-4框盒SVF拓扑

注:盒盒SVF也可以采用SVF+M-LAG的组网方案。

在框盒SVF组网中,有两点需要特别需要注意,一是同一SVF里叶子

交换机的端口不可以加入同一个Eth-Trunk,因此服务器不可以双活接入

同一SVF的叶子交换机,如图3-5(左一);另外一点是叶子交换机只

能连接一台父交换机,不可以双归连接到2台组建M-LAG的父交换机

上,如图3-5(右一)。

图3-5SVF不支持的连接拓扑

3.3SVF建立流程

完成父交换机、叶子交换机的软件配置并连接两者之间的线缆后,即进

入SVF建立过程,主要分为以下几步:

1.完成叶子ID的分配。叶子ID就是指叶子交换机的编号(作用类似

于堆叠系统里的堆叠ID),具有唯一性,用来标识和管理叶子交换

机。

叶子交换机、父交换机通过SVF链路互发链路探测报文,当链路

Up后,父交换机为叶子交换机分配叶子ID。叶子ID是在父交换机

上配置的,与Fabric-port绑定,一个Fabric-port绑定一个叶子ID。

因此,若叶子交换机分别连接至不同的Fabric-port,会被分配不同

的ID。

2.完成软件版本的同步。叶子交换机通过获取父交换机的软件版本信

息,判断自身与父交换机的软件版本是否一致。如果不一致,则叶

子交换机将自动从父交换机下载系统软件,下载完成后以新版本重

新启动并完成向父交换机的注册。

叶子交换机同步的系统软件非完整的父交换机的系统软件,而是父

交换机系统软件中的一个独立软件包。父交换机的系统软件中有两

个不同功能用途的软件包,一个用于自身的运行,一个用于同步给

叶子交换机,供叶子交换机的运行。

3.完成配置的下发。等叶子交换机正常启动并注册后,父交换机向叶

子交换机下发配置。

SVF系统作为一个虚拟设备,是由父交换机进行统一配置和管理

的,叶子交换机不具备配置和管理功能,所有的业务配置信息都保

存在父交换机上。

至此SVF系统就算是建立成功了,可以通过任意一台父交换机或叶子交

换机的Console口、管理网口或其他三层口登录SVF,进行其他的业务

特性配置。其实无论是从父交换机还是从叶子交换机上的接口登录,最

终登录的都是父交换机。从叶子交换机接口登录时会被重定向到父交换

机。

3.4SVF系统管理

3.4.1SVF成员管理

与堆叠类似,SVF使用叶子ID(LeafID)来标识和管理叶子交换机,

所有叶子交换机的ID都是唯一的。为了与父交换机的ID区分开,叶子

交换机的ID从101开始编号(父交换机从1开始编号)。

叶子ID会被引入到接口编号中,便于用户配置和识别叶子交换机上的

接口。例如框式SVF,叶子交换机上的接口编号采用四维格式“叶子

ID/1/子卡号/端口号”;盒盒SVF中叶子交换机的接口编号采用三维格

式“叶子ID/子卡号/端口号”。

3.4.2SVF配置管理

在SVF系统中,叶子交换机本身不具备配置和管理功能,所有的配置和

管理都由父交换机执行。在父交换机上对叶子交换机进行配置后,配置

信息保存在父交换机上,叶子交换机不存储任何配置。当叶子交换机重

新启动或更换新的叶子交换机时,父交换机通过SVF链路下发配置至叶

子交换机。同框式接口板类似,叶子交换机也可以即插即用。

3.5SVF流量转发模型

3.5.1.1分布式转发

在分布式转发模式里,叶子交换机的流量进行本地查表转发,三层流量

查表失败则丢弃,二层流量查表失败则在系统内进行广播。

在分布式转发模式下,叶子交换机具有本地转发能力,流量转发时延

低,但是对叶子交换机的规格能力要求比较高(因为叶子交换机会同步

父交换机的转发表项)。

图3-6分布式转发示意图

3.5.1.2集中式转发

集中式转发是指叶子交换机的所有流量统一上送至父交换机,统一由父

交换机进行转发。

集中式转发模式对叶子交换机的规格能力要求低,但是所有流量都要从

父交换机中转一次,转发时延较高。

图3-7集中式转发示意图

3.5.1.3混合式转发

混合式转发是介于分布式、集中式转发之间的一种模式。该模式下,叶

子交换机只学习本地ARP、MAC表项(仅业务口进行表项学习,上行

连接父交换机的端口不进行表项学习),进入叶子交换机的单播流量优

先在本地进行查表转发,查找失败则上送至父交换机进行转发;广播、

组播流量直接上送至父交换机进行转发。

混合式转发模式对叶子交换机的规格能力要求较低,且本地流量转发时

延低。

图3-8混合式转发示意图

注:目前盒盒SVF三种转发模式都支持,框盒SVF支持混合转发模

式。

3.6SVF典型应用部署

3.6.1盒盒SVF构建数据中心接入层网络

如图3-9所示的数据中心组网中,核心层由两台CE12800组成CSS,接

入层由CE6800+CE5800组成SVF,其中CE6800作为父交换机并组成

iStack,保证SVF系统的高可靠性。服务器双活接入叶子交换机

CE5800,实现流量的负载分担。

图3-9基于盒盒SVF的数据中心接入层组网图

3.6.2框盒SVF构建数据中心接入层网络

如图3-10所示的数据中心组网中,核心层由两台CE12800组成CSS,

接入层由CE12800+CE5800组成SVF,两个SVF之间部署M-LAG,服

务器通过M-LAG双活接入叶子交换机CE5800,实现流量的负载分担。

图3-10基于框盒SVF的数据中心接入层组网图

更多推荐

盒式交换机