M-LAG技术原理是啥?如何工作的?
2025-10-11 09:28:20
RAIZ
一、M-LAG 是什么?

二、M-LAG 是如何工作的?
M-LAG 系统的正常运行依赖于几个关键组件和机制:
这是一条必须建立的、高可靠的直连链路(通常本身也是链路聚合链路),用于M-LAG设备之间交换控制报文(如心跳检测、双主检测报文)和同步状态信息(如MAC表项、ARP表项)。 在某些故障场景下(如一台设备的上行链路故障),Peer-Link也可能用于传输数据流量。
这是一条用于故障检测的三层互通链路(如通过管理网口或特定VLAN)。 当Peer-Link发生故障时,M-LAG系统可能发生“分裂”,即两台设备都认为自己是主设备。双主检测链路通过交互检测报文来避免这种“双主”情况导致的网络问题(如广播风暴)。

已知单播流量:M-LAG主备设备会形成逐流的负载分担,共同进行流量的转发。

组播、广播、未知单播流量:这些流量会在设备间泛洪扩散。M-LAG通过其单向隔离机制来隔绝由Peer-Link发往M-LAG成员口的流量,从而防止环路的形成,因此通常不再需要启用传统的生成树协议(STP)。

M-LAG成员口(即连接服务器的聚合链路中的一条物理链路)故障:流量会自动切换到正常的链路上,网络侧感知不到故障。

一台M-LAG设备整体故障:另一台设备会接管所有流量,保证业务不中断。服务器感知到的只是链路聚合组中部分链路断开,其上行链路仍然畅通。

Peer-Link链路故障:设备会立即通过DAD链路发起双主检测。如果确认对端设备存活,则会有一台设备(通常是备设备)自动Error-Down(关闭)除保留接口外的所有业务接口,避免形成双主和网络环路,此时流量只从主设备转发。

需高可靠性部署,推荐使用多条链路聚合 | ||
场景描述:服务器通过双网卡分别连接到两台独立的交换机,并在服务器和交换机上配置链路聚合(如LACP)。从服务器角度看,它只是和“一台”交换机建立了聚合链路。 优势:为服务器提供设备级冗余保障。任何一条链路、任何一个网卡或任何一台接入交换机故障,都不会导致服务器业务中断,同时还能实现负载均衡。
汇聚层部署M-LAG:两台汇聚交换机组建M-LAG,下游的接入交换机可以双归上行到这两台汇聚交换机。这样可以替代传统的STP+VRRP方案,消除STP的阻塞端口,提高链路利用率,并提供更快的故障收敛。 多级M-LAG:在大型数据中心,可以在Spine层和Leaf层同时部署M-LAG,形成多级冗余架构,进一步扩展网络规模和提高可靠性。

M-LAG双归设备可以作为二层网络和三层网络的分界点,即承担网关的作用。两台设备配置相同的IP地址和虚拟MAC地址,对网络侧展示为同一个网关,实现网关冗余。


在VXLAN网络中,两台M-LAG设备可以虚拟成一个VTEP(VXLAN Tunnel End Point),使用同一个VTEP IP地址与外界建立VXLAN隧道,简化配置并提高可靠性。
