一、IRF协议概要：

A、协议概念：

1、协议介绍：

IRF（Intelligent Resilient Framework，智能弹性架构）是H3C自主研发的软件虚拟化技术。它的核心思想是将多台设备连接在一起，进行必要的配置后，虚拟化成一台设备，这种虚拟化可以称为堆叠。使用这种虚拟化技术可以集合多台设备的硬件资源和软件处理能力，实现多台设备的协同工作、统一管理和不间断维护。为了便于描述，这个“虚拟设备”也称为IRF。所以，本文中的IRF有两层意思，一个是指IRF技术，一个是指IRF设备

堆叠是指将一台以上的交换机组合起来共同工作，以便在有限的空间内提供尽可能多的端口。多台交换机经过堆叠形成一个堆叠单元。堆叠和级联这两个概念既有区别又有联系。堆叠可以看作级联的一种特殊形式。它们的不同之处在于：级联的交换机之间可以相距很远（在媒体许可范围内），而一个堆叠单元内的多台交换机之间的距离非常近，一般不超过几米；级联一般采用普通端口，而堆叠采用专用的堆叠模块和堆叠线缆。

IRF主要具有以下优点：

简化管理。IRF形成之后，用户通过任意成员设备的任意端口都可以登录IRF系统，对IRF内所有成员设备进行统一管理。
1:N备份。IRF由多台成员设备组成，其中，主设备负责IRF的运行、管理和维护，从设备在作为备份的同时也可以处理业务。一旦主设备故障，系统会迅速自动选举新的主设备，以保证业务不中断，从而实现了设备的1:N备份。
跨成员设备的链路聚合。IRF和上、下层设备之间的物理链路支持聚合功能，并且不同成员设备上的物理链路可以聚合成一个逻辑链路，多条物理链路之间可以互为备份也可以进行负载分担，当某个成员设备离开IRF，其它成员设备上的链路仍能收发报文，从而提高了聚合链路的可靠性。
强大的网络扩展能力。通过增加成员设备，可以轻松自如的扩展IRF的端口数、带宽。因为各成员设备都有CPU，能够独立处理协议报文、进行报文转发，所以IRF还能轻松自如的扩展处理能力。

两台同层级设备使用IRF技术组成一台虚拟设备，对上、下层设备来说，它们如同一台设备——IRF。

2、基本概念：

运行模式，设备支持两种运行模式，两种模式之间通过命令行进行切换：
1. 独立运行模式：处于该模式下的设备只能单机运行，不能与别的设备形成IRF。
2. IRF模式：处于该模式下的设备可以与其它设备互连形成IRF。
成员设备的角色，IRF中每台设备都称为成员设备。成员设备按照功能不同，分为两种角色：
1. 主用设备（简称为主设备）：负责管理和控制整个IRF，网络协议计算和收敛，转发业务报文，一个IRF种只有一个主设备。
2. 从属设备（简称为从设备）：处理业务、转发报文的同时作为主设备的备份设备运行。当主设备故障时，系统会自动从从设备中选举一个新的主设备接替原主设备工作。
3. 主设备和从设备均由角色选举产生。一个IRF中同时只能存在一台主设备，其它成员设备都是从设备。关于设备角色选举过程的后续详细介绍。
主控板的角色，设备加入IRF后，设备上的主控板就具有两重身份（身份不同责任不同）：
1. 本地身份：负责管理本设备的事宜，比如主用主控板和备用主控板间的同步、协议报文的处理、路由表项的生成维护等。
2. 全局身份：负责处理IRF相关事宜，比如角色选举、拓扑收集等。

IRF端口：一种专用于IRF成员设备之间进行连接的逻辑接口，每台成员设备上可以配置两个IRF端口，分别为IRF-Port1和IRF-Port2。它需要和物理端口绑定之后才能生效。

在独立运行模式下，IRF端口采用一维编号，分为IRF-Port1和IRF-Port2；
在IRF模式下，IRF端口采用二维编号，分为IRF-Portn/1和IRF-Portn/2，其中n为设备的成员编号。为简洁起见，本文描述时统一使用IRF-Port1和IRF-Port2。

IRF物理端口：与IRF端口绑定，用于IRF成员设备之间进行连接的物理接口。在华三交换机上，可以将10GE/40GE/100GE光接口配置为IRF物理端口。

与IRF端口绑定，用于IRF成员设备之间进行连接的物理接口。在本系列交换机上，可以将10GE/40GE/100GE光接口配置为IRF物理端口。

通常情况下，本系列交换机上的10GE/40GE/100GE端光接作为普通的业务端口，负责向网络中转发业务报文，将它们与IRF端口绑定后就作为IRF物理端口，可转发的报文包括IRF相关协商报文以及需要跨成员设备转发的业务报文。

由于IRF物理端口上不能开启STP或其它环路控制协议，IRF成员设备需要根据接收和发送报文的端口以及IRF的当前拓扑，来判断报文在发送后是否会产生环路。如果判断结果为会产生环路，设备将在位于环路路径上的发送端口处将报文丢弃。该方式会造成大量广播报文在IRF物理端口上被丢弃，此为正常现象。在使用SNMP工具监测设备端口的收发报文记录时，取消对IRF物理端口的监测，可以避免收到大量丢弃报文的告警信息。

3、IRF域：

域是一个逻辑概念，一个IRF对应一个IRF域。

为了适应各种组网应用，同一个网络里可以部署多个IRF，IRF之间使用域编号（DomainID）来以示区别。如图1-3所示，Device A和Device B组成IRF 1，Switch A和Switch B组成IRF 2。如果IRF 1和IRF 2之间有MAD检测链路，则两个IRF各自的成员设备间发送的MAD检测报文会被另外的IRF接收到，从而对两个IRF的MAD检测造成影响。这种情况下，需要给两个IRF配置不同的域编号，以保证两个IRF互不干扰。

IRF合并：如图所示，两个（或多个）IRF各自已经稳定运行，通过物理连接和必要的配置，形成一个IRF，这个过程称为IRF合并。

IRF分裂：如图所示，一个IRF形成后，由于IRF链路故障，导致IRF中两相邻成员设备不连通，一个IRF变成两个IRF，这个过程称为IRF分裂。

二、工作原理：

IRF的生命周期分为：物理连接、拓扑收集、角色选举、IRF的管理与维护四个阶段。成员设备之间需要先建立IRF物理连接，然后会自动进行拓扑收集和角色选举，处理成功后，IRF系统正常运行，进入IRF管理和维护阶段

A、前提条件：

介质条件：要形成一个IRF，需要先连接成员设备的IRF物理端口。堆叠口中的物理接口必须是万兆以上的接口，所有堆叠的物理设备的操作系统版本必须一致。
连接要求：本设备上与IRF-Port1口绑定的IRF物理端口只能和邻居成员设备IRF-Port2口上绑定的IRF物理端口相连，本设备上与IRF-Port2口绑定的IRF物理端口只能和邻居成员设备IRF-Port1口上绑定的IRF物理端口相连，如图1-6所示。否则，不能形成IRF。一个IRF端口可以与一个或多个IRF物理端口绑定，以提高IRF链路的带宽以及可靠性

IRF的连接拓扑有两种：链形连接和环形连接，如右边所示。

链形连接对成员设备的物理位置要求比环形连接低，主要用于成员设备物理位置分散的组网。
环形连接比链形连接更可靠。因为当链形连接中出现链路故障时，会引起IRF分裂；而环形连接中某条链路故障时，会形成链形连接，IRF的业务不会受到影响。

B、拓扑收集：

每个成员设备和邻居成员设备通过交互IRF Hello报文来收集整个IRF的拓扑。IRF Hello报文会携带拓扑信息，具体包括IRF端口连接关系、成员设备编号、成员设备优先级、成员设备的桥MAC等内容。

每个成员设备由本地主用主控板进行管理，在本地记录自己已知的拓扑信息。设备刚启动时，本地主用主控板只记录了自身的拓扑信息。当IRF端口状态变为up后，本地主用主控板会进行以下操作：

将已知的拓扑信息周期性的从up状态的IRF端口发送出去；
在收到邻居的拓扑信息后，更新本地记录的拓扑信息；
如果成员设备上配备了备用主控板，则本地主用主控板会将自己记录的拓扑信息同步到本地备用主控板上，以便保持两块主控板上拓扑信息的一致。

经过一段时间的收集，所有成员设备都会收集到完整的拓扑信息。此时会进入角色选举阶段。

C、角色选举：

确定成员设备角色为主设备或从设备的过程称为角色选举。角色选举会在以下情况下进行：IRF建立、主设备离开或者故障、IRF合并等。其中，IRF合并包括合并前独立运行的两个（或多个）IRF合并为一个IRF和IRF分裂后重新合并两种情况。

IRF建立、主设备离开或者故障、独立运行的两个（或多个）IRF合并为一个IRF时，角色选举规则如下：

当前主设备优先，IRF不会因为有新的成员设备/主控板加入而重新选举主设备。不过，当IRF形成时，因为没有主设备，所有加入的设备都认为自己是主设备，则继续下一条规则的比较。
成员优先级大的优先。如果优先级相同，则继续下一条规则的比较。
系统运行时间长的优先。在IRF中，成员设备启动时间间隔精度为10分钟，即10分钟之内启动的设备，则认为它们是同时启动的，则继续下一条规则的比较。
CPU MAC小的优先。

通过以上规则选出的最优成员设备即为主设备，其它成员设备则均为从设备。IRF分裂后重新合并时，原Recovery状态IRF中所有成员设备自动重启以从设备身份加入原正常工作状态的IRF，原正常工作状态的IRF的主设备作为合并后IRF的主设备。在角色选举完成后，IRF形成，进入IRF管理与维护阶段。

IRF合并的情况下，每个IRF的主设备间会进行IRF竞选，竞选仍然遵循角色选举的规则，竞选失败方的所有成员设备重启后均以从设备的角色加入获胜方，最终合并为一个IRF。合并过程中的重启是设备自动完成还是需要用户手工完成与用户的配置有关，请参见开启IRF合并自动重启功能。

不管设备与其它设备一起形成IRF，还是加入已有IRF，如果该设备被选为从设备，则该设备会使用主设备的配置重新启动，以保证和主设备上的配置一致，本设备上的配置文件还在，但不再生效，除非设备恢复到独立运行模式。

D、管理与维护：

角色选举完成之后，IRF形成，所有的成员设备组成一台虚拟设备存在于网络中，所有成员设备上的资源归该虚拟设备拥有并由Master统一管理。

1、成员编号：

在运行过程中，IRF系统使用成员编号（Member ID）来标志和管理成员设备，并在端口编号和文件系统中引入成员编号的标识信息。该编号关系到整个IRF的管理和运行，因此，需要用户在设备加入IRF前统一规划、配置设备的成员编号，以保证IRF中成员编号的唯一性。

如果建立IRF时成员设备的编号不唯一（即存在编号相同的成员设备），则不能建立IRF；如果新设备加入IRF，但是该设备与已有成员设备的编号冲突，则该设备不能加入IRF。请在建立IRF前，统一规划各成员设备的编号，并逐一进行手工配置，以保证各设备成员编号的唯一性。

端口命名规则有以下2种方式。

对于单独运行的设备（即没有加入任何IRF），端口编号采用设备编号/子槽位编号/端口序号的格式，其中：

缺省情况下，设备编号为1。
如果设备曾经加入过IRF，则在退出IRF后，仍然会使用在IRF中时的成员编号作为自身的设备编号。
子槽位编号：接口卡所在槽位的编号。对于S5120-SI系列交换机，前面板上所有端口的子槽位编号均为0。
端口序号与各型号交换机支持的端口数量相关，请查看设备面板上的丝印。

比如，要将单独运行的设备Sysname的端口GigabitEthernet1/0/1的链路类型设置为Trunk，可参照以下步骤：

system-view

[Sysname] interface gigabitethernet 1/0/1

[Sysname-GigabitEthernet1/0/1] port link-type trunk

对于IRF中的成员设备，端口编号仍然采用成员设备编号/子槽位编号/端口序号的格式，其中：

成员设备编号用来标志不同成员设备上的端口。
子槽位编号和端口序号的含义和取值与单独运行时的一样。

比如，要将IRF中的成员设备Slave3（成员编号为3）子槽位0上第一个端口的链路类型设置为Trunk，可参照以下步骤：

system-view

[Sysname] interface gigabitethernet 3/0/1

[Sysname-GigabitEthernet3/0/1] port link-type trunk

2、IRF拓扑维护：

如果某成员设备A down或者IRF链路down，其邻居设备会立即将“成员设备A离开”的信息广播通知给IRF中的其它设备。获取到离开消息的成员设备会根据本地维护的IRF拓扑信息表来判断离开的是Master还是Slave，如果离开的是Master，则触发新的角色选举，再更新本地的IRF拓扑；如果离开的是Slave，则直接更新本地的IRF拓扑，以保证IRF拓扑能迅速收敛。

3、多IRF冲突检测（MAD功能）：

IRF链路故障会导致一个IRF变成两个新的IRF。这两个IRF拥有相同的IP地址等三层配置，会引起地址冲突，导致故障在网络中扩大。为了提高系统的可用性，当IRF分裂时我们就需要一种机制，能够检测出网络中同时存在多个IRF，并进行相应的处理尽量降低IRF分裂对业务的影响。MAD（Multi-Active Detection，多Active检测）就是这样一种检测和处理机制。它主要提供以下功能：

分裂检测：通过LACP（Link Aggregation Control Protocol，链路聚合控制协议）、BFD（Bidirectional Forwarding Detection，双向转发检测）或者免费ARP（Gratuitous Address Resolution Protocol）来检测网络中是否存在多个IRF；
冲突处理：当检测到网络中存在多个IRF时，让Master成员编号最小的IRF继续正常工作（维持Active状态），其它IRF会迁移到Recovery状态（表示IRF处于禁用状态），并关闭Recovery状态IRF中所有成员设备上除保留端口以外的其它所有物理端口（通常为业务接口），以保证该IRF不能再转发业务报文；
MAD故障恢复：IRF通过日志提示用户多Active冲突。此时设备会尝试自动修复IRF链路，如果修复失败的话，需要用户手工修复。IRF链路修复后，分裂的IRF会重新合并，Recovery状态IRF会自动恢复到Active状态，被关闭的物理端口将自动恢复转发能力。异常情况下（比如Active状态的IRF断电或者故障等），可以通过命令行启用Recovery状态的IRF，Recovery状态的IRF会恢复到Active状态，被关闭的物理端口也会恢复转发能力。

4、IRF堆叠热备份：

配置文件的同步：IRF技术使用了严格的配置文件同步机制，来保证IRF中的多台设备能够像一台设备一样在网络中工作，并且在Master设备出现故障之后，其余设备仍能够正常执行各项功能。

IRF中的Slave设备在启动时，会自动寻找Master设备，并将Master设备的当前配置文件同步到本地并执行；如果IRF中的所有设备同时启动，则Slave设备会将Master设备的起始配置文件同步至本地并执行。
在IRF正常工作后，用户所进行的任何配置，都会记录到Master设备的当前配置文件中，并同步到IRF中的各个设备；用户在执行save命令将Master设备的当前配置文件保存为起始配置文件时，其它Slave设备均同步进行保存工作，以便使IRF中所有设备的起始配置文件保持统一。

通过即时的同步，IRF中所有设备均保存有相同的配置文件，即使Master设备出现故障，其它设备仍能够按照相同的配置文件执行各项功能。

配置文件的应用：设备的配置文件内容分为两部分：全局配置和端口配置，IRF中的Slave设备在应用Master设备上的这两种配置时，会采取不同的方式。

全局配置：所有的Slave设备都严格执行Master设备当前的全局配置，即IRF中所有成员设备所应用的全局配置都是相同的。
端口配置：Slave设备在应用Master设备上的端口配置时，只关注指定自身端口的配置（例如，编号为3的Slave设备只关注Master设备上是否具有GigabitEthernet3/0/x端口的配置）。如果Master设备上存在有自身端口的配置，则应用该配置；如果没有，则无论Slave设备在加入IRF前在自身端口下存在任何配置，均只以空配置方式工作。

三、MAD监测协议：

A、协议概述：

1、IRF分裂带来的问题：

IRF是指由多台设备通过IRF链路互相连接形成的一台虚拟设备，这台虚拟设备在网络中以一台独立设备的形态和其他设备进行通信。组建IRF的各台设备称为成员设备。

在IRF正常运行时，所有成员设备均使用相同的配置（包括IP地址、路由协议等所有功能配置）；当IRF链路出现故障时，会使IRF发生分裂，产生两个或多个新的IRF。此时，这些IRF各自的成员设备仍然运行着分裂前的配置，造成网络中存在多台IP地址以及其他三层配置相同的设备，会对网络中其他设备的协议运算和数据转发产生干扰，影响网络正常运行甚至导致数据丢失。

为了提高系统的可用性，当IRF分裂时我们就需要一种机制，能够检测出网络中同时存在多个IRF，并进行相应的处理尽量降低IRF分裂对业务的影响。MAD（Multi-Active Detection，多Active检测）就是这样一种检测和处理机制。

2、MAD检测技术介绍：

MAD 能够检测IRF的拓扑状态，并在 IRF 分裂后采取一定的安全措施保障网络正常运行，是 IRF 环境中推荐使用的维护类功能。MAD 从检测逻辑上分为直连检测与代理检测两种方式，两种检测方式互斥，不能同时使用。

MAD 的实现方式有三种：LACP（Link Aggregation Control Protoco l -链路聚合控制协议）、BFD（Bidirectional Forwarding Detection - 双向转发检测）、ARP（Address Resolution Protocol - 地址解析协议）、ND（Neighbor Discovery - 邻居发现）。MAD 主要提供以下功能：

分裂检测：通过LACP（Link Aggregation Control Protocol，链路聚合控制协议）、BFD（Bidirectional Forwarding Detection，双向转发检测）或者免费ARP（GratuitousAddress Resolution Protocol）来检测网络中是否存在多个IRF。

冲突处理：IRF分裂后，通过分裂检测机制IRF会检测到网络中存在其它处理Active状态（表示IRF处于正常工作状态）的IRF。

对于BFD MAD/ ARP MAD/ND MAD检测，冲突处理会直接让Master成员编号小的IRF处于Active状态，继续正常工作；其它IRF迁移到Recovery状态。
对于LACP MAD检测，冲突处理会先比较两个IRF中成员设备的数量，数量多的IRF处于Active状态，继续工作；数量少的迁移到Recovery状态；如果成员数量相等，则Master成员编号小的IRF处于Active状态，继续正常工作；其它IRF迁移到Recovery状态。

IRF迁移到Recovery状态后会关闭该IRF中所有成员设备上除保留端口以外的其它所有物理端口（通常为业务接口），以保证该IRF不能再转发业务报文。缺省情况下，只有IRF链路物理端口是保留端口，用户也可以通过mad exclude interface命令行将其它端口设置为保留端口。

MAD故障恢复：IRF链路故障导致IRF分裂，从而引起多Active冲突。因此修复故障的IRF链路，让冲突的IRF重新合并为一个IRF，就能恢复MAD故障。如果在MAD故障恢复前，处于Recovery状态的IRF也出现了故障，则需要将故障IRF和故障链路都修复后，才能让冲突的IRF重新合并为一个IRF，恢复MAD故障；如果在MAD故障恢复前，故障的是Active状态的IRF，则可以通过命令行先启用Recovery状态的IRF，让它接替原IRF工作，以便保证业务尽量少受影响，再恢复MAD故障。

检测方式	英文名	检测原理	是否依赖第三方设备	常见实现协议	特点
1️⃣ 直连检测	Direct MAD	堆叠成员之间直接通过专用链路发送 MAD 报文，相互检测是否多活。它不依赖上联聚合链路，而是在堆叠成员之间通过专用 VLAN（MAD VLAN）建立检测通道。	❌ 否	ARP MAD、ND MAD、BFD MAD	检测速度快、可靠性高，不依赖上联聚合
2️⃣ 代理检测	Relay MAD（或 Agent MAD）	各堆叠成员通过代理设备（如上联交换机）发送 MAD 报文，由代理设备中继检测多活状态	✅ 是	LACP MAD	无需专用MAD VLAN，依赖代理设备连接

IRF链路出现故障：IRF链路恢复或者修复正常后，系统会自动重启处于Recovery状态的IRF重启之后整个系统恢复正常

链路修复完成前：正常工作设备故障。此时，在Recovery状态的IRF会被执行mad restore命令。让处于Recovery状态的IRF恢复到正常状态，接替原来设备工作

B、各种方式介绍：

1、适用环境：

IRF支持的MAD检测方式有：LACP MAD检测、BFD MAD检测和ARP MAD检测。三种检测方式虽然原理不同但是功能效果相同，能够满足不同组网需求。

LACP MAD检测用于基于LACP的组网检测需求；
BFD MAD检测用于基于BFD的组网需求；
ARP MAD检测用于基于非聚合场合的Resilient ARP的组网检测需求。

这三种方式独立工作，彼此之间互不干扰。因此，同一IRF内可以配置多种MAD检测方式。

注意事项：
1、BFD MAD和STP功能互斥，用于BFD MAD检测的端口不能使能STP功能
2、使能BFD MAD检测功能的三层接口只能专用于BFD MAD检测，不允许运行其它业务。如果配置了其它业务，可能会影响该业务以及BFD MAD检测功能的运行。

2、LACP MAD检测原理：

LACP MAD检测是通过扩展LACP协议报文内容实现的，即在LACP协议报文的扩展字段内定义一个新的TLV（Type/Length/Value，类型/长度/值）数据域——用于交互IRF的DomainID（域编号）和ActiveD。

当网络中同时存在多个IRF时（比如IRF级联的组网情况），DomainID用于区别不同的IRF。当某个IRF分裂时，ActiveID用于MAD检测，用IRF中Master设备的成员编号来表示。

Domain ID：域编号，用于描述IRF组的编号，一个IRF内的所有成员设备Domain ID一致；Active ID：Master成员编号，为IRF中Master设备的成员编号

使能LACP MAD检测后，成员设备通过LACP协议报文和其它成员设备交互DomainID和ActiveID信息。

当成员设备收到LACP协议报文后，先比较DomainID。如果DomainID相同，再较ActiveID；如果DomainID不同，则认为报文来自不同IRF，不再进行MAD处理。
如果ActiveID相同，则表示IRF正常运行，没有发生多Active冲突；如果ActiveID值不同，则表示IRF分裂，检测到多Active冲突。
当这些LACP报文到达其它IRF的成员设备时，会产生多Active冲突。此时将由MAD功能发起竞选，并通过竞选机制关闭竞选失败的IRF。

LACP MAD检测组网要求：LACP MAD检测方式组网中需要使用中间设备，支持LACP协议扩展功能的H3C设备都能作为中间设备。

LACP MAD检测的配置步骤为：

配置IRF域编号；
创建聚合接口；（中间设备上也需要进行该项配置）
将聚合接口的工作模式配置为动态聚合模式；（中间设备上也需要进行该项配置）
在动态聚合接口下使能LACP MAD检测功能；
给聚合组添加成员端口。（中间设备上也需要进行该项配置）

3、BFD MAD检测原理：

BFD（Bidirectional Forwarding Detection，双向转发检测）协议用于快速检测、监控网络中链路或者IP路由的转发连通状况，保证邻居之间能够快速检测到通信故障。BFD MAD就是利用BFD技术来实现MAD快速检测。

采用BFD MAD检测时，需要在IRF的成员设备之间搭建BFD检测链路，该链路可以在成员设备间直接连接，也可以通过其他设备进行透传。另外，还要创建一个VLAN接口作为BFD MAD检测VLAN，并为每台成员设备配置不同的MAD IP地址，与成员设备编号进行绑定，用于成员设备间BFD检测及分裂后的竞选。配置BFD有以下2点注意事项：

用于BFD MAD检测的接口以及BFD MAD检测链路上的端口必须为BFD MAD功能专用，不能传输业务数据，也不能配置包括ARP、LACP在内的所有的二层或三层协议应用。
如果网络中存在多个IRF，在配置BFD MAD时，各IRF必须使用不同的VLAN作为BFD MAD检测专用VLAN。

开启BFD MAD检测功能后，IRF内的Master设备会使用自身的MAD IP作为BFD会话的源IP，向BFD MAD链路上的其他成员设备尝试建立BFD会话。

当IRF正常运行时，除Master外其它成员设备的MAD IP不会生效，因此BFD会话无法建立。
在IRF发生分裂后，不同IRF中的Master设备将继续向BFD MAD检测链路上的其他设备尝试建立BFD会话。由于其它IRF中Master设备的MAD IP已经生效，因此BFD会话可以正常建立。此时MAD功能会提示网络中存在了多个处于工作状态的IRF。由于MAD IP与成员编号是一一绑定的，因此每个IRF都能通过BFD会话获取相邻IRF的ActiveID，MAD功能可以通过竞选将竞选失败的IRF关闭。

BFD MAD检测组网要求：BFD MAD检测方式可以使用中间设备来进行连接，也可以不使用中间设备。所有成员设备之间必须有一条BFD MAD检测链路，这些链路连接的接口必须属于同一VLAN，在该VLAN接口视图下给不同成员设备配置同一网段下不同IP地址。

BFD MAD检测功能的配置顺序为：

创建一个新VLAN，专用于BFD MAD检测；（如果用到中间设备组网，中间设备上也需要进行该项配置）
确定使用哪些物理端口用作BFD MAD检测（每台成员设备上至少一个），并将这些端口都添加到BFD MAD检测专用VLAN中；（如果用到中间设备组网，中间设备上也需要进行该项配置）
为BFD MAD检测专用VLAN创建VLAN接口，在接口下使能BFD MAD检测功能，并配置MAD IP地址。

MAD 直连（BFD MAD）检测的组网方式：

连接方式	拓扑结构	特点	适用场景
① 通过中间设备互通	堆叠成员都接入同一台二层交换机的 MAD VLAN	不需直连，方便扩展，多台设备可共用	通常用于多成员堆叠
② Full-Mesh 全互连	每个成员设备间均有 MAD VLAN 链路	最可靠，不依赖中间设备，但布线复杂	成员数量少、要求高可靠性场景

4、ARP/ND MAD检测原理：

ARP MAD的实现方式与LACP MAD类似，不同之处在于ARP MAD是利用免费ARP报文来携带IRF的ActiveID。

ARP MAD的检测链路可以在IRF成员设备间直接建立，也可以通过中间设备建立，由中间设备将免费ARP报文透传至其他成员设备。在常见的组网中，通常都是用中间设备结合MSTP功能实现免费ARP报文的交互。

中间设备通过MSTP双上行的方式连接到IRF中的两台成员设备。

当IRF正常运行时，接入层设备会通过MSTP算法阻塞一条上行链路，使成员设备发送的免费ARP报文无法到达另一台成员设备。
在IRF发生分裂后，由于网络拓扑发生变化，中间设备会将阻塞的端口打开，此时两个IRF之间便可以接收到各自发送的免费ARP报文。由于两台IRF的IP地址相同但MAC地址不同，因此会产生免费ARP的冲突，即表示发生了多Active冲突。此时将由MAD功能发起竞选，比较两个IRF发送的免费ARP报文中携带的ActiveID，并关闭竞选失败的IRF。

ARP MAD检测组网要求：ARP MAD检测方式可以使用中间设备来进行连接，也可以不使用中间设备。成员设备之间通过两台上行设备交互免费ARP报文，Device、Master和Slave上都要配置生成树功能，以防止形成环路。