网络自愈,基于硬件的自愈机制


网络自愈

Nvidia IB交换机具备基于硬件的自愈机制,能够在1毫秒内实现快速恢复。

一般的子网管理功能,当节点达到1000以上时,网络恢复时间为5-30秒,这还不够快,为了解决这个问题,nvidia设计了一种新的创新解决方案,称为SHIELD™(智能数据中心的自修复互连增强),它利用了最新一代InfiniBand交换机中已经内置的智能。通过使结构具有自我修复的自主性,在链路故障时纠正通信的速度可以加快5000倍,快到足以使通信免于昂贵的重传或绝对故障,实现毫秒级恢复。

SHIELD支持两种通信恢复机制。第一种也是最简单的情况是,交换机有多条转发路由到达期望的目的地。在这种情况下,交换机可以做出独立的决定,将数据包转发到将其设置在新的可行路由上的备用端口。但是,在某些情况下,从经历链路故障的交换机(例如Fat-Tree网络拓扑中的下行交换机)无法获得到所需端点的替代路由。在这种情况下,交换机可以将带内信息传递给网络中的另一台交换机,这台交换机可以选择最有效的替代路由,这样它就可以负责重路由流量。执行此操作所需的总时间大约为1微秒.



公众号