B200 在ubuntu24.04驱动部署全流程


在第四代nvlink中nv引入了一个新的组件nvlsm,即nvlink子网管理器。同时B系列也需要OFED驱动以加载ib相关内核模块,否则fabricmanager运行不起来。所以在B系列的HGX机型中我们一共需要安装以下几个包:DOCA-OFED(ib相关驱动)GPU驱动CUDA toolkitn

【飞牛nas】nfs使用rdma(基于infiniband)


前置:1.保证ip a命令能够查看到ib相关的接口,如果不行先检查lspci是否识别到ib卡,然后按照第二步操作加载ib相关内核模块。2.配置IPoIB,可以使用nmtui快速配置基于飞牛os的nfs rdma实施:无需安装驱动,debian12默认加载了ib相关内核模块:modprobe svcr