高速网络技术变革,RoCE取代IB之路

68c51bf065682bc94b0a5c19166de098.jpeg

RoCE取代IB:为何之前是IB,现在是RoCE?

   

3c175cb20545c8fed1e24b7a8affcb83.jpeg

以太网在AI算力中的Why、How和What”。

超以太网联盟(UEC)由Linux基金会和联合开发基金会共同发起,旨在超越传统以太网功能。通过RDMA和RoCE等技术,UEC为HPC和AI计算提供高性能、分布式和无损传输层。其创始成员包括AMD、Arista、博通、思科、Eviden、HPE、Intel、Meta和微软等业界领军企业。

至2024年3月19日,UEC已壮大其队伍,新增45名成员。同时,我们发布了UEC规范1.0白皮书,详细解读了其八大功能以及超以太网传输(UET)的卓越性能。

2024年《IPv6+创新与标准技术合集》中国边缘云市场报告:1. IPv6+的创新与标准; 2. IPv6赋能智算网络,展望《VMware Tanzu容器技术合集》。探讨基于IPv6网络的移动目标防护、访问控制及融合策略。揭秘空间数据智能:从概念到挑战。全面解读泛在计算安全。

5433b85980bcbb718d30604740380e1d.jpeg

博通,全球领先的有线和无线通信半导体巨头,已在业界砥砺前行60载,凭借深厚的技术底蕴和丰富的产品线,稳居行业领先地位。在RoCE领域,博通全面布局控制器、适配器、NIC、交换机四大关键环节,已推出超过30款优质产品。近期,博通更是凭借第四代RoCE技术,推出单端口400GbE以太网适配器N1400GD和单端口400GPCIe以太网NIC P1400GD,这两款产品主要服务于AI、云计算、高性能计算以及存储网络的构建,再次彰显了博通在通信领域的创新实力。

95e1aebfb06175821fff8942c3604720.jpeg

英伟达在 NIC 和交换机方向进行布局,尽管此前英伟达是 InfiniBand 的主要推动者及供应商,但也持续在 RoCE 方向布局,陆续推出 Spectrum SN4000 和 Spectrum SN5000 交换机则,并于今年推出与 IB 新产品同规格的 Spectrum X800 交换机,同时计划于 2025 年推出 512 端口的 Spectrum UltraX800 交换机,于 2026 年推出带宽相比 X800 翻倍的 X1600。

26351304f1cd14fd84ba5afe564b912e.jpeg

自2020年以来,Meta公司一直专注于运营基于RoCE的分布式训练集群。然而,在早期阶段,公司面临着一致性的挑战。为了实现RoCE在AI计算应用中的落地,Meta作为创始成员之一,成立了超以太网联盟,并积极推动RoCE的部署。通过使用Arista 7800和Wedge 400等设备构建的RoCE网络,Meta成功实现了400G的互连。目前,这一技术已经成功应用于Llama3集群中。

9bbf7868b98075356a4c30456f059f54.jpeg

RDMA技术,凭借其高并发、低延迟的特性,优于传统的TCP/IP,成为AI计算的首选。相较于TCP/IP的软硬件架构,RDMA直接通过网卡访问GPU显存数据,绕过操作系统和CPU,实现高吞吐、低延迟的网络通信。这种优势使其在大规模并行AI计算集群中表现出色。

cf40bb189a59a95039709fe8e875b856.jpeg

74f08a83de78bf9f4236085f0c94109b.jpeg

Infiniband、RoCE(RDMA over Converged Ethernet)、iWARP,三款支持RDMA的网络各具特色。它们分别代表着高速、高效和灵活的数据传输方式。

Infiniband:专为RDMA设计,硬件级保障可靠传输,应用效果卓越。无需额外研发,但需配备IB网卡和交换机支持。尽管成本略高,但性能无可挑剔。

RoCE:采用以太网和UDP传输层协议设计,资源消耗降低。仅需普通以太网交换机,但需配备专门支持RoCE的网卡。

iWARP:基于以太网传输层TCP协议,实现可靠的数据传输。相较于RoCE,在大规模组网中,iWARP依赖的众多TCP连接会消耗大量内存资源(而RoCE的UDP连接则无需如此),因此对系统规格的要求更高。尽管可以采用普通的以太网交换机,但必须配备专门支持iWARP的网卡。

dca4b73c3cc4ec6808b83eb467ad294f.jpeg

在AI算力建设的浪潮中,IB曾被视为早期局部最优解,而RoCE则成为更广泛的最优解。随着AI算力建设的加速推进,高吞吐、低延迟的网络需求催生了对支持RDMA网络通信的需求。英伟达H系列GPU的持续供不应求现象也反映出,各算力投资方在短时间内实现快速、高质量、高数量的算力落地是核心诉求。因此,英伟达的GPU与天然适配RDMA的IB网络架构相结合,成为了当时的最优解。

长远来看,以太网/RoCE在云计算领域的应用基础更为深厚,实现成本更低。随着技术的日益成熟和推理需求的崛起,以太网将逐步成为AI算力舞台的核心。


-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3250685.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

SMTP服务器地址与端口号有哪些关系与区别?

SMTP服务器地址如何正确配置?怎么验证服务器的地址? 了解SMTP服务器地址与端口号的关系与区别对于确保邮件系统的正常运作至关重要。AokSend将详细探讨这两者之间的关系和区别,并解释它们在邮件传输过程中的重要性。 SMTP服务器地址&#x…

PHP萌宠之家微信小程序系统源码

🐾萌宠之家微信小程序🐾 —— 铲屎官们的温馨小窝✨ 🏠【一键开启萌宠乐园】🏠 亲们,是不是每次刷手机都忍不住想看看那些软萌可爱的毛孩子?现在,有了“萌宠之家”微信小程序,你的…

两种调用方法可以让Contact form 7表单在任意地方显示

Contact form 7是wordpress建站过程中最常用到的插件之一,不过,在Contact form 7调用的时候,有些新手还是搞不太清楚它的调用方法。下面简站wordpress小编,就把常用的两种调用方法,分享给大家: Contact fo…

期权末日双买跨式策略-这才是末日轮稳定赚钱的方法吗?!

今天带你了解期权末日双买跨式策略-这才是末日轮稳定赚钱的方法吗?!期权末日双买跨式策略是一种在期权到期日前预期市场会出现大幅波动时使用的策略。 期权双买跨式策略适合期权末日轮是因为它能利用临近到期日时市场潜在的大幅波动来获利。末日轮期权&…

深入理解ADB:Android调试桥详解与使用指南

🍎个人博客:个人主页 🏆个人专栏:Android ⛳️ 功不唐捐,玉汝于成 目录 前言 正文 1. 什么是ADB? ADB的基本原理: 2. ADB的安装与配置 安装ADB工具集: 配置ADB环境变量&am…

数据传输工具性能深度评测(阿里云、百度智能云)

阿里云、百度智能云作为领先的云服务提供商,都为数据库提供了配套的数据库工具服务,其中 DTS 是迁移与同步业务的核心服务,本次测试旨在深入比较阿里云与百度智能云在 DTS 数据传输服务性能方面的表现,为企业在选择合适的数据传输…

JVM之运行时数据区(一):程序计数器+本地方法栈

JVM之运行时数据区(一):程序计数器本地方法栈 1.运行时数据区概述2.程序计数器作用特点常见问题 3.本地方法接口本地方法本地接口 4.本地方法栈特点 1.运行时数据区概述 Java虚拟机定义了若干种程序运行期间会使用到的运行时数据区其中有一些…

单相非交错CCM图腾柱无桥PFC电流采样问题

目录 前言 仿真复现 调整采样后 总结 前言 之前总结了双向交错图腾柱的学习和实现过程,由于PWM开关频率够高,且采样的是总电流,电流开关谐波较小,采用的是固定位置采样的方案。后面出于对成本的考虑,器件选型等。P…

gitlab新建仓库

总贴 每个git网站都有不同的创建项目的方式,现在举例gitlab,其他例如gitee,gitcode,都是差不多的,自行百度 1![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/dae875d9048940c0aeb292c07d6a4a62.png)1和2是项…

android串口通讯(JAVA)

一、app目录下添加 implementation io.github.xmaihh:serialport:2.1.1 1) 点击Sync Now更新依赖 2) AndroidManifest.xml文件添加读取设备信息权限 <uses-permission android:name"android.permission.READ_PHONE_STATE" /> 二、 使用 1) 创建MySerialPo…

UE4-蓝图(可视化编程)学习

一.开关门交互实现 1.需要用到的模板和内容包 2.给门添加碰撞 进入第三人称模板场景&#xff0c;找到门的模型&#xff0c;并将门的模型添加到我们的场景中&#xff1a; 此时我们运行游戏&#xff0c;会发现我们的角色可以穿过我们门的模型&#xff0c;说明我们没有给门添加碰…

从构思到实现:8款高效原型图设计软件指南

高效率地完成工作&#xff0c;那必定是使用更新的工具。作为产品经理&#xff0c;如何快速设计产品&#xff1f;一个优秀的产品原型工具是必不可少的。如何选择合适的原型工具&#xff1f;小编专门整理了8种产品原型工具供参考&#xff0c;并简要介绍了曲线、性价比、功能优缺点…

第122天:内网安全-域信息收集应用网络凭据CS 插件AdfindBloodHound

目录 前置知识 背景和思路 判断是否在域内 案例一&#xff1a;架构信息类收集-网络&用户&域控等 案例二&#xff1a;自动化工具探针-插件&Adfind&BloodHound Adfind(域信息收集工具) ​BloodHound&#xff08;自动化域渗透工具&#xff09; 前置知识 本…

VS2019+CMake+Vtk9.3.0+Qt5.14.2 配置

VS2019CMakeVtk9.3.0Qt5.14.2 配置环境 第一步 下载 基本配置 系统环境&#xff1a;windows11 x64 Qt&#xff1a;5.14.2 这是最后最新的LTS qt离线版本&#xff0c;后续版本都需要在线安装&#xff0c;同时使用qt5.14也避免版权问题。 Qt 5.14&#xff1a;大部分模块基于LG…

虚继承(C++)

目录 菱形继承 虚继承 虚继承原理 虚继承使用注意事项&#xff1a; 不要把所有的遗憾都留给未来&#xff0c;趁年轻出去走走&#xff0c; 让我们用心去感受这个世界&#xff0c;用脚步去丈量这个世界的距离。 这里是来自M--Y的专栏&#xff1a;C启&#xff08;&#xff09;航…

Websocket自动消息回复服务端工具

点击下载《Websocket自动消息回复服务端工具》 1. 前言 在进行Websocket开发时&#xff0c;前端小伙伴通常是和后端开发人员同步进行项目开发&#xff0c;经常会遇到后端开发人员接口还没开发完&#xff0c;也没有可以调试的环境&#xff0c;只能按照接口文档进行“脑回路开发…

Problems retrieving the embeddings data form OpenAI API Batch embedding job

题意&#xff1a;从OpenAI API批量嵌入作业中检索嵌入数据时遇到问题 问题背景&#xff1a; I have to embed over 300,000 products description for a multi-classification project. I split the descriptions onto chunks of 34,337 descriptions to be under the Batch e…

大数据学习之常见问题1

1、什么是数据仓库&#xff1f; 数据仓库&#xff1a;对数据进行采集、清洗、加工和输出 是一个面向主题的、集成的、随时间变化的、非易失的数据集合&#xff0c;用于支持管理决策过程。 2、通常情况下&#xff0c;分哪些层&#xff0c;分别干什么&#xff1f; ods&#xff1a…

流量卡什么时候激活比较适合,这个问题你考虑过吗?

在办理流量卡时&#xff0c;很多朋友不知道什么时候激活比较划算&#xff0c;在这里文章里&#xff0c;小编给大家简单的说一下&#xff0c;可供参考。 ​ 1、大家要知道&#xff0c;在使用流量卡时&#xff0c;流量卡的激活时间就是号卡的入网时间&#xff0c;也是计费的开始。…

SDXL 1.0 下载和部署

SD XL 1.0 重磅更新&#xff01;免费开源可商用&#xff08;附在线使用本地部署教程&#xff09; - 优设网 - 学设计上优设 三、本地部署 SDXL 1.0 SDXL 1.0 的源文件已经在 Huggingface 上开源了&#xff0c;我们可以通过 Stable Diffusion WebUI 在本地免费使用 SDXL 1.0&am…