人工智能 (AI) 应用通常涉及大型数据集。工作负载可能需要多个分布式 CPU 和 GPU 实时相互通信。这是高性能计算 (HPC) 架构的本质。
在处理元件之间路由高速数字信号引入了芯片到电路板和电路板到电路板的连接。通信协议和物理标准已经开发出来以满足高速要求,通常基于信号完整性标准。这些标准还促进了供应商之间的互操作性。
偶尔会使用非标准连接器,有时是因为特定的外形尺寸要求或其他机械限制。在这些情况下,可以通过将其规格与行业标准部件的规格进行比较来确定它们是否适合应用。
AI数据带宽
考虑信号完整性时,带宽和阻抗是关键的电气特性。引脚数、所用材料和安装方法是影响性能和可靠性的重要机械考虑因素。HPC 系统消耗的功率不断增加,在提高数据中心功率效率的情况下,接触电阻变得越来越重要。
在处理器接口处,与 CPU 的无焊连接采用的是接地栅格阵列 (LGA) 或引脚栅格阵列 (PGA) 封装形式。英特尔发明了 LGA,并将其用于几乎所有 CPU。如果处理器不是设计为用户可更换的,则可以使用球栅阵列 (BGA)。BGA 使用焊球将组件连接到印刷电路板。这是 GPU 最常见的方法,但它也用于某些 CPU。
内存和处理器之间的数据传输速率仍然是整个系统性能的关键因素。对于使用随机存取存储器 (RAM) 的系统,最新的发展是从 DDR4 到 DDR5 的演变。DDR4 标准支持高达 25.6 Gbps 的数据速率。DDR5 将其提升至 38.4 Gbps。
该标准影响了芯片接口的设计。最新的 LGA 4677 IC 插槽提供高达 128 Gbps 的链路带宽,通常支持 8 通道 DDR5 内存。4677 个紧密排列的连接点可承载高达 0.5 A 的电流,这表明了当今高性能处理器的功率需求。
双列直插式内存模块 (DIMM) DDR5 内存插槽现在支持高达 6.4 Gbps 的带宽,最佳的机械设计可节省空间,同时改善印刷电路板上组件周围的气流。
超越人工智能
PCI Express:大多数处理器板都会有多个用于连接器的 PCI Express (PCIe) 插槽。插槽类型有 x1、x4、x8 和 x16。最大的插槽通常用于与 GPU 的高速连接。PCIe 协议标准允许最多 32 个双向、低延迟、串行通信“通道”。
对于内部系统组件与外部世界的通信,以下协议和连接器类型是最受欢迎的。
PCI Express:大多数处理器板都会有多个用于连接器的 PCI Express (PCIe) 插槽。插槽类型有 x1、x4、x8 和 x16。最大的插槽通常用于与 GPU 的高速连接。PCIe 协议标准允许最多 32 个双向、低延迟、串行通信“通道”。
每个通道都是一组差分对,一个用于传输数据,一个用于接收数据。该标准的最新版本于 2022 年 1 月发布,即 PCIe 6.0。它提供的带宽是其前代产品的两倍,高达 256 Gbps,工作频率为 32 GHz(与 PCIe 5.0 相同)。
PCIe 6.0 仍处于早期采用阶段,目前硬件可用性有限,尽管以安富利为代表的一些领先供应商已经宣布推出新的兼容连接器。
InfiniBand: InfiniBand 是一种高速、低延迟协议,常见于 HPC 集群中。其最大链路性能为 400 Gbps,可支持子网中的数千个节点。InfiniBand 可以使用板级连接,并支持有源和无源铜缆、有源光缆和光收发器。InfiniBand 与光纤通道和以太网协议互补,但 InfiniBand 贸易协会声称它“提供比这两种协议更高的性能和更好的 I/O 效率”。高速应用的常见连接器类型有 QSFP+、zQSFP+、microQSFP 和 CXP。
以太网:传统上与标准网络相关联,高速千兆以太网在 HPC 中变得越来越常见。除了 InfiniBand 列出的连接器类型外,这些应用的主要连接器类型是 CFP、CFP2、CFP4 和 CFP8。
CFP 代表 C 型可插拔,CFP2/CFP4 版本提供每通道高达 28 Gbps 的带宽,并支持 40 Gbps 和 100 Gbps 以太网 CFP 兼容光收发器。CFP8 连接器具有 16、25 Gbps 通道,可支持高达 400 Gbps 的连接。
光纤通道:这种成熟的协议专用于存储区域网络 (SAN),广泛部署在 HPC 环境中。它支持光纤和铜介质,提供低延迟、高带宽和高吞吐量。
它目前支持高达 128 Gbps 的连接,即 128 千兆位光纤通道 (GFC),并且有一个行业协会路线图支持高达 1 兆兆位光纤通道 (TFC) 的协议。用于光纤通道的连接器范围从传统的 LC 类型到用于最高带宽连接的 zQSFP+。
串行连接技术附件 (SATA) 和串行连接 SCSI (SAS):这些是用于连接 HPC 集群中的硬盘和固态存储设备的高速数据传输协议。
两种协议都有专用的连接器格式,包括内部和外部变体。SAS 通常是 HPC 的首选协议,但它比 SATA 更昂贵,因此两者仍在广泛使用。SAS 是速度更高的选项,提供高达 12 Gbps 的接口连接,但存储设备的运行速度通常是数据传输速率的限制因素。
无源元件和供电 AI 处理器
随着处理速度和数据传输速率的提高,对无源元件的需求也随之增加。
为数据中心的 AI 处理器供电意味着用于分散式电源架构中 EMI 滤波的铁氧体磁芯电感器可能需要承载数十安培的电流。低直流电阻和低磁芯损耗至关重要。最近的创新包括单匝扁平线铁氧体电感器。它们的电感器版本从 47 nH 到 230 nH,设计用于负载点电源转换器 - 靠近处理器的电源转换器,以最大限度地减少电路板电阻损耗。这些类型的电感器的额定电流高达 53 A,最大直流电阻额定值仅为 0.32 毫欧姆,可最大限度地减少损耗和散热。
高性能处理需要高电流和电源轨,具有良好的电压调节和对瞬变的快速响应。例如,避免因负载电流大变化而导致的电压下降非常重要。为实现这些设计目标,部署了多种电容器技术。
通常,设计人员需要超越电容和电压额定值来考虑频率相关特性如何影响性能。
在需要高电容值的地方,铝电解电容器一直是传统选择,因为它们在小封装中具有高 CV 值,而且成本低。然而,聚合物电介质和混合电介质(固体聚合物 + 液体电解质电介质)因其较低的等效串联电阻 (ESR)和较长的使用寿命而变得越来越受欢迎。
数据中心的高功耗已将机架架构中使用的电压从 12 V 推高至 48 V,以提高电源效率。专为高纹波电流能力(高达 26 A)而设计的 48 V 额定铝聚合物电容器现在的电容值高达 1,100 µF。一家制造商以矩形形式提供这些电容器,使其适合堆叠成模块,以实现更高的电容和良好的体积效率。
多层陶瓷电容器 (MLCC) 广泛应用于电源滤波和去耦,尤其是因为它们具有低 ESR 和低等效串联电感 (ESL)。它们的值范围很广,跨越 9 个数量级。
制造商通过材料和制造工艺的开发不断提高 MLCC 的体积效率。一家公司最近宣布推出一款 1608M(1.6 毫米 x 0.8 毫米)尺寸的多层陶瓷电容器 (MLCC),额定值为 1 µF/100 V,可用于服务器和数据中心的 48 V 电源线。据信,这是该封装尺寸中 100V 额定多层陶瓷电容器的最大电容,与之前最小的 2012M 封装相比,体积节省了 67%,表面积节省了 49%。
其他最新进展包括创新的封装技术,用于在不使用金属框架的情况下将 MLCC 粘合在一起。该技术通过使用高导电性粘合材料来生产包含所需数量的 MLCC 的单个表面贴装元件,从而保持较低的 ESR、ESL 和热阻。陶瓷电容器的介电材料随电压变化的电容变化很小,随环境温度变化的电容变化可预测且呈线性,因此是滤波和去耦应用的首选。
结论
总之,人工智能系统对高处理器性能的需求对无源和机电元件的选择提出了特定要求。选择这些元件时必须注重高速数据传输、高效供电、热管理、可靠性、信号完整性、尺寸限制以及人工智能应用的特定要求,确保电子系统能够有效、可靠地满足人工智能工作负载的需求。
作为 IP&E 解决方案的全球领导者,安富利在所有地区都拥有强大的供应商产品线,以及广泛的设计支持和需求创造服务。我们专业的 IP&E 专家可以满足从供应链需求到服务组织要求的所有需求。