除了基于3D V-Cache堆叠缓存的升级版霄龙7003x系列处理器,AMD还为数据中心带来了另一款神器:Instinct MI200系列加速卡(加速器)。

这是AMD的第一款ExaScale百亿亿次级别加速卡产品,号称在同类产品中拥有世界上最快的HPC能、AI能。

Instinct MI200系列升级为新的CDNA2计算架构,搭配升级的6nm FinFET工艺,并使用2.5D EFB桥接技术,业内首创多Die整和封装(MCM),内部集成了两颗核心。

还有第三代Infinity Fabric总线互连技术,带宽100GB/s,最多8条与第三代霄龙处理器互通,实现CPU/GPU内存一致

软件API支持OpenMP、OpenCL、HIP、ROCm Open、TensorFlow、PyTorch、Kokkos、RAJA。

新系列分为两款型号,Instinct MI250X集成了220个计算单元、14080个流处理器核心,最高频率1.7GHz,并有第二代矩阵核心,峰值能为:FP16半精度383TFlops、FP32单精度/FP64单精度47.9TFlops、FP32单精度/FP64双精度矩阵95.7TFlops、INT4/INT8/BF16 383TFlops。

内存/显存搭配8192-bit位宽的128GB HBM2e,频率1.6GHz,峰值带宽3276.8GB/s,并支持全芯片ECC。

整卡采用OAM模块形态(未来也会推出PCIe扩展卡形态),支持PCIe 4.0 x16,被动散热(系统散热),典型功耗500W,峰值功耗560W。

Instinct MI250精简为208计算单元、13312流处理器核心,各项能指标也顺应下降约5.5%,其他规格完全不变。

AMD宣称,Instinct MI200系列能双精度能比竞品高出最多4.9倍,比上代提升最多4倍。

MI200系列已经赢得了多项客户解决方案,包括ATOS BullSequana X410-A5 2U1N2S(双CPU四GPU)、戴尔PowerEdge R7525(双CPU三GPU)、技嘉G262-Z00(双CPU四GPU)、HPE Cray EX235a(单CPU四GPU)等等,其他客户还有话说、联想、KOI Cmputers等等。

尤其是与美国国防部橡树岭国家实验室、HPE合作打造的超级计算机“Frontier”,采用第三代霄龙处理器、MI250X加速卡,峰值算力高达150亿亿次浮点计算每秒。

关键词: AMD发布 MI250X 加速卡 HPC性能