10月11日美国旧金山现场报道:
除了正式发布升级版的Instinct MI325X GPU加速卡,AMD还宣布了全新的下一代Instinct MI350系列的首款产品Instinct MI355X,并披露了部分规格、性能数据。
MI355X将在2025年下半年上市,也就是还有差不多一年时间。
MI350系列将首次升级为台积电3nm工艺,首次采用CDNA 4架构,首次引入FP6、FP4浮点数据类型,搭配内存还是HBM3E但是容量高达288GB。
具体功耗没有披露,但是MI325X已经最高达1000W,AMD也透露MI355X会顺应行业趋势(NVIDIA B200 1000W、GB200 1700W),因此必然会显著超过1000W。
FP6、FP4都属于浮点数据格式,分别代表6位、4位精度,也就是只需6位、4位就能表达一个数字,相比于FP16、F8精度大大降低,但是数据处理量也大大减少,适合大模型的量化,特别是大语言模型和混合专家模型。
如果你不需要太高的精度,更想要速度,FP6、FP4就非常适合。
MI355X上的FP6、FP4浮点性能都是9.2 PFlops(每秒9200万亿次运算),同时还将FP16、FP8性能都提升了80%,分别达到2.3 PFlops、4.6 PFlops。
NVIDIA Blackwell GPU同样引入了FP6、FP4精度,但是性能更高,分别达20 PFlops、40 PFlops。
单卡多达288GB HBM3E内存确实是无可匹敌,同时带宽高达8TB/s。
对比MI325X分别多出1/8、1/3,而相比目前已上市的MI300X都增加了足足50%。
对比竞品,Blackwell B200也只有192GB HBM3E,但带宽同样做到了8TB/s。
MI355X同样支持单平台八卡,这样就有总计2.3TB HBME内存、64TB/s带宽,性能更是高达FP16 18.5 PFlops、FP8 37 PFlops、FP6/FP4 74 PFlops。
它也将在明年下半年供货。
Instinct系列的性能进步幅度无疑是飞跃性的,一代一个新模样,跨代对比更是惊人。
MI355X对比MI300X,FP16性能达到了7.4倍之多,HBM容量也有1.5倍,所能处理的模型参数规模,也从7140亿增加到4.2万亿,足足6倍之多。
展望未来,2026年将推出再下一代的Instinct MI400系列,基于再下一代的CDNA架构(CDNA 5?),规格和性能必将再次迈上一个大大的台阶。