12 月 24 日消息,科技媒体 SemiAnalysis 于 12 月 22 日发布博文,表示经过长达 5 个月的深入调研后,发现 AMD 的新款 MI300X AI 芯片虽硬件强大,但软件问题严重,难以撼动英伟达的市场主导地位。

AMD MI300X 评估:强悍硬件难掩软件短板,难以跨越英伟达“CUDA 护城河”  第1张

注:单从规格上来看,AMD 的 MI300X 芯片更有优势,拥有 1307 TFLOPS(FP16)的算力和 192GB HBM3 内存,而作为对比,英伟达的 H100 为 989 TFLOPS 和 80GB 内存,即使是 H200 也只有 141GB 内存,AMD 系统凭借更低的价格和更经济的以太网络,总体拥有成本更低。

AMD MI300X 评估:强悍硬件难掩软件短板,难以跨越英伟达“CUDA 护城河”  第2张

但该媒体在深入调研后发现,AMD 的软件漏洞百出,实际运行过程中需要大量的调试工作,几乎无法展开 AI 模型训练工作。而英伟达持续推出新功能、库和性能更新,不断扩大其领先优势。

该媒体分析师通过 GEMM 基准测试和单节点训练等大量测试,发现 AMD 难以逾越英伟达的“CUDA 护城河”。

AMD MI300X 评估:强悍硬件难掩软件短板,难以跨越英伟达“CUDA 护城河”  第3张

AMD MI300X 评估:强悍硬件难掩软件短板,难以跨越英伟达“CUDA 护城河”  第4张

AMD 的开箱即用体验非常糟糕,需要投入大量时间和精力才能达到可用状态,甚至连 AMD 最大的 GPU 云提供商 Tensorwave 都不得不向 AMD 团队提供免费的 GPU 访问权限,以便修复软件问题。

SemiAnalysis 建议 AMD CEO 苏姿丰加大软件开发和测试的投入,学习 Nvidia 的做法,分配数千个 MI300X 芯片用于自动化测试,简化复杂的环境变量,并优化默认设置,提升开箱即用体验。