x86性能狂飙16倍！AMD、Intel联手制定统一标准

在2024年10月，AMD与Intel联合成立了x86生态系统咨询小组，旨在推动x86计算架构的发展。该小组公布了四项核心特性：FRED、AVX10、ChkTag和ACE。最近，双方发布了ACE白皮书，将这一称为“x86标准矩阵加速架构”的指令集推向开发者。ACE的核心目标是实现x86芯片矩阵乘法性能的数量级跃升，矩阵乘法是神经网络和大语言模型的基础运算单元。与现有AVX10等SIMD指令集相比，ACE通过外积运算的矩阵加速机制，在相同输入下，计算密度达到等效操作的16倍。它支持INT8、OCP FP8、OCP MXFP8、OCP MXINT8和BF16等主流AI精度标准。作为AVX10的扩展，ACE的软件生态已在推进，Deep Learning和HPC库、NumPy、SciPy及PyTorch、TensorFlow等框架已启动集成。AMD和Intel强调ACE设计注重低摩擦和广覆盖，适用于从笔记本到超级计算机的多种场景，开发者无需针对不同硬件重写代码，这与依赖专用加速器的方案不同，后者需额外适配成本。

在2024年10月的时候，AMD和Intel联合成立了x86生态系统咨询小组（x86 Ecosystem Advisory Group），汇聚行业领导厂商，共同推动x86计算架构的未来。

EAG成立时公布了四项核心特性：FRED、AVX10、ChkTag和ACE，如今AMD与Intel联合发布了ACE白皮书，正式将这一被称为“x86标准矩阵加速架构”的指令集推向开发者社区。