一番左のXVEを利用してFP16/BF16を演算すると、16Ops/クロックでの処理が可能だが、XMXを利用すると、行列で演算できるため、16倍の256Ops/クロックの処理が可能になる。これにより、性能が大幅に向上する