AIの性能評価指標は、ヒートマップとiCDF(逆累積分布関数)を使って検証できる。ACCがAIの性能を過大評価する危険性がある一方、MCCは性能を正確に評価できる厳密な評価指標であることなどが分かる。実験で使うAIを評価する前に、本研究の手法よって指標そのものの特性を十分に吟味すべきとしている

AIの性能評価指標は、ヒートマップとiCDF(逆累積分布関数)を使って検証できる。ACCがAIの性能を過大評価する危険性がある一方、MCCは性能を正確に評価できる厳密な評価指標であることなどが分かる。実験で使うAIを評価する前に、本研究の手法よって指標そのものの特性を十分に吟味すべきとしている