Cooper Lakeを利用したBfloat16のデモ、FP32で学習する場合に比較して同じ精度で高速に演算できる

Cooper Lakeを利用したBfloat16のデモ、FP32で学習する場合に比較して同じ精度で高速に演算できる