日本語

CPU 上で GEMM を最適化する方法

このチュートリアルでは、TVM を使用して行列の乗算を最適化し、18 行のコードでベースラインよりも 200 倍高速なパフォーマンスを達成する方法を示します。