HyperAI超神经

在 CPU 上部署 Hugging Face 剪枝模型

本教程演示如何采用剪枝后的模型(本例中模型是 来自 Hugging Face 的 PruneBert),并使用 TVM 来利用模型稀疏支持来加速。