2 个月前
卷积Tsetlin机
Ole-Christoffer Granmo; Sondre Glimsdal; Lei Jiao; Morten Goodwin; Christian W. Omlin; Geir Thore Berge

摘要
卷积神经网络(CNNs)在重要的模式识别任务中取得了惊人的成功,但它们存在计算复杂度高和缺乏可解释性的缺点。最近提出的Tsetlin机(TM)试图通过使用命题逻辑中的易于解释的合取子句来解决这一问题,从而解决复杂的模式识别问题。Tsetlin机在多个基准测试中提供了具有竞争力的准确性,同时保持了可解释性这一重要特性。此外,由于输入、模式和输出均以位的形式表示,而识别和学习依赖于简单的位操作,因此Tsetlin机促进了接近硬件的实现。本文中,我们利用Tsetlin机范式引入了卷积Tsetlin机(CTM),作为CNNs的一种可解释替代方案。与Tsetlin机通过每个子句对整幅图像进行一次分类不同,CTM将每个子句用作一个卷积滤波器。也就是说,每个子句会在参与卷积的每个图像块上评估一次。为了使子句具备位置感知能力,每个图像块还附加了其在图像中的坐标。卷积子句的输出结果是通过对每个图像块上的子句评估结果进行“或”运算得到的。在Tsetlin机的学习阶段,评估为1的子句会与输入进行对比。而对于CTM,则是在评估为1的所有图像块中随机选择一个进行对比。因此,经典Tsetlin机的标准I型和II型反馈可以直接应用,无需进一步修改。CTM在MNIST数据集上达到了99.4%的峰值测试准确率,在Kuzushiji-MNIST数据集上达到96.31%,在Fashion-MNIST数据集上达到91.5%,以及在2D噪声异或问题上达到100.0%的准确率,这些结果与简单4层CNNs、BinaryConnect、逻辑电路和FPGA加速二值化CNN所报告的结果具有竞争力。