2ヶ月前

UniGeo: 幾何学的論理推論の統一を目的とした数学的表現の再構成

Jiaqi Chen; Tong Li; Jinghui Qin; Pan Lu; Liang Lin; Chongyu Chen; Xiaodan Liang
UniGeo: 幾何学的論理推論の統一を目的とした数学的表現の再構成
要約

幾何問題の解決は、深層モデルの高次多モーダル推論能力を評価するための広く認識されたテストベッドです。既存の多くの研究では、計算と証明という2つの主要な幾何問題が通常、2つの特定のタスクとして扱われており、これにより深層モデルが複数の数学タスクで推論能力を統一することが妨げられています。しかし、本質的にはこれらの2つのタスクは類似した問題表現と重複する数学的知識を持ち、両方のタスクにおける深層モデルの理解と推論能力を向上させる可能性があります。そこで、私たちは大規模な統一幾何問題ベンチマークであるUniGeoを構築しました。このベンチマークには4,998件の計算問題と9,543件の証明問題が含まれています。各証明問題には理由と数学式付きの多段階証明が注釈されており、この証明は容易に証明シーケンスに再構成でき、計算問題の注釈プログラムシーケンスと同じ形式を共有します。自然に、私たちはまた計算と証明問題を同時にシーケンス生成の形で処理するための一貫した多タスク幾何変換フレームワークであるGeoformerも提示します。最終的に、この統一的なアプローチによって両方のタスクでの推論能力が向上することを示しています。さらに、私たちは数学式予測(Mathematical Expression Pretraining: MEP)手法を提案しました。これは問題解決における数学式を予測することを目指し、Geoformerモデルの性能向上に寄与します。UniGeo上の実験結果から、私たちが提案したGeoformerは計算問題と証明問題においてそれぞれ5.6%以上と3.2%以上の精度で特定タスク向けモデルNGSを上回り、最先端の性能を達成していることが示されました。