トークンを超えて考える:脳からインスピレーションを得た知能から人工一般知能の認知的基礎及其の社会的影響まで

機械は本当に人間のように思考し、推論し、行動できるのでしょうか?この長年にわたる問いは、人工一般知能(Artificial General Intelligence: AGI)の追求を形づくっています。GPT-4.5、DeepSeek、Claude 3.5 Sonnet、Phi-4、およびGrok 3などのモデルが多様なモーダル性と部分的な推論能力を示しているにもかかわらず、これらのシステムはトークンレベルの予測への依存と実体験に基づくエージェンシーの欠如により根本的に制限されています。本論文では、人工知能、認知神経科学、心理学、生成モデル、エージェントベースシステムにわたるAGI開発のクロスディシプリン的な統合を提供します。私たちは一般的な知能のアーキテクチャと認知基盤を分析し、モジュール型推論、持続的な記憶、およびマルチエージェント協調の役割に焦点を当てます。特に、検索(Retrieval)、計画(Planning)、動的ツール使用(Dynamic Tool Use)を組み合わせてより適応的な行動を可能にするAgentic RAGフレームワークの台頭に重点を置きます。私たちは情報圧縮、テスト時の適応(Test-time Adaptation)、学習不要手法(Training-free Methods)などの一般化戦略が柔軟でドメイン非特異的な知能への重要な道筋であることを議論します。ビジョン言語モデル(Vision-Language Models: VLMs)は単なる認識モジュールではなく、具現化した理解と協力的なタスク完了のための進化するインターフェースとして再評価されます。また、真の知能は規模だけでなく記憶と推論の統合から生まれることを主張します。これは圧縮によって適応的行為が可能になるモジュール型で相互作用的かつ自己改善可能なコンポーネント群によるオーケストレーションです。ニューロシンボリックシステムや強化学習における最近の進歩を取り入れつつ、認知サcaffoldingの一環として最近のアーキテクチャが統計的学習と目的指向認知とのギャップを埋め始める方法を探ります。最後に、AGIへの道程における主要な科学的課題、技術的課題、そして倫理的課題について指摘します。