オンライン有害コンテンツ検出AIを開発
コーンコード大学を中心とした研究チームは、オンライン上の有害コンテンツ検出を目的とした新たな人工知能システム「PPO-CIS」を開発した。本システムは強化学習に基づくプロキシマル・ポリシー最適化と多段階カスケード推論アーキテクチャを統合し、有害コンテンツの検出精度と処理速度の両立を実現している。 PPO-CISは流入する大量の投稿を初段階で高速にスキャンし、無害と判断されたコンテンツを即座に処理する仕組みを採用している。潜在的な有害コンテンツは精度優先の第2分類器へと振り分けられ、判定が迷うケースは人間のモデレーターに引き継がれる。研究チームは正確な検出を報酬、誤判定をペナルティとして設定した学習プロセスにより、AIが各プラットフォームの運用方針に動的に対応できるように設計した。また複数のモデレーションモデルを統合し、それぞれの強みを活かしつつ弱点を補完する手法を採用している。 同チームが独自に構築したデータセット「AugmenToxic」および公開データセット「ToxiGen」を用いた評価では、PPO-CISは既存の検出手法と比較して有害コンテンツの識別精度を2.1%向上させた。処理速度面では著しい差が確認され、1秒あたり384サンプルを処理可能であり、従来手法の約43サンプルを大幅に上回った。マルウェア検出用に開発された強化学習システム「CETRA」をも凌駕する性能を示した。 研究を率いるボーダギー氏は、このシステムが各プラットフォームの有害基準に応じた優先順位付けを可能にすると指摘する。膨大なユーザー生成コンテンツをリアルタイムで処理する必要がある現代のソーシャルメディアにおいて、特に有害コンテンツの削除に厳格なタイムリミットを課す法域での導入が期待されている。本研究の論文は学術誌「Knowledge-Based Systems」に発表され、共同研究者としてシュミット氏とフォン氏が参加している。
