HyperAIHyperAI

Command Palette

Search for a command to run...

分布対応インデクシングの再検討:Pythonによる再実装と新しい実験

Alejandro Moreo Andrea Esuli Fabrizio Sebastiani

概要

本論文では、Pythonで書かれた新しいDistributional Correspondence Indexing(DCI)の実装であるPyDCIを紹介します。DCIは、クロスドメインおよびクロスリンガルのテキスト分類に用いられる転移学習手法であり、当初はJaTeCSというJavaのテキスト分類フレームワーク上で構築された実装(ここではJaDCIと呼ぶ)が提供されていました。PyDCIは、scikit-learnとSciPyスタックを利用したDCIの独立版です。ここでは、PyDCIをテストするために新たに実施した実験について報告し、基準としてDCIが提案された後に登場した新しい高性能な手法を使用しています。これらの実験結果は、いくつかの微妙な改良によりPyDCIがJaDCIや上記の高性能な手法を上回り、MultiDomainSentiment(別名MDS -- クロスドメイン適応用)とWebis-CLS-10(クロスリンガル適応用)という2つの人気ベンチマークにおいてこれまで知られている最高の結果を達成していることを示しています。PyDCIおよび当該実験を再現するためのコードは、https://github.com/AlexMoreo/pydci から利用可能です。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
分布対応インデクシングの再検討:Pythonによる再実装と新しい実験 | 記事 | HyperAI超神経