HyperAIHyperAI

Command Palette

Search for a command to run...

SA-Text画像テキストデータセット

Discordで議論

日付

8ヶ月前

データセット構成

KAIST 韓国科学技術院

Paper URL

arxiv.org

SA-Textは、韓国科学技術院(KOIST)と高麗大学が公開した、高品質シーン画像の大規模ベンチマークデータセットであり、テキスト認識画像復元(TAIR)タスク向けに設計されています。関連論文の結果は以下の通りです。拡散モデルを用いたテキストを考慮した画像復元”。

このデータセットには、ポリゴンレベルのテキスト注釈が付いた高解像度のシーン画像が 105,330 枚含まれており、画像内のテキストの位置と形状を正確に記述できるため、TAIR タスクに正確な監視情報が提供され、モデルが画像内のテキストの位置と構造をより適切に理解できるようになります。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています