日付

4年前

データセット構成

公開URL

ctwdataset.github.io

論文URL

arxiv.org

ライセンス

Other

タグ

画像認識

画像理解

Chinese Text in the Wild は、自然画像に含まれるテキストで作成された大規模なデータセットです。このデータセットには、1,018,402 字の漢字を含む 32,285 枚の画像が含まれており、これまでのデータセットをはるかに上回っています。これらのデータセットは、テンセントストリートビューから提供され、特別な目的もなく中国の数十の異なる都市から取得されました。このデータセットは、その多様性と複雑さのため、非常に困難です。平らなテキスト、盛り上がったテキスト、都市部のテキスト、田舎のテキスト、低輝度のテキスト、遠くのテキスト、部分的に遮られたテキストなどが含まれます。各画像について、そのすべての漢字に専門家による注釈が付けられています。データセットは、漢字ごとに、その基礎となる文字、境界ボックス、および 6 つの属性に注釈を付けて、それが隠れているか、複雑な背景、歪んでいるか、3D テキスト、ワードアート、手書きであるかを示します。

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。