TextZoom は、低解像度 (LR) 画像と高解像度 (HR) 画像のペアで構成される超解像度データセットです。画像は、さまざまな焦点距離のカメラを使用して野生で撮影されました。各画像ペアには、注釈、境界ボックスのタイプ、および大文字と小文字を区別する文字列 (句読点を含む) としての元の焦点距離が含まれます。
このデータセットは、難易度に応じて 3 つのサブセットに分割されています。LR 画像は合成 LR 画像 (BICUBIC) よりも難しく、低解像度のテキスト認識の分野を研究するために使用できます。