该数据集包含 100k 个 CAPTCHA 样本,其中:
- 50k 个基于文本的图像验证码(
.png
) - 50k 个基于音频的 CAPTCHA(
.mp3
) - 元数据 CSV 将每个 CAPTCHA 文件映射到其正确的标签
每个 CAPTCHA 都使用其相应的字母数字字符串进行标记,这使其非常适合训练 OCR 模型、语音识别和基于 AI 的 CAPTCHA 求解器。
数据集结构
文件夹名称 | 内容描述 |
---|---|
Text/ | 50,000 个文本验证码图像 ( .png ) |
Audio/ | 50,000 个音频 CAPTCHA 文件(.mp3 ) |
Metadata.csv | 将 CAPTCHA 文件映射到标签的 CSV 文件 |
text-and-audio-captchas.torrent
做种 0正在下载 1已完成 30总下载次数 41