日期
机构
发布地址
github.com
许可协议
其他
标签
人脸聚类
增强现实
语音增强
分类
声源定位
EasyCom 全称 Easy Communications,是一个增强现实数据集,可用于在嘈杂环境中轻松通信的算法。该数据集包含超过 5 小时的多模态数据,可用于训练和测试算法,以改善 AR 眼镜佩戴者的对话。
该数据集包含 AR 眼镜、以自我为中心的多通道麦克风阵列音频、宽视场 RGB 视频、语音源姿势、耳机麦克风音频、带注释的语音活动、语音转录、头部边界框、语音目标和源识别标注。