建設や製造業における作業現場では、安全ヘルメットの着用が不測の事態を回避するために重要である。この安全基準の遵守は、さまざまなコンピュータビジョンおよび深層学習技術を活用した自動ヘルメット検出システムの開発によって実現可能である。深層学習に基づくヘルメット検出モデルの開発には、膨大な量の訓練データが必要となるが、これまでの文献に公開されている安全ヘルメット用のデータセットは極めて少なく、その多くは完全にラベル付けされておらず、ラベル付きのデータセットであってもクラス数が少ないという課題がある。本論文では、SHDデータセットの拡張版として、5,000枚の画像を含む「Safety HELmet dataset with 5K images(SHEL5K)」を提案する。本データセットは、ヘルメット、頭部、ヘルメット着用頭部、ヘルメット着用人物、ヘルメット未着用人物、顔の6つの完全ラベル付きクラスで構成されている。提案されたSHEL5Kデータセットは、YOLOv3(YOLOv3、YOLOv3-tiny、YOLOv3-SPP)、YOLOv4(YOLOv4、YOLOv4-pacsp-x-mish)、YOLOv5-P5(YOLOv5s、YOLOv5m、YOLOv5x)、Inception V2アーキテクチャを搭載した高速領域ベース畳み込みニューラルネットワーク(Faster-RCNN)、およびYOLORといった複数の最先端オブジェクト検出モデルを用いて評価された。各モデルにおける実験結果を比較したところ、平均精度(mean Average Precision, mAP)において明確な向上が確認された。SHEL5Kデータセットは、他の安全ヘルメットデータセットと比較して、より少ない画像数ながらもより高精度なラベルとより多くのクラスを含んでいる点で優位性を有しており、結果としてヘルメット検出の精度向上に貢献するものである。