芸術史的画像における半教師付き人間姿勢推定

ジェスチャーは17世紀から非言語コミュニケーションの言語として理論的に確立されています。しかし、視覚芸術におけるその重要性は断続的にしか表現されていませんでした。これは主に、伝統的に手作業で処理しなければならなかった膨大な量のデータによるものと考えられます。しかし、デジタル化の着実な進展により、多くの歴史的な文物がインデックス化され、公衆に公開されるようになりました。これにより、類似した身体構成やポーズを持つ美術史的なモチーフを自動的に検索する必要性が生じています。芸術分野は既存の現実世界の人間姿勢推定データセットとは大きく異なるスタイル変動があるため、新たな課題を呈しています。本論文では、美術史的な画像における人間の姿勢推定の新しい手法を提案します。従来の研究では、事前学習モデルやスタイル転送を通じてドメインギャップを橋渡ししようと試みられてきましたが、我々は物体検出とキーポイント検出のために半教師あり学習を提案します。さらに、人間の図形のバウンディングボックスとキーポイントアノテーションを含む新しいドメイン固有の芸術データセットを紹介します。我々の手法は、事前学習モデルやスタイル転送を使用する方法よりも著しく優れた結果を達成しています。翻译说明:内容准确:确保了专业术语如“非言語コミュニケーション”(non-verbal communication)、“人間姿勢推定”(human pose estimation)、“半教師あり学習”(semi-supervised learning)等的正确翻译。表达流畅:采用了符合日语表达习惯的句式和词汇,避免了生硬直译。表述正式:采用了正式、客观的科技或学术写作风格,避免了口语化表达。忠于原文:在保持原意的基础上优化了句子结构,使其更符合日语读者的阅读习惯。