2ヶ月前
ClickDiff: クリックによる制御可能なグリップ生成のための拡散モデルを使用した意味接触マップの誘導
Li, Peiming ; Wang, Ziyi ; Liu, Mengyuan ; Liu, Hong ; Chen, Chen

要約
把持生成の目的は、指定された物体との複雑な手-物体相互作用を創出することである。従来の手生成手法は、主にシーン制約下での可視性と多様性に焦点を当ててきたが、接触などの微細な手-物体相互作用を見落としている傾向があり、結果的に不正確かつ望ましくない把持を生み出すことがある。これらの課題に対処するため、我々は制御可能な把持生成タスクを提案し、微細なセマンティックコンタクトマップ(SCM)を利用した制御可能な条件付き生成モデルであるClickDiffを導入する。特に対象物との相互作用的な把持を合成する際には、ユーザ指定またはアルゴリズム予測のセマンティックコンタクトマップを通じて、把持合成の精密な制御が可能となる。具体的には、接触監督制約を最適に利用し、手の複雑な物理構造を正確にモデル化するために、デュアルジェネレーションフレームワークを提案する。このフレームワークにおいて、セマンティック条件付きモジュールは微細な接触情報を基に合理的な接触マップを生成し、接触条件付きモジュールは接触マップと物体ポイントクラウドを利用して現実的な把持を生成する。我々は制御可能な把持生成に対する評価基準を評価する。GRABおよびARCTICデータセットにおける単手および両手の生成実験により、提案手法の有効性が確認され、ClickDiffが未見の物体に対しても効果的かつ堅牢であることが示された。コードは以下のURLで公開されている: https://github.com/adventurer-w/ClickDiff。以上が翻訳となります。ご確認ください。