Un détecteur d'anomalies multimodal pour l'alimentation assistée par robot utilisant un autoencodeur variationnel basé sur LSTM

La détection des exécutions anormales est précieuse pour réduire les dangers potentiels dans la manipulation assistée. Les signaux sensoriels multimodaux peuvent être utiles pour détecter une large gamme d'anomalies. Cependant, l'agrégation de modalités à haute dimension et hétérogènes constitue un problème difficile. Nous présentons un autoencodeur variationnel basé sur les mémoires à court et long terme (LSTM-VAE) qui fusionne les signaux et reconstruit leur distribution attendue. Nous introduisons également un détecteur basé sur l'LSTM-VAE utilisant un score d'anomalie basé sur la reconstruction et un seuil basé sur l'état. Pour des évaluations comprenant 1 555 exécutions d'alimentation assistée par robot, incluant 12 types représentatifs d'anomalies, notre détecteur a obtenu une surface sous la courbe caractéristique du récepteur (AUC) plus élevée de 0,8710 que 5 autres détecteurs de référence issus de la littérature. Nous montrons également que la fusion multimodale via l'LSTM-VAE est efficace en comparant notre détecteur avec 17 signaux sensoriels bruts contre 4 caractéristiques conçues manuellement.