Compression avec perte pour une prédiction sans perte

La majeure partie des données est collectée automatiquement et n’est jamais « vue » que par des algorithmes. Pourtant, les compresseurs de données préservent la fidélité perceptuelle, et non seulement l’information nécessaire aux algorithmes chargés de tâches ultérieures. Dans cet article, nous caractérisons le débit binaire nécessaire pour garantir de hautes performances sur toutes les tâches prédictives invariantes par rapport à un ensemble de transformations, telles que les augmentations de données. À partir de cette théorie, nous proposons des objectifs non supervisés pour l’entraînement de compresseurs neuronaux. En utilisant ces objectifs, nous entraînons un compresseur d’images générique qui réalise des économies de débit importantes (plus de 1000 fois par rapport à JPEG) sur 8 jeux de données, sans compromettre la performance des tâches de classification ultérieures.