俄罗斯套娃表示学习(Matryoshka Representation Learning,缩写为 MRL)是由 Aditya Kusupati 、 Gantavya Bhatt 等人提出的理论。这一理论于 2022 年首次公开发表论文「Matryoshka Representation Learning」中。论文中提出了一种新颖的表示学习方法,它能够在单个嵌入中编码不同粒度的信息,允许模型适应不同计算资源的下游任务。
它通过优化嵌套的低维向量来学习具有不同粒度的信息,并允许单个嵌入适应下游任务的计算约束。 MRL 的核心思想是在一个高维向量中学习一系列变容量的表示,这些表示按嵌套的方式明确优化,因此得名「Matryoshka」(即俄罗斯套娃)。
MRL 的关键特点包括:
MRL 的提出旨在解决现有表示学习管道的固定容量限制,使得表示可以更加灵活地适应不同的下游任务和计算资源。通过 MRL,可以实现更高效的大规模分类和检索任务,同时在长尾少样本分类任务中提高准确性。