Multiple Instance Learning
Multiple Instance Learning是一种弱监督学习算法,训练数据以袋的形式组织,每个袋包含一组实例$X=\{x_1,x_2,\ldots,x_M\}$,且每个袋有一个单一标签$Y \in \{0, 1\}$。该算法假设袋内的每个实例都有其自身的标签$y_1, y_2, \ldots, y_M$,但在训练过程中这些标签是未知的。标准的Multiple Instance Learning假设认为,如果一个袋中所有实例均为负,则该袋为负;若袋中至少有一个正实例,则该袋为正。这种算法在处理复杂数据结构时具有显著优势,尤其适用于医学图像分类等领域的应用。