零样本学习(Zero-Shot Learning)简介与分类 - 知乎 (zhihu.com)

  • 希望模型能够识别出在训练阶段未曾见过的类别
  • 概括一下,就是利用类别的高维语义特征代替样本的低维特征,使得训练出来的模型具有迁移性。这里斑马的高维语义就是马的外形、老虎的斑纹、熊猫的颜色,尽管缺乏更多细节,但这些高维语义已经足够刻画斑马,从而让计算机成功识别出来未见过的斑马实例
  • 根据测试或推论时数据的可用性,零样本学习也可以分为两类。
    • 常规零样本学习
      在常规的零样本学习中,在测试时要识别的图像仅限于未知类别,即测试类别。但这类方法并不实用,因为实际中很难保证测试时数据仅仅来自未知的类别。
    • 广义零样本学习
      在广义零样本学习中,测试时的图像可以属于已知或未知类别。与常规设置相比,该设置实际上更加实用,但却更具挑战性。原因就是该模型仅在已知类图像上训练,因此可想而知其预测会偏向于已知类。这会导致许多未知类的图像在测试时被错误地分类为已知类,从而大大降低了模型的性能。

“Zero-shot training strategy”(零样本训练策略)是一种机器学习策略,旨在使模型能够在没有见过特定类别的训练样本的情况下对其进行分类或执行其他任务。这个策略的目标是使模型具有泛化到新类别或新任务的能力。
关键思想包括:

  1. 使用通用特征表示: 在训练期间,模型学习一些通用的特征表示,这些特征对于各种类别都是有用的,而不仅仅是训练样本中的类别。
  2. 跨类别泛化: 模型被设计成能够将这些通用特征应用于未见过的类别,从而实现跨类别的泛化。
  3. 使用语义嵌入: 对象、概念或类别之间的语义关系被嵌入到模型中,使得模型能够理解新类别与已知类别之间的关系。
    这种策略常常在自然语言处理、计算机视觉等领域中使用,其中模型需要处理多个类别或任务,而不是仅仅关注于训练集中的特定类别。例如,在图像分类中,零样本学习可能涉及到对模型进行训练,以便它能够在测试时正确分类未在训练中见过的物体类别。
    这个策略的成功取决于模型的能力学习通用的、泛化的特征表示,以及训练过程中引入的其他先验知识或结构。