监督式学习、无监督式学习、半监督式学习和增强学习区别

2018-10-15 12:28

宜家家具有多种不同的组装方法。在理想情况下，每种方法都可以组装出完整的沙发或椅子。但是，根据细节的不同，每种产品的组装都有最适用的方法。如果拿到说明手册和所有正确的零件，就只需按照指示操作即可。如果你已经找到了窍门，不妨把手册扔到一边，试试独自操作。

深度学习也是如此。基于可用数据的类型和正在研究的问题，科学家将选择特定的学习模型来训练算法。

在监督式学习模型中，算法基于有标记的数据集进行学习，同时数据集提供答案，算法可利用该答案来评估其在训练数据方面的准确性。相比之下，无监督式模型使用的是无标记数据，算法需要自行提取特征和规律来理解这些数据。半监督式学习居于二者之间：这种方法使用少量有标记的数据来支持大量无标记数据。

增强学习模型一般用来训练带有奖励系统的算法。在特定情况下，如果AI Agent执行了最佳的操作，增强学习模型会提供一定反馈。

下面我们来了解一下适用于每种学习模式的数据集和问题类型。

什么是监督式学习？

如果您在别人的监督之下学习，有人会当场评判您是否得出了正确答案。同样，在监督式学习中，训练算法时同样需要一整套带有标记的数据。

完全标记意味着训练数据集中的每个示例都标记相对应的答案。因此，一个由花朵图像组成的有标记数据集会告知模型哪些图片是玫瑰、哪些图片是雏菊或者水仙。在“看到”新图像时，模型会将其与训练示例进行比较，以给出正确的标记。

在监督式机器学习中，算法需要通过有标记的数据进行学习。

监督式学习有两个主要的应用领域：分类问题和回归问题。

分类问题要求算法可以预测离散值，将输入数据标识为特定类或组的成员。在由动物图像组成的训练数据集中，这意味着每张照片已被预先标记为猫、考拉或海龟等。然后，算法的评估标准为，算法对其他考拉和海龟的新图像进行分类的准确程度。

上图显示的是猫、考拉还是海龟？分类算法可以区分差异。

回归问题则要求算法基于连续数据。比如线性回归：给出一个特定的x值，求y变量的值。

更贴近现实的机器学习示例涉及许多变量，例如根据建筑面积、位置和距离公共交通的远近来预测旧金山公寓价格的算法。

因此，监督式学习最适合具有一系列可用参考点或真实值来训练算法的问题。但那些数据并不总是现成可用的。

什么是无监督式学习？

清晰、完美标记的数据集并不容易获得。有时，研究人员会向算法询问一些他们未知的问题。而这正是无监督式学习可以发挥作用的地方。

在无监督式学习中，深度学习模型会收到某个数据集，但对于如何处理该数据集却未获得明确的指示。训练数据集是没有特定预期结果或正确答案的示例的集合。然后，神经网络尝试通过提取有用的特征并分析其结构来自动发现数据结构。

无监督式学习模型自动提取特征并在数据中找到规律。

根据所研究的问题，无监督式学习模型可以用不同的方式组织数据。

聚类：即使不是专业的鸟类学家，我们也可以观察一系列鸟类照片，并根据其羽毛的颜色、体态的大小或喙形等线索，对照片进行粗略的对比分类。这正是聚类这一无监督式学习的最常见应用类型的运作方式：深度学习模型寻找相似的训练数据并将它们分为一组。

异常检测：银行通过寻找客户购买行为中不寻常的模式来侦查欺诈交易。例如，如果同一张信用卡于同一天在加利福尼亚和丹麦使用，那就会引起怀疑。同理，无监督式学习还可用来标记数据集中的异常值。
关联：如果您的网上购物车里有尿布、苹果酱和吸管杯，网站可能会建议您在订单中添加围嘴和婴儿监视器。这是一个关联示例，其中数据样本的某些特征与其他特征相关联。通过查看某个数据的几个关键属性，无监督式学习模型可以预测它们通常关联的其他属性。
自动编码器：自动编码器会接收输入数据，将其压缩为代码，然后设法使用这些汇总结的代码重新创建输入数据。这就像从《白鲸记》开始，创建SparkNotes版本，然后设法使用SparkNotes重写原始故事，并作为参考。虽然这是一项简便易行的深度学习技巧，但让简单的自动编码器发挥作用的现实用例却很少。但是，如果增添一层复杂性，自动编码器的使用效果就会成倍增加：通过在训练期间同时使用杂乱版本和整洁版本的图像，自动编码器可以消除图像、视频或医学扫描图等视觉数据中的杂点，从而提高图像质量。

由于数据中不存在“真值”元素，因此很难衡量使用无监督式学习训练的算法的准确性。但在许多研究领域中，有标记数据要么难以获得，要么过于昂贵。在这些情况下，允许深度学习模型完全自由地寻找相关规律，可以产生高质量的结果。

什么是半监督式学习？

可以将半监督式学习视为一种折衷办法。

在很大程度上，半监督式学习的含义正如其名：同时含有标记数据和无标记数据的训练数据集。在从数据中提取相关特征存在困难以及标记示例对专家来说非常耗时的情况下，这种方法特别有用。

半监督式学习对于医学影像尤其有用，在此类影像中，少量有标记数据可以显著提高准确性。

这类学习的常见应用情境是CT扫描或核磁共振成像 (MRI) 等医学影像。受过培训的放射科医生可以检查并标记肿瘤或疾病的一小部分扫描结果。但是，手动标记所有扫描结果会花费大量的时间和成本。不过与完全无监督式模型相比，半监督式学习中的深度学习网络仍然可以从小比例的有标记数据中受益，并提高其数据的准确性。

一种热门的训练方法是从一小组有标记数据开始训练，并使用生成式对抗网络 (GAN)。

处于竞争状态的两个深度学习网络都试图超越对方，这就是 GAN。其中一个网络名为生成器（generator），试图创建新数据点来模拟训练数据。另一个网络名为鉴别器（discriminator），它会接收这些新生成的数据，并评估它们是训练数据的一部分还是虚假数据。由于鉴别器可越来越准确地区分虚假数据和原始数据，生成器则提高了其生成令人信服的虚假数据的能力，两种网络在正反馈回路中得到改善。