首页 > 最新资讯 > 监督式学习、无监督式学习、半监督式学习和增强学习区别
监督式学习、无监督式学习、半监督式学习和增强学习区别

监督式学习、无监督式学习、半监督式学习和增强学习区别

2018-10-15 12:28

#深度学习


宜家家具有多种不同的组装方法。在理想情况下,每种方法都可以组装出完整的沙发或椅子。但是,根据细节的不同,每种产品的组装都有最适用的方法。如果拿到说明手册和所有正确的零件,就只需按照指示操作即可。如果你已经找到了窍门,不妨把手册扔到一边,试试独自操作。

 

 

深度学习也是如此。基于可用数据的类型和正在研究的问题,科学家将选择特定的学习模型来训练算法。

 

在监督式学习模型中,算法基于有标记的数据集进行学习,同时数据集提供答案,算法可利用该答案来评估其在训练数据方面的准确性。相比之下,无监督式模型使用的是无标记数据,算法需要自行提取特征和规律来理解这些数据。半监督式学习居于二者之间:这种方法使用少量有标记的数据来支持大量无标记数据。

 

增强学习模型一般用来训练带有奖励系统的算法。在特定情况下,如果AI Agent执行了最佳的操作,增强学习模型会提供一定反馈。

 

下面我们来了解一下适用于每种学习模式的数据集和问题类型。

 

 
 
 
 

什么是监督式学习?

 

如果您在别人的监督之下学习,有人会当场评判您是否得出了正确答案。同样,在监督式学习中,训练算法时同样需要一整套带有标记的数据。

 

完全标记意味着训练数据集中的每个示例都标记相对应的答案。因此,一个由花朵图像组成的有标记数据集会告知模型哪些图片是玫瑰、哪些图片是雏菊或者水仙。在“看到”新图像时,模型会将其与训练示例进行比较,以给出正确的标记。              

在监督式机器学习中,算法需要通过有标记的数据进行学习。

 

监督式学习有两个主要的应用领域:分类问题和回归问题。

 

分类问题要求算法可以预测离散值,将输入数据标识为特定类或组的成员。在由动物图像组成的训练数据集中,这意味着每张照片已被预先标记为猫、考拉或海龟等。然后,算法的评估标准为,算法对其他考拉和海龟的新图像进行分类的准确程度。

 

上图显示的是猫、考拉还是海龟?分类算法可以区分差异。

 

回归问题则要求算法基于连续数据。比如线性回归:给出一个特定的x值,求y变量的值。

 

更贴近现实的机器学习示例涉及许多变量,例如根据建筑面积、位置和距离公共交通的远近来预测旧金山公寓价格的算法。

 

因此,监督式学习最适合具有一系列可用参考点或真实值来训练算法的问题。但那些数据并不总是现成可用的。

 

 
 
 
 

什么是无监督式学习?

 

清晰、完美标记的数据集并不容易获得。有时,研究人员会向算法询问一些他们未知的问题。而这正是无监督式学习可以发挥作用的地方。

 

在无监督式学习中,深度学习模型会收到某个数据集,但对于如何处理该数据集却未获得明确的指示。训练数据集是没有特定预期结果或正确答案的示例的集合。然后,神经网络尝试通过提取有用的特征并分析其结构来自动发现数据结构。

 

无监督式学习模型自动提取特征并在数据中找到规律。

 

根据所研究的问题,无监督式学习模型可以用不同的方式组织数据。

 

  • 聚类:即使不是专业的鸟类学家,我们也可以观察一系列鸟类照片,并根据其羽毛的颜色、体态的大小或喙形等线索,对照片进行粗略的对比分类。这正是聚类这一无监督式学习的最常见应用类型的运作方式:深度学习模型寻找相似的训练数据并将它们分为一组。

 

  • 异常检测:银行通过寻找客户购买行为中不寻常的模式来侦查欺诈交易。例如,如果同一张信用卡于同一天在加利福尼亚和丹麦使用,那就会引起怀疑。同理,无监督式学习还可用来标记数据集中的异常值。

     

  • 关联:如果您的网上购物车里有尿布、苹果酱和吸管杯,网站可能会建议您在订单中添加围嘴和婴儿监视器。这是一个关联示例,其中数据样本的某些特征与其他特征相关联。通过查看某个数据的几个关键属性,无监督式学习模型可以预测它们通常关联的其他属性。

     

  • 自动编码器:自动编码器会接收输入数据,将其压缩为代码,然后设法使用这些汇总结的代码重新创建输入数据。这就像从《白鲸记》开始,创建SparkNotes版本,然后设法使用SparkNotes重写原始故事,并作为参考。虽然这是一项简便易行的深度学习技巧,但让简单的自动编码器发挥作用的现实用例却很少。但是,如果增添一层复杂性,自动编码器的使用效果就会成倍增加:通过在训练期间同时使用杂乱版本和整洁版本的图像,自动编码器可以消除图像、视频或医学扫描图等视觉数据中的杂点,从而提高图像质量。

 

由于数据中不存在“真值”元素,因此很难衡量使用无监督式学习训练的算法的准确性。但在许多研究领域中,有标记数据要么难以获得,要么过于昂贵。在这些情况下,允许深度学习模型完全自由地寻找相关规律,可以产生高质量的结果。

 

 
 
 
 

什么是半监督式学习?

 

可以将半监督式学习视为一种折衷办法。

 

在很大程度上,半监督式学习的含义正如其名:同时含有标记数据和无标记数据的训练数据集。在从数据中提取相关特征存在困难以及标记示例对专家来说非常耗时的情况下,这种方法特别有用。

 

半监督式学习对于医学影像尤其有用,在此类影像中,少量有标记数据可以显著提高准确性。

 

这类学习的常见应用情境是CT扫描或核磁共振成像 (MRI) 等医学影像。受过培训的放射科医生可以检查并标记肿瘤或疾病的一小部分扫描结果。但是,手动标记所有扫描结果会花费大量的时间和成本。不过与完全无监督式模型相比,半监督式学习中的深度学习网络仍然可以从小比例的有标记数据中受益,并提高其数据的准确性。

 

一种热门的训练方法是从一小组有标记数据开始训练,并使用生成式对抗网络 (GAN)。

 

处于竞争状态的两个深度学习网络都试图超越对方,这就是 GAN。其中一个网络名为生成器(generator),试图创建新数据点来模拟训练数据。另一个网络名为鉴别器(discriminator),它会接收这些新生成的数据,并评估它们是训练数据的一部分还是虚假数据。由于鉴别器可越来越准确地区分虚假数据和原始数据,生成器则提高了其生成令人信服的虚假数据的能力,两种网络在正反馈回路中得到改善。

 

这就是 GAN 的工作原理:标记为“D”的鉴别器显示来自生成器“G”和训练数据集的图像。鉴别器的任务是确定来自生成器的图像哪些是真实的、哪些是虚假的。

 

 
 
 
 

什么是增强学习?

 

视频游戏中充满了增强提示:通过一关即可获得一个徽章;使用一定数量的动作击败坏人即可赢得奖金;倘若不慎落入陷阱,则游戏结束。

 

这些提示可帮助玩家学习如何在下一局游戏中有更好的表现。如果没有这些反馈,他们只会在游戏环境中采取随机行动。

 

增强学习的运作原理与此相同,而视频游戏则是这类研究的日常测试环境。

 

在这种机器学习中,AI Agent试图找到实现特定目标的最佳方式或改进特定任务的最优方法。当Agent采取的行动有助实现目标时,它会获得奖励。总体目标是预测下一步要采取的最佳措施以获得最终大奖。

 

Agent可以从过去的反馈中吸取教训,并探索可能带来更大收益的新策略,从而做出选择。当然,正如国际象棋比赛中短期的移动可能无法助您长远获得胜利一样,Agent也会制定长期战略计划,最大限度地提高累积的奖励。

 

这是一个迭代的过程:反馈次数越多,Agent制定的策略就会越好。这种技术对于训练机器人特别有用,机器人要在诸如控制自动驾驶汽车或管理仓库中的库存等任务中做出一系列决策。

 

其实每种算法都有不同的学习方式,您只需选择最佳方式来帮助神经网络掌握诀窍即可。

相关新闻