机器学习类型

2025年6月17日 | 阅读时长11分钟

机器学习是人工智能的一个子集，它使机器能够自动从数据中学习，从过去的经验中提高性能，并做出预测。机器学习包含一组处理大量数据的算法。数据被输入到这些算法中进行训练，然后根据训练，它们构建模型并执行特定任务。

这些机器学习算法有助于解决不同的业务问题，如回归、分类、预测、聚类和关联等。

根据学习方法和方式，机器学习主要分为四种类型：

监督机器学习
无监督机器学习
半监督机器学习
强化学习

在本主题中，我们将详细描述机器学习的类型及其各自的算法

1. 监督机器学习

顾名思义，监督机器学习是基于监督的。这意味着在监督学习技术中，我们使用“标记”数据集训练机器，然后机器根据训练预测输出。在这里，标记数据指定一些输入已经映射到输出。更确切地说，我们可以说；首先，我们使用输入和相应的输出训练机器，然后我们要求机器使用测试数据集预测输出。

让我们通过一个例子来理解监督学习。假设我们有一个猫和狗图像的输入数据集。因此，首先，我们将对机器进行训练，使其理解图像，例如猫和狗的尾巴形状和大小、眼睛形状、颜色、高度（狗更高，猫更小）等。训练完成后，我们输入一张猫的图片，并要求机器识别物体并预测输出。现在，机器已经训练有素，它将检查物体的所有特征，例如高度、形状、颜色、眼睛、耳朵、尾巴等，并发现它是一只猫。因此，它会将其放入猫类别。这就是机器在监督学习中识别对象的过程。

监督学习技术的主要目标是将输入变量 (x) 与输出变量 (y) 进行映射。监督学习的一些实际应用包括风险评估、欺诈检测、垃圾邮件过滤等。

监督机器学习的类别

监督机器学习可以分为以下两种类型的问题：

分类
回归

a) 分类

分类算法用于解决分类问题，其中输出变量是分类的，例如“是”或否、男性或女性、红色或蓝色等。分类算法预测数据集中存在的类别。分类算法的一些实际示例包括垃圾邮件检测、电子邮件过滤等。

下面给出了一些流行的分类算法：

随机森林算法
决策树算法
逻辑回归算法
支持向量机算法

b) 回归

回归算法用于解决输入和输出变量之间存在线性关系的回归问题。它们用于预测连续输出变量，例如市场趋势、天气预报等。

下面给出了一些流行的回归算法：

简单线性回归算法
多元回归算法
决策树算法
Lasso 回归

监督学习的优缺点

优点

由于监督学习处理标记数据集，因此我们可以对对象类别有一个准确的概念。
这些算法有助于根据先前的经验预测输出。

缺点

这些算法无法解决复杂的任务。
如果测试数据与训练数据不同，它可能会预测错误的输出。
训练算法需要大量的计算时间。

监督学习的应用

下面给出了一些监督学习的常见应用：

图像分割
监督学习算法用于图像分割。在此过程中，对具有预定义标签的不同图像数据执行图像分类。
医疗诊断
监督算法也用于医疗领域的诊断。这是通过使用医学图像和带有疾病状况标签的过去标记数据来完成的。通过这样的过程，机器可以识别新患者的疾病。
欺诈检测 - 监督学习分类算法用于识别欺诈交易、欺诈客户等。这是通过使用历史数据来识别可能导致欺诈的模式来完成的。
垃圾邮件检测 - 在垃圾邮件检测和过滤中，使用分类算法。这些算法将电子邮件分类为垃圾邮件或非垃圾邮件。垃圾邮件被发送到垃圾邮件文件夹。
语音识别 - 监督学习算法也用于语音识别。该算法使用语音数据进行训练，并且可以使用它进行各种识别，例如语音激活密码、语音命令等。

2. 无监督机器学习

无监督学习与监督学习技术不同；顾名思义，它不需要监督。这意味着，在无监督机器学习中，机器使用未标记数据集进行训练，并且机器在没有任何监督的情况下预测输出。

在无监督学习中，模型使用既未分类也未标记的数据进行训练，并且模型在没有任何监督的情况下对该数据进行操作。

无监督学习算法的主要目的是根据相似性、模式和差异对未排序的数据集进行分组或分类。机器被指示从输入数据集中找到隐藏的模式。

让我们举一个例子来更准确地理解它；假设有一个水果图像篮，我们将其输入到机器学习模型中。这些图像对模型来说是完全未知的，机器的任务是找到对象的模式和类别。

因此，现在机器将发现它的模式和差异，例如颜色差异、形状差异，并在使用测试数据集进行测试时预测输出。

无监督机器学习的类别

无监督学习可以进一步分为以下两种类型：

聚类
关联 (Association)

1) 聚类

当我们要从数据中找出固有组时，使用聚类技术。这是一种将对象分组到群集中的方法，使具有最大相似性的对象保留在一个组中，并且与其他组中的对象具有较少或没有相似性。聚类算法的一个示例是根据客户的购买行为对客户进行分组。

下面给出了一些流行的聚类算法：

K-Means 聚类算法
均值漂移算法
DBSCAN 算法
主成分分析
独立成分分析

2) 关联

关联规则学习是一种无监督学习技术，它在大数据集中发现变量之间有趣的关联。这种学习算法的主要目的是发现一个数据项对另一个数据项的依赖性，并相应地映射这些变量，以便产生最大利润。该算法主要应用于市场购物篮分析、Web 使用挖掘、连续生产等。

关联规则学习的一些流行算法是 Apriori 算法、Eclat、FP-growth 算法。

无监督学习算法的优缺点

优点

这些算法可用于比监督算法更复杂的任务，因为这些算法处理未标记数据集。
无监督算法更适用于各种任务，因为获取未标记数据集比标记数据集更容易。

缺点

无监督算法的输出可能不那么准确，因为数据集未标记，并且算法事先没有经过精确输出的训练。
使用无监督学习更加困难，因为它处理未与输出映射的未标记数据集。

无监督学习的应用

网络分析： 无监督学习用于学术文章的文本数据网络分析中识别剽窃和版权。
推荐系统： 推荐系统广泛使用无监督学习技术来为不同的网络应用程序和电子商务网站构建推荐应用程序。
异常检测： 异常检测是无监督学习的一个流行应用，可以识别数据集中异常数据点。它用于发现欺诈交易。
奇异值分解： 奇异值分解或 SVD 用于从数据库中提取特定信息。例如，提取位于特定位置的每个用户的信息。

3. 半监督学习

半监督学习是一种介于监督机器学习和无监督机器学习之间的机器学习算法。它代表了监督学习（带有标记训练数据）和无监督学习（没有标记训练数据）算法之间的中间地带，并在训练期间使用标记和未标记数据集的组合。

尽管半监督学习是监督学习和无监督学习之间的中间地带，并且处理包含少量标签的数据，但它主要由未标记数据组成。由于标签成本高昂，但出于企业目的，它们可能拥有少量标签。它与监督学习和无监督学习完全不同，因为它们基于标签的存在和不存在。

为了克服监督学习和无监督学习算法的缺点，引入了半监督学习的概念。半监督学习的主要目标是有效利用所有可用数据，而不是像监督学习那样只利用标记数据。最初，使用无监督学习算法对相似数据进行聚类，然后它有助于将未标记数据标记为已标记数据。这是因为标记数据的获取成本相对高于未标记数据。

我们可以通过一个例子来想象这些算法。监督学习是学生在家和大学在老师的监督下学习。此外，如果该学生在没有老师帮助的情况下自行分析同一概念，则属于无监督学习。在半监督学习中，学生在大学老师指导下分析同一概念后，需要自行复习。

半监督学习的优缺点

优点

该算法简单易懂。
它非常高效。
它用于解决监督学习和无监督学习算法的缺点。

缺点

迭代结果可能不稳定。
我们无法将这些算法应用于网络级数据。
准确性低。

4. 强化学习

强化学习基于反馈过程，其中 AI 代理（软件组件）通过反复试验、采取行动、从经验中学习并提高其性能来自动探索其周围环境。代理因每次良好行为而获得奖励，因每次不良行为而受到惩罚；因此，强化学习代理的目标是最大化奖励。

在强化学习中，没有像监督学习那样的标记数据，代理只从经验中学习。

强化学习过程与人类相似；例如，孩子通过日常生活中的经验学习各种事物。强化学习的一个例子是玩游戏，其中游戏是环境，代理在每一步的移动定义了状态，代理的目标是获得高分。代理以惩罚和奖励的形式接收反馈。

由于其工作方式，强化学习应用于博弈论、运筹学、信息论、多代理系统等不同领域。

强化学习问题可以使用马尔可夫决策过程 (MDP) 进行形式化。在 MDP 中，代理不断与环境交互并执行动作；在每个动作中，环境响应并生成一个新状态。

强化学习的类别

强化学习主要分为两种方法/算法类型

正强化学习： 正强化学习指定通过添加某些东西来增加所需行为再次发生的倾向。它增强了代理行为的强度并对其产生积极影响。
负强化学习： 负强化学习与正强化学习完全相反。它通过避免负面条件来增加特定行为再次发生的倾向。

强化学习的实际用例

视频游戏
强化学习算法在游戏应用中非常流行。它用于获得超人的表现。一些使用强化学习算法的流行游戏是 AlphaGO 和 AlphaGO Zero。
资源管理
“深度强化学习的资源管理”论文展示了如何在计算机中使用强化学习来自动学习和调度资源，以等待不同的作业，从而最大限度地减少平均作业延迟。
机器人技术
强化学习广泛应用于机器人应用。机器人在工业和制造业领域使用，通过强化学习使这些机器人更加强大。有不同的行业致力于使用人工智能和机器学习技术构建智能机器人。
文本挖掘
文本挖掘是自然语言处理的一项重要应用，现在由 Salesforce 公司借助强化学习来实现。

强化学习的优缺点

优点

它有助于解决难以通过一般技术解决的复杂现实世界问题。
强化学习的学习模型与人类的学习相似；因此可以找到最准确的结果。
有助于实现长期结果。

缺点

强化学习算法不适用于简单问题。
强化学习算法需要大量数据和计算。
过多的强化学习可能导致状态过载，从而削弱结果。

维度诅咒限制了强化学习在真实物理系统中的应用。

机器学习类型多选题练习

1. 下列哪种机器学习算法可以在不被明确编程的情况下学习执行任务？

监督学习。
无监督学习。
强化学习。
半监督学习。

答案

B) 无监督学习。

说明

无监督学习算法在没有标记响应的情况下学习数据中的模式。

2. 下列哪项是监督学习的例子？

聚类。
关联规则学习。
回归。
主成分分析 (PCA)。

答案

C) 回归。

说明

回归涉及根据输入特征预测连续值，这是一种监督学习形式。

3. 监督学习和无监督学习的主要区别是什么？

监督学习需要标记数据，而无监督学习不需要。
无监督学习需要标记数据，而监督学习不需要。
监督学习总是涉及分类，而无监督学习涉及聚类。
无监督学习总是涉及分类，而监督学习涉及聚类。

答案

A) 监督学习需要标记数据，而无监督学习不需要。

说明

在监督学习中，算法从标记数据中学习，而在无监督学习中，算法从未标记数据中学习。

4. 以下关于强化学习的说法哪项是正确的？

它是一种无监督学习。
它依靠奖励系统来学习最优行为。
它仅用于静态、不变的环境。
它不需要与环境交互。

答案

B) 它依靠奖励系统来学习最优行为。

说明

强化学习涉及代理通过从环境中接收奖励或惩罚形式的反馈来学习做出决策。

5. 在半监督学习中，标记数据与未标记数据的典型比例是多少？

1:1
1:2
1:5
1:10

答案

C) 1:5

说明

在半监督学习中，少量标记数据与大量未标记数据一起用于训练模型。

下一主题Keras 中的回调

机器学习类型