机器学习类型2025年6月17日 | 阅读时长11分钟 机器学习是人工智能的一个子集,它使机器能够自动从数据中学习,从过去的经验中提高性能,并做出预测。机器学习包含一组处理大量数据的算法。数据被输入到这些算法中进行训练,然后根据训练,它们构建模型并执行特定任务。 ![]() 这些机器学习算法有助于解决不同的业务问题,如回归、分类、预测、聚类和关联等。 根据学习方法和方式,机器学习主要分为四种类型:
![]() 在本主题中,我们将详细描述机器学习的类型及其各自的算法 1. 监督机器学习顾名思义,监督机器学习是基于监督的。这意味着在监督学习技术中,我们使用“标记”数据集训练机器,然后机器根据训练预测输出。在这里,标记数据指定一些输入已经映射到输出。更确切地说,我们可以说;首先,我们使用输入和相应的输出训练机器,然后我们要求机器使用测试数据集预测输出。 让我们通过一个例子来理解监督学习。假设我们有一个猫和狗图像的输入数据集。因此,首先,我们将对机器进行训练,使其理解图像,例如猫和狗的尾巴形状和大小、眼睛形状、颜色、高度(狗更高,猫更小)等。训练完成后,我们输入一张猫的图片,并要求机器识别物体并预测输出。现在,机器已经训练有素,它将检查物体的所有特征,例如高度、形状、颜色、眼睛、耳朵、尾巴等,并发现它是一只猫。因此,它会将其放入猫类别。这就是机器在监督学习中识别对象的过程。 监督学习技术的主要目标是将输入变量 (x) 与输出变量 (y) 进行映射。监督学习的一些实际应用包括风险评估、欺诈检测、垃圾邮件过滤等。 监督机器学习的类别监督机器学习可以分为以下两种类型的问题:
a) 分类分类算法用于解决分类问题,其中输出变量是分类的,例如“是”或否、男性或女性、红色或蓝色等。分类算法预测数据集中存在的类别。分类算法的一些实际示例包括垃圾邮件检测、电子邮件过滤等。 下面给出了一些流行的分类算法:
b) 回归回归算法用于解决输入和输出变量之间存在线性关系的回归问题。它们用于预测连续输出变量,例如市场趋势、天气预报等。 下面给出了一些流行的回归算法:
监督学习的优缺点优点
缺点
监督学习的应用下面给出了一些监督学习的常见应用:
2. 无监督机器学习无监督学习与监督学习技术不同;顾名思义,它不需要监督。这意味着,在无监督机器学习中,机器使用未标记数据集进行训练,并且机器在没有任何监督的情况下预测输出。 在无监督学习中,模型使用既未分类也未标记的数据进行训练,并且模型在没有任何监督的情况下对该数据进行操作。 无监督学习算法的主要目的是根据相似性、模式和差异对未排序的数据集进行分组或分类。机器被指示从输入数据集中找到隐藏的模式。 让我们举一个例子来更准确地理解它;假设有一个水果图像篮,我们将其输入到机器学习模型中。这些图像对模型来说是完全未知的,机器的任务是找到对象的模式和类别。 因此,现在机器将发现它的模式和差异,例如颜色差异、形状差异,并在使用测试数据集进行测试时预测输出。 无监督机器学习的类别无监督学习可以进一步分为以下两种类型:
1) 聚类当我们要从数据中找出固有组时,使用聚类技术。这是一种将对象分组到群集中的方法,使具有最大相似性的对象保留在一个组中,并且与其他组中的对象具有较少或没有相似性。聚类算法的一个示例是根据客户的购买行为对客户进行分组。 下面给出了一些流行的聚类算法:
2) 关联关联规则学习是一种无监督学习技术,它在大数据集中发现变量之间有趣的关联。这种学习算法的主要目的是发现一个数据项对另一个数据项的依赖性,并相应地映射这些变量,以便产生最大利润。该算法主要应用于市场购物篮分析、Web 使用挖掘、连续生产等。 关联规则学习的一些流行算法是 Apriori 算法、Eclat、FP-growth 算法。 无监督学习算法的优缺点优点
缺点
无监督学习的应用
3. 半监督学习半监督学习是一种介于监督机器学习和无监督机器学习之间的机器学习算法。它代表了监督学习(带有标记训练数据)和无监督学习(没有标记训练数据)算法之间的中间地带,并在训练期间使用标记和未标记数据集的组合。 尽管半监督学习是监督学习和无监督学习之间的中间地带,并且处理包含少量标签的数据,但它主要由未标记数据组成。由于标签成本高昂,但出于企业目的,它们可能拥有少量标签。它与监督学习和无监督学习完全不同,因为它们基于标签的存在和不存在。 为了克服监督学习和无监督学习算法的缺点,引入了半监督学习的概念。 半监督学习的主要目标是有效利用所有可用数据,而不是像监督学习那样只利用标记数据。最初,使用无监督学习算法对相似数据进行聚类,然后它有助于将未标记数据标记为已标记数据。这是因为标记数据的获取成本相对高于未标记数据。 我们可以通过一个例子来想象这些算法。监督学习是学生在家和大学在老师的监督下学习。此外,如果该学生在没有老师帮助的情况下自行分析同一概念,则属于无监督学习。在半监督学习中,学生在大学老师指导下分析同一概念后,需要自行复习。 半监督学习的优缺点优点
缺点
4. 强化学习强化学习基于反馈过程,其中 AI 代理(软件组件)通过反复试验、采取行动、从经验中学习并提高其性能来自动探索其周围环境。代理因每次良好行为而获得奖励,因每次不良行为而受到惩罚;因此,强化学习代理的目标是最大化奖励。 在强化学习中,没有像监督学习那样的标记数据,代理只从经验中学习。 强化学习过程与人类相似;例如,孩子通过日常生活中的经验学习各种事物。强化学习的一个例子是玩游戏,其中游戏是环境,代理在每一步的移动定义了状态,代理的目标是获得高分。代理以惩罚和奖励的形式接收反馈。 由于其工作方式,强化学习应用于博弈论、运筹学、信息论、多代理系统等不同领域。 强化学习问题可以使用马尔可夫决策过程 (MDP) 进行形式化。在 MDP 中,代理不断与环境交互并执行动作;在每个动作中,环境响应并生成一个新状态。 强化学习的类别强化学习主要分为两种方法/算法类型
强化学习的实际用例
强化学习的优缺点优点
缺点
维度诅咒限制了强化学习在真实物理系统中的应用。 机器学习类型多选题练习1. 下列哪种机器学习算法可以在不被明确编程的情况下学习执行任务?
答案 B) 无监督学习。 说明 无监督学习算法在没有标记响应的情况下学习数据中的模式。 2. 下列哪项是监督学习的例子?
答案 C) 回归。 说明 回归涉及根据输入特征预测连续值,这是一种监督学习形式。 3. 监督学习和无监督学习的主要区别是什么?
答案 A) 监督学习需要标记数据,而无监督学习不需要。 说明 在监督学习中,算法从标记数据中学习,而在无监督学习中,算法从未标记数据中学习。 4. 以下关于强化学习的说法哪项是正确的?
答案 B) 它依靠奖励系统来学习最优行为。 说明 强化学习涉及代理通过从环境中接收奖励或惩罚形式的反馈来学习做出决策。 5. 在半监督学习中,标记数据与未标记数据的典型比例是多少?
答案 C) 1:5 说明 在半监督学习中,少量标记数据与大量未标记数据一起用于训练模型。 下一主题Keras 中的回调 |
我们请求您订阅我们的新闻通讯以获取最新更新。