机器学习中的分类算法17 Mar 2025 | 4 分钟阅读 众所周知,监督机器学习算法可大致分为回归算法和分类算法。在回归算法中,我们预测连续值的输出,但要预测分类值,我们需要分类算法。 什么是分类算法?分类算法是一种监督学习技术,用于根据训练数据识别新观测的类别。在分类中,程序从给定的数据集或观测中学习,然后将新观测分类到多个类别或组中。例如,是或否、0 或 1、垃圾邮件或非垃圾邮件、猫或狗等。类别也称为目标/标签或分类。 与回归不同,分类的输出变量是类别,而不是值,例如“绿色或蓝色”、“水果或动物”等。由于分类算法是一种监督学习技术,因此它采用带标签的输入数据,这意味着它包含带有相应输出的输入。 在分类算法中,离散输出函数 (y) 被映射到输入变量 (x)。 机器学习分类算法的最佳示例是电子邮件垃圾邮件检测器。 分类算法的主要目标是识别给定数据集的类别,这些算法主要用于预测分类数据的输出。 通过下图可以更好地理解分类算法。在下图中,有两个类,A 类和 B 类。这些类具有彼此相似但与其他类不同的特征。 ![]() 对数据集执行分类的算法称为分类器。分类有两种类型:
分类问题中的学习器在分类问题中,有两种类型的学习器:
机器学习分类算法的类型分类算法可进一步分为主要的两类:
注意:我们将在后面的章节中学习上述算法。评估分类模型模型完成后,有必要评估其性能;无论是分类模型还是回归模型。因此,对于分类模型的评估,我们有以下方法: 1. 对数损失或交叉熵损失
其中 y = 实际输出,p = 预测输出。 2. 混淆矩阵
![]() 3. AUC-ROC 曲线
分类算法的应用场景分类算法可以在不同的地方使用。以下是分类算法的一些流行应用场景:
下一主题逻辑回归 |
我们请求您订阅我们的新闻通讯以获取最新更新。