Sklearn predict 函数2024 年 8 月 29 日 | 5 分钟阅读 本教程将展示如何利用 Python 机器学习模型使用 Sklearn 预测函数来预测结果。 因此,我们将简要总结该函数的功能,回顾语法,然后提供使用此方法与各种机器学习模型进行示例。 Sklearn 预测概述要理解 predict 方法的主要功能,您必须熟悉标准的机器学习方法。 即使机器学习模型经过开发并部署在多个阶段,只有两个
它比这要复杂一些。我们经常需要调整模型的参数或设计新的优化器来提高模型的效率。 然而,在极端情况下,我们在了解已知数据后对其进行训练,然后使用它来执行其他任务,例如预测。 机器学习模型主要用于基于对旧数据的理解来预测或预测新数据结果。机器学习算法旨在执行成功的价值预测。 使用机器学习算法预测数据给定一组输入值,任何机器学习模型的主要目标是预测某个数量的值。 例如,让我们看一个预测房价的模型。输入,也称为特征,可能包括有关房屋邮政编码、房屋的平方英尺、卧室数量、浴室数量以及各种其他便利设施的信息。 如果我们已经使用这些特征训练了一个模型,我们可以向其输入更多数据,这应该会产生我们期望的输出。一旦我们用我们的观察结果训练了模型,我们就可以使用该模型对全新的数据进行预测。 大多数机器学习模型都遵循相同的方法。机器学习算法可用于就以下主题进行预测:
进行某种形式的预测是许多机器学习算法(例如回归和分类模型)的主要目标。 Sklearn 库的 Predict 方法语法既然我们已经了解了 sklearn 库的 predict 方法的作用,让我们看看它的语法。 我们将看到 predict 函数的语法。这意味着我们将假定您已经在当前工作环境中导入了 scikit-learn 库,并且已经在一个数据集上训练了一个模型,例如 LinearRegression、RandomForestRegressor 等。 Sklearn 预测语法 在执行 predict 方法时,我们必须使用一个已在训练数据集上进行过训练的机器学习模型类的实例。例如,支持向量机、决策树回归器、逻辑回归和线性回归都使用 scikit-learn 提供的机器学习模型。 使用“点”语法,我们可以在训练模型后使用 predict 方法 trained_model.predict(X_test) 我们在方法的括号内提供存储了我们要使用训练模型进行预测的值的数据的变量名称(即,我们正在为测试数据集预测值)。 例如,我们将使用 LinearRegression 对象来执行普通的线性回归。Sklearn.fit() 方法将使用 regressor_model 生成和训练学习模型。现在要预测某些输入特征的值,我们将使用以下命令: regressor_model.predict(input_features) 作为输入的待使用数据的格式 在继续之前,还有一件事。 X_test 数据必须作为二维数组提供给 predict() 函数。例如,所有特征或完整数据集都应存储在二维 Numpy 数组对象中。 如果 X_test(测试数据集)是某种其他 Python 数据结构而不是二维数组格式,Python 解释器将停止执行并引发错误。之后,我们必须进行转换(如果不是 Numpy 数组)或重塑(如果具有其他形状),然后才能将其传递给 fit() 方法。 实现 Python predict() 函数将所需数据集加载到工作环境中应是我们的第一步。可以使用 pandas.read_csv() 方法从系统加载数据集。我们将使用 sklearn 库的内置数据集。 使用 train_test_split() 方法,我们将数据集划分为训练集和测试集。 代码 输出 0.9733333333333334 在决策树中使用 predict() 方法现在我们将决策树方法应用于同一数据集,以预测测试数据集的目标标签。 代码 输出 0.9777777777777777 在 KNN 算法中使用 predict() 函数在这种情况下,数据集已针对 KNN 模型进行了训练以进行预测。我们将遵循相同的步骤,将数据分为训练数据和测试数据,然后使用训练数据来训练 KNeighborsRegressor()。 此外,我们将使用 accuracy() 方法来查找该数据集的模型准确性。 代码 输出 0.9777777777777777 下一主题Python 中减去字符串列表 |
在本教程中,我们将学习 Python 中的 pyopengl 库及其用法。OpenGL 是一个开源库,支持多个平台,如 Windows、Linux 和 MacOS。它还支持多种编程语言。我们将使用...
阅读 6 分钟
在本教程中,我们将学习转置排序,也称为砖排序或奇偶排序。它是一种相对简单的排序算法,最初是为了在具有局部互连的并行处理器上使用而开发的。该算法类似于冒泡排序和...
阅读 3 分钟
在讨论 VIF 之前,有必要先了解线性回归中的多重共线性是什么?当两个独立变量具有强相关性时,就会出现多重共线性。无论我们进行探索性数据分析,目标都是获得影响我们目标的重要参数...
阅读 3 分钟
在本教程中,我们将学习如何使用Python对给定图像应用滤镜。为此,我们将使用OpenCV模块。图像具有各种比例、对比度、位深度和质量。互联网上有数百万种不同的图像...
5 分钟阅读
在本教程中,我们将学习 Python 中的 Boruvka 算法。它用于识别最小生成树。捷克数学家 Otakar Boruvka 介绍了这种算法,并因其在图论方面的工作而闻名。这种算法是寻找...
阅读 15 分钟
名片仍然是各种专业场合中进行人际交往和交换联系信息的重要工具。然而,手动处理和整理各种名片中的信息可能耗时且容易出错。为了克服这些挑战,我们将探讨...
7 分钟阅读
Python IDE 和代码编辑器 您可以在本手册中找到许多适用于初学者和专家的 Python 集成开发环境和代码编辑器。用于编写和编辑代码的工具称为代码编辑器。它们通常是可移植的,并且对学习有益。使用 IDE 变得必要...
阅读 3 分钟
在学习 Python 的过程中,我们进行了大量练习,并试图深入理解 Python 的核心概念。实现所学的主题需要大量的努力和奉献。在这里,我们提到了一些基本和高级的 Python...
阅读9分钟
简介 众所周知,Python 提供了各种统计库,其中一些非常流行,例如 PyMC3 和 SciPy。这些库为用户提供了各种预定义函数来计算各种测试。但是为了理解过程背后的数学原理,有必要...
7 分钟阅读
这是一个大数据时代,每天都有新的公司试图利用其信息来做出更好的决策。正如 Python 在数据分析领域的日益普及所表明的那样,许多企业正在使用 Python 强大的数据科学环境来分析其数据。每一个数据科学家...
阅读 8 分钟
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India