线性模型

2025年3月17日 | 阅读 3 分钟

线性回归是最全面和最常用的回归技术之一。它也是最简单的回归技术之一。结果易于解释,这是其主要优点之一。

下面列出的回归技术假设目标值是属性的线性组合。用数学语言表示预期值。

y^(w,x)=w0+w1x1+......wpxp

我们在整个模块中将向量 w=(w1,....,wp) 命名为 coef,w0 命名为 intercept_。

请参阅 Logistic 回归,了解如何使用广义线性模型进行分类。

LinearRegression 使用系数 w=(w1,..., wp) 调整线性版本,以便减少数据集目标与使用线性近似预测的梦想之间的残差平方和。

它解决了以下类型的数学问题

minw||Xw-y||2

线性回归示例

下面的示例仅使用糖尿病数据集的第一个特征来显示二维图的数据点。该图说明了线性回归如何寻求创建一条直线,以最大限度地减少数据集观测响应与线性近似预测之间的残差平方和。还计算了系数、残差平方和以及决定系数。

输出

Coefficients:
 [938.23786125]
Mean squared error: 2548.07
Coefficient of determination: 0.47

Linear Models

当函数相关且布局矩阵的列表现出近似线性关系时,设计矩阵 X 接近奇异。因此,最小二乘估计对发现目标中的随机错误变得更加敏感。

示例

线性回归示例

非负最小二乘法

当所有系数代表某些物理或明显非负值(例如频率计数或产品费用)时,可以强制所有系数为非负。

示例

小于零的最小二乘法

简单线性回归是一种根据单个特征预测响应的策略。这是该领域爱好者可以了解的最基本的系统学习模型之一。在线性回归中,因变量和自变量被认为是线性相关的。因此,给定一个特征或自变量 (x),我们寻求一个能够准确预测响应值 (y) 的线性函数。

线性回归的 Python 实现

Python 编程语言可用于研究线性回归模型的系数。我们将使用 matplotlib 库绘制输入数据和最佳拟合线。它是最常用的 Python 图形包之一。

输出

Estimated coefficients:
b_0 = -0.0586206896552
b_1 = 1.45747126437

Linear Models

通过将线性方程拟合到观测数据,线性回归是一种广泛使用的统计技术,在统计分析和系统学习中用于建模结构化变量与一个或多个独立变量之间的关系。它是收集数据和预测数值结果的基本技术。

寻找最佳直线(或多个维度中的超平面)是线性回归的主要目标,它能最好地捕捉自变量与既定变量之间的关系。

变量的价值是使用线性回归分析,根据所有其他变量的成本来预测的。因变量是您应该期望的变量。独立变量是您用来预测其他变量价值的变量。

为了尽可能准确地预测因变量的值,这种分析方法估算了一个或多个目标变量的线性方程的系数。

结论

线性回归是一种关键的统计技术,用于数据分析和设备学习,它模拟因变量与一个或多个自变量之间的关系。它提供了一个简单而有效的框架来收集数据、进行预测和解释数值结果。


下一个主题CycleGAN