线性模型

2025年3月17日 | 阅读 3 分钟

线性回归是最全面和最常用的回归技术之一。它也是最简单的回归技术之一。结果易于解释，这是其主要优点之一。

下面列出的回归技术假设目标值是属性的线性组合。用数学语言表示预期值。

y^(w,x)=w0+w1x1+......wpxp

我们在整个模块中将向量 w=(w1,....,wp) 命名为 coef，w0 命名为 intercept_。

请参阅 Logistic 回归，了解如何使用广义线性模型进行分类。

LinearRegression 使用系数 w=(w1,..., wp) 调整线性版本，以便减少数据集目标与使用线性近似预测的梦想之间的残差平方和。

它解决了以下类型的数学问题

minw||Xw-y||2

线性回归示例

下面的示例仅使用糖尿病数据集的第一个特征来显示二维图的数据点。该图说明了线性回归如何寻求创建一条直线，以最大限度地减少数据集观测响应与线性近似预测之间的残差平方和。还计算了系数、残差平方和以及决定系数。

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets, linear_model
regr = linear_model.LinearRegression()
regr.fit(diabetes_X_train, diabetes_y_train)
diabetes_y_pred = regr.predict(diabetes_X_test)
# The coefficients
print("Coefficients: \n", regr.coef_)
# The mean squared error
plt.plot(diabetes_X_test, diabetes_y_pred, color="blue", linewidth=3)
plt.xticks(())
plt.yticks(())
plt.show()

输出

Coefficients:
 [938.23786125]
Mean squared error: 2548.07
Coefficient of determination: 0.47

当函数相关且布局矩阵的列表现出近似线性关系时，设计矩阵 X 接近奇异。因此，最小二乘估计对发现目标中的随机错误变得更加敏感。

示例

线性回归示例

非负最小二乘法

当所有系数代表某些物理或明显非负值（例如频率计数或产品费用）时，可以强制所有系数为非负。

示例

小于零的最小二乘法

简单线性回归是一种根据单个特征预测响应的策略。这是该领域爱好者可以了解的最基本的系统学习模型之一。在线性回归中，因变量和自变量被认为是线性相关的。因此，给定一个特征或自变量 (x)，我们寻求一个能够准确预测响应值 (y) 的线性函数。

线性回归的 Python 实现

Python 编程语言可用于研究线性回归模型的系数。我们将使用 matplotlib 库绘制输入数据和最佳拟合线。它是最常用的 Python 图形包之一。

import numpy as np
import matplotlib.pyplot as plt

def estimate_coef(x, y):
	# number of observations/points
	m_y = np.mean(y)
	SS_xy = np.sum(y*x) - n*m_y*m_x

	# predicted response vector
	y_pred = b[0] + b[1]*x

	# plotting the regression line
	plt.plot(x, y_pred, color = "g")

	# putting labels
	plt.xlabel('x')
	plt.ylabel('y')

	# function to show plot
	plt.show()

def main():

	# plotting regression line
	plot_regression_line(x, y, b)

if __name__ == "__main__":
	main()

输出

Estimated coefficients:
b_0 = -0.0586206896552
b_1 = 1.45747126437

通过将线性方程拟合到观测数据，线性回归是一种广泛使用的统计技术，在统计分析和系统学习中用于建模结构化变量与一个或多个独立变量之间的关系。它是收集数据和预测数值结果的基本技术。

寻找最佳直线（或多个维度中的超平面）是线性回归的主要目标，它能最好地捕捉自变量与既定变量之间的关系。

变量的价值是使用线性回归分析，根据所有其他变量的成本来预测的。因变量是您应该期望的变量。独立变量是您用来预测其他变量价值的变量。

为了尽可能准确地预测因变量的值，这种分析方法估算了一个或多个目标变量的线性方程的系数。

结论

线性回归是一种关键的统计技术，用于数据分析和设备学习，它模拟因变量与一个或多个自变量之间的关系。它提供了一个简单而有效的框架来收集数据、进行预测和解释数值结果。

下一个主题CycleGAN

线性模型

线性回归示例

非负最小二乘法

线性回归的 Python 实现

结论

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

机器学习

监督式学习

分类

杂项

相关教程

面试题

线性模型

线性回归示例

非负最小二乘法

线性回归的 Python 实现

结论

相关帖子

N-grams 词袋模型

机器学习基础概念

Keras：注意力与 Seq2Seq

高斯泼溅概述

机器学习中的随机搜索

为什么训练损失远大于验证损失？

机器学习数学课程

什么是知识图谱

DC-GAN

聚类性能评估

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器