在 Python 中绘制相关矩阵2025年3月17日 | 阅读 7 分钟 给定两个变量,如果一个变量的值依赖于其他变量的值,我们就说这两个变量是相关的。变量之间统计关系的度量称为“相关性”。这里相互依赖的两个变量是产品的价格和需求。例如,每当一种产品开始失去需求时,公司就会降低产品价格,因为价格下降,需求就会上升。 给定大量的观测数据,很难确定两个变量之间的相关程度。这是数据科学和数据分析的一个重要需求。统计技术被用来组织所有数据以获得相关性视图,为此,会创建图表和其他表示。 本教程将介绍如何在 Python 中绘制数据并创建相关矩阵。 在任何两个变量之间,可以存在三种相关性:
给定两个变量的数据,我们可以使用 Pandas 来找出这两个变量之间的相关性。 输出 0.9793792286287205 0.9793792286287205
现在,有了两个变量的数据,我们可以使用上述库中的函数来绘制显示相关性的图形。如果库未安装,可以使用 pip 或 conda 管理器进行安装。
代码输出 ![]() ![]()
使用的函数
自定义绘图 我们可以添加标题和标签使绘图更易于理解。为此,我们可以使用 title() 和 label() 函数。 输出 ![]() 使用的函数
Sklearn 库中的数据框Sklearn 是 Python 中的一个机器学习库。它内置了七个示例数据集,程序员无需下载任何外部文件即可使用。
数据集:sklearn.load_iris() 代码 输出 Sepal length (cm) sepal width (cm) ... petal width (cm) relation 0 5.1 3.5 ... 0.2 0 1 4.9 3.0 ... 0.2 0 2 4.7 3.2 ... 0.2 0 3 4.6 3.1 ... 0.2 0 4 5.0 3.6 ... 0.2 0 .. ... ... ... ... ... 145 6.7 3.0 ... 2.3 2 146 6.3 2.5 ... 1.9 2 147 6.5 3.0 ... 2.0 2 148 6.2 3.4 ... 2.3 2 149 5.9 3.0 ... 1.8 2 [150 rows x 5 columns] 我们从 pandas 创建了一个数据框,并包含了 iris 数据集。在数据集的四个特征中,我们将尝试找出萼片长度和花瓣宽度之间的相关性。
代码 输出 The correlation number between Sepal length and Petal length: 0.8179411262715757
相关矩阵 代码 输出 ![]()
相关热力图 热力图是绘制相关矩阵的另一种有效方法。它显示了每对变量之间的相关性。它属于 Seaborn 库。 代码 输出 ![]() 理解
自定义热力图 使用 matplotlib 库的 pyplot 模块,我们可以为矩阵添加标题和 x、y 轴标签,使其更易于理解。
代码 输出 ![]()
结论相关性指定了一个变量对另一个变量的关系/依赖程度的度量。使用统计技术可以轻松计算。但是,当涉及大量数据时,分析关系会很困难。因此,我们使用相关矩阵,其中图的颜色有助于程序员区分和理解变量之间的相关性。 本教程讨论了如何使用以下方法分析相关矩阵:
下一个主题使用 NumPy 计算欧几里得距离 |
Python 的条件语句根据特定的布尔条件计算为真或假来执行各种计算或操作。在 Python 中,IF 语句处理条件语句。在本教程中,我们将学习如何使用 Python 中的条件语句。什么是 Python If 语句?要创建...
阅读 3 分钟
scipy.stats.maxwell(),被称为第二类帕累托分布,定义了麦克斯韦连续随机变量。它是从通用方法继承的 rv_continuous 类的一个实例。它通过添加特定于此分布的细节来完善这些技术。scipy.stats.maxwell() 中包含的参数有:q:...
阅读 3 分钟
在Python中,有一种“特殊”的元组称为“命名元组”。Python初学者经常对此感到困惑,特别是关于何时以及为什么需要实现它。因为命名元组是一个元组,所以它可以执行元组能执行的所有功能。然而,它更……
阅读 6 分钟
引言:在本文中,我们将讨论 Python 中的数据解析。所有编程语言都将标记解析为有意义的词法形式,以便编译器或解释器可以将标记转换为有意义的输出。本文探讨了 Python 中的解析以及有助于解析的模块...
阅读 3 分钟
JSON Web Token 是一种简洁、URL 安全的机制,用于表示需要在两方之间交换的声明 (JWT)。它经常用于在计算机之间传输数据和安全地验证用户。我们将在本文中介绍 JWT 的基础知识以及如何在 Python 中使用它们。
阅读 4 分钟
在本教程中,我们将学习新推出的 Python 库,或者我们可以说是新功能 PyScript。这个库允许我们在 Web 浏览器上运行 Python 脚本。Python 提供了许多让程序员生活更轻松的功能。现在,他们推出了...
阅读 10 分钟
Bokeh 是 Python 的一个库,用于通过绘制图形和图表进行数据可视化。输出可以在不同平台上获得,例如 Notebook、HTML、JavaScript 和浏览器。Figure 类用于在图表上创建新图形,并且...
阅读 3 分钟
静态变量和静态方法是各种语言(如 C++、PHP、Java 等)中广泛使用的编程概念。这些变量和方法属于类和对象。在本节中,我们将学习如何在...
阅读 6 分钟
基础/必备知识简介:字典是 Python 中可用的数据类型之一。如果您熟悉集合和列表,那么字典就是另一种数据存储方式。从正式定义来看,字典是存储在...中的无序数据集合。
阅读 3 分钟
一种称为“Trie”的基于树的信息结构被描述为用于存储字符串集合并对其进行快速搜索。名称“Trie”来源于动词“Recovery”,表示查找或获取某物的行为。两个字符串将具有相同的...
阅读 19 分钟
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India