什么是图

2025年03月17日 | 阅读 9 分钟

在数学中,图是一种排列事实或数值的视觉表示或图表。两个或多个项目之间的关系通常用图上的点来表示。图是离散数学中涵盖的主题之一。在离散数学中,特别是在图论中,图是一种类似于一组对象的结构,其中一些对象对在概念上是“连接”的。

顶点(在数学中也称为节点或点)是对象的抽象,而边是相关顶点对之间的连接(也称为链接或线)。在图的图解表示中,顶点通常由一组点或圆圈表示,而边通常由一组直线或曲线表示。

What is Graph

一个由三个顶点和三条边组成的三角形图。图是 G = (V, E) 对,其中 V 是顶点的集合,E 是以边为元素的成对顶点的集合。无向图和简单图与有向图和多重图(有时是链接或线)相区别。多重图是一种泛化,允许多条边共享相同的端点。

图是显示数据之间关系的常用方法。图完成了传达过于复杂或广泛而无法用文本陈述的信息的目标,同时占用的空间更少。但是,仅将图用于我们可以在句子中清楚表达的内容。此外,避免重复文本中的信息,因为这样做违背了使用图的目的。如果数据表现出明显的趋势或显示变量之间的关系,我们应该使用图。当证据中的数据缺乏任何可辨别的趋势时,图就不是合适的视觉表示。

图是一种用于显示统计信息或变量之间关系的可视化描述。例如,在这里,我们可以根据下面提供的数据绘制一个显示班级中学生使用的学习用品类型(交货时间)和数量(数量)的图表。

What is Graph

首先计算每种用品的数量,然后以合乎逻辑的顺序用特定颜色在表格中显示数据。图具有预测作用,因为它们可以显示数据定量行为的广泛趋势。然而,作为近似值,它们可能不够精确,有时甚至会产生误导。

有向边和无向边

边可以是有向的,也可以是无向的。例如,如果两个人之间的边是握手,那么这个图是无向的,因为任何个人 A 只有在 B 也与 A 握手时才能与个人 B 握手。然而,如果从 A 到 B 的边表示 A 欠 B 的钱,那么这个图就是有向的,因为借钱并不总是会归还。

J. Sylvester 于 1878 年首次使用“图”这个术语(他称之为化学图形图像)。

边和环

连接顶点到其自身的边称为环,在图中偶尔是允许的。为了支持环,需要修改定义,将边定义为两个顶点的多重集而不是集合。这种广义的图被称为带环图或简称为图。边也必须是有限的,因为顶点集合 V 通常被假定为有限的。虽然偶尔会考虑无限图,但它们通常被视为一种特定类型的二元关系,因为关于有限图的大多数结论都是二元的。

边的端点是边 {x, y} 的顶点 x 和 y。边被描述为与 x 和 y 相关联,并连接 x 和 y。如果一个顶点不属于任何边,它可能不与其他任何顶点相连。无限情况不属于图的范畴,或者需要完全不同的证明。图的阶数由其顶点数(即 |V|)决定。图的 |E| 条边数衡量其大小。一个不包含顶点的图被称为空图(因此边集也为空)。然而,在其他情况下,例如在定义算法的计算复杂性时,大小是 |V| + |E|(否则,一个非空图的大小可能为 0)。入射到顶点的边数决定了其度或价;对于带环的图,每个环的边被计算两次。一个 n 阶图中每个顶点的最大度是 n-1(或 n,如果允许环)。边的最大数量是 n(n-1)/2(或 n(n+1)/2,如果允许环),而边的最小数量是 0。

What is Graph

邻接关系是对称的,由图的边在其顶点上定义。更具体地说,如果 {x, y} 是一条边,那么两个顶点 x 和 y 是相邻的。一个图可以由邻接矩阵 A 完全描述,这是一个 n×n 的方阵,指定了从顶点 i 到顶点 j 的连接数。因此,对于一个简单图,Aij 必须是 0(表示不连接)或 1(表示连接)。Aii 也必须是零。

多重图

带自环的图的特征是某些或所有 Aii 等于一个正整数,而多重图(在顶点之间有多条边)的特征是某些或所有 Aij 等于一个正整数。大多数图有两个轴:一个代表自变量集合的水平轴和一个代表因变量集合的垂直轴。折线图是最常见的图类型,其中时间通常是自变量。数据点绘制在这样的网格上,以大致表示销售趋势的季节性波动曲线,然后用线段连接。用直线连接数据点是可以的。或者,正如在实验物理学或化学中常见的那样,我们可以将它们围绕一条中线或曲线分组。

当自变量不是明确的时间变量时,我们可以使用条形图来显示离散数值量之间的关系。例如,我们可以使用平行的列或条来显示不同国家的相对人口规模。每个条的长度将与其所代表国家的人口成比例。因此,人口统计学家可以迅速确定中国的人口比其最接近的竞争对手印度大约多 30%。

同样的数据可以使用圆形图来表示部分与整体的关系。当一个圆被分成扇区时,每个扇区的大小或角度与该扇区占整个圆的比例直接相关。这种类型的图,也称为饼图,最常用于显示预算中各项的分解情况。在此图中,我们将描绘与条形图中相似的相对人口比例,但它还会显示中国约占世界人口的四分之一。

分析图

分析图用于将两个变量的函数映射到笛卡尔坐标系上,该坐标系由水平的 x 轴(也称为横坐标)和垂直的 y 轴(称为纵坐标)组成。从这个意义上说,图收集了所有满足特定函数的点 (x, y)。零点代表每个轴与实数线相交的位置。

线性方程或一次方程是最容易绘制的图,其中最简单的是 y = x。该方程的图是一条直线,以 45° 角穿过原点,经过左下象限和右上象限。二次方程图上最常见的形状包括抛物线、双曲线、圆和椭圆。在对数网格上,轴上的一个点代表变量的对数而不是实际变量,我们偶尔会显示这种和其他非线性函数。

坐标

在某些情况下,极坐标 (q.v.) 提供了一个更合适的图形系统,其中圆形平面上的点使用一系列同心圆和穿过其共同原点的直线来定位。通过向相应的代数或三角函数添加第三个变量,极坐标和笛卡尔坐标可以扩展以表示三维。当存在三个轴时,在第一种情况下,实体由等轴测图表示,在第二种情况下,曲面由球坐标图表示。

尽管许多计算机应用程序可以构建图,但作者必须遵守一些基本原则。一个基本要求是图必须易于阅读和理解。这不仅取决于字体大小和符号,还取决于图本身的类型。每个图都需要有详细且易于理解的图例。根据格式,一个图可能包含一个图号和一个说明(而不是标题)。

X 轴和 Y 轴

创建一个图,其中水平轴是自变量,纵坐标或 Y 轴是因变量。自变量由 X 轴(横坐标)表示。

What is Graph

一个图总是需要一个数据字段、坐标轴和刻度、符号以及一个说明。绘图符号必须清晰、可读,并与背景和前景图形形成强烈对比。与开放圆圈和开放方块的组合相比,开放和封闭的圆圈提供了最好的对比度,并且更有用。与论文标题的表达方式类似,每个段落都应尽可能详细地告知读者该图所传达的信息,但不应提供对结果的总结或解释,或实验的细节。选择适当的图类型时必须考虑要显示的数据类型。

如果只有因变量是数值型的,使用条形图;如果自变量和因变量都是数值型的,使用折线图或散点图;如果因变量和自变量都是数值型且表示比例,则使用饼图或条形图。

散点图

散点图显示了两个变量之间的关系,用于确定它们的值是否一致变化,例如在比较两种不同蛋白质的浓度水平时。折线图的 X 值代表一个连续变量,如时间、温度或压力,这是折线图和散点图之间的唯一区别。它绘制一组相关数据以显示 Y 如何随 X 的变化而变化。

折线图类似于 Kaplan-Meier 研究中使用的事件发生时间结果的生存图。Y 轴显示了随着时间推移,避免或经历特定事件的人的比例或百分比。条形图可以有水平或垂直的列。当条的长度增加时,值也随之增加。

直方图,也称为频率分布图,是一种类似于柱状图的特殊条形图。这些列彼此完美对齐。它显示了从测量连续变量中获得的信息。单个数据点被分类为称为类的组,以描绘每个类内数据的频率。柱的面积用于确定频率。例如,这些图经常用于确定一个变量是否呈正态分布,例如人群中蛋白质水平的分布。这些可以显示测量类别与测量变量的组合是如何分布的。

饼图显示数据类别或组与整个数据集的关系。整个饼代表所有数据,每个切片或部分代表整体中的不同类别或组。每个切片都应显示出显著的差异。一般来说,类别的范围应在 3 到 10 个之间。箱形图可以是垂直的或水平的。箱子不同部分之间的距离显示了数据的分散程度,以及它们是呈对称分布还是不对称分布。此技术用于显示一个或多个箱须变量的最小值、下四分位数、中位数和最大值的统计摘要。它还可能提供突出的数据。

常见错误包括以下几点

  • 在图中重复文本信息,或在表格中重复图的信息。
  • 图的图例没有被正确标记。使用了错误的图类型来显示数据。
  • 图没有按比例绘制。
  • 数据没有被标记,不一致,被中断或被夸大以获得期望的结果。
  • 另一个常见错误是画一条线,暗示数据点之间或之外存在未经证实的推断。

当在离散数据点(例如平均患者测量值)之间形成连续线时,作者无法确定位于线上的年龄组之间的值。在每个条形图的列中显示每个年龄组的平均值可能比显示单个数据更有效。当需要覆盖一个非常大的范围但无法用连续刻度实际显示时,应使用成对的对角线 (-/-) 来表示刻度和数据字段的中断。