创建感知器模型的数据集

2025年3月17日 | 阅读 3 分钟

现在,我们将了解如何创建、学习和测试感知器模型。 在 PyTorch 中实现感知器模型需要几个步骤,例如创建模型的数据集、设置模型、训练模型和测试模型。

让我们从第一步开始,即创建数据集。

为了创建数据集,我们将直接从 SDK learn 导入一个数据集。 SDK-learn 为我们提供了访问许多预先准备好的数据集的权限。 我们只需导入数据集即可访问所有这些数据集。 在此,我们还使用 numpy 库来进一步操作和分析此数据,最后导入用于绘制数据集的最常用库,即 matplotlib.pyplot。

在这里,我们首先使用 SDK learn 创建一个线性可分的数据集,然后使用 torch 创建一个基于感知的神经网络。 之后,神经网络将训练学习如何拟合我们的数据集,以便它能够将我们的数据分成两个离散的类别。 这将使用优化算法(梯度下降),您可能已经熟悉了该算法。

在这里,我们将使用 make_blobs() 方法。 此函数将创建数据点的集群,这些数据点都随机地集中在集群的选定中心点上。

让我们看看创建数据集的步骤

1. 第一步是导入所有必需的库,例如 torch、sklearn、numpy 和 matplotlib.pyplot。


Dataset

2. 在第二步中,我们定义数据点的数量,然后使用 make_blobs() 函数创建一个数据集。 我告诉过你,此函数将创建数据点的集群。


Dataset

3. 在调用 make_blobs() 函数之前,我们需要创建一个嵌套列表,该列表指定了集群中心的坐标。 因此,我们必须调用列表中心,并按以下方式定义集群的中心坐标。


Dataset

4. 现在,我们将创建我们的数据集,并将我们的数据点存储到变量 x 中,同时将值存储到变量 y 中,并且我们将只使用我们的标签一小会儿。


Dataset

5. 我们的数据集尚未创建,因为我们没有传递此函数的任何适当参数。 所以我们在这里传递所有参数。 第一个参数表示样本点的数量; 第二个参数是随机状态,第三个参数是中心,最后一个参数将允许我们生成我们的第一个线性可分数据集,即集群标准差。


Dataset

6. 在下一步中,我们通过打印 x 和 y 坐标来可视化我们的数据,如下所示


Dataset
Dataset

7. 现在,在按需要自定义我们的数据集后,我们可以使用 plt.scatter() 函数对其进行绘制和可视化。 我们定义每个标签数据集的 x 和 y 坐标。 让我们从标签为 0 的数据集开始。 它绘制了我们数据的顶部区域。 0 标记数据集的散点函数定义为


Dataset
Dataset

8. 现在,我们绘制数据较低区域的点。 标签为 1 的数据集的散点函数() 定义为


Dataset
Dataset

9. 请记住,要训练模型 x,y 坐标都应该是 numpy 数组。 所以我们所做的是,我们将 x 和 y 值更改为张量,如下所示


Dataset
Dataset
下一个主题感知器模型