Pandas DataFrame.cut()2024 年 8 月 29 日 | 4 分钟阅读 当您需要将数据值分割和排序到不同的区间时,会调用 cut() 方法。它用于将连续变量转换为分类变量。它还可以将元素数组分隔到不同的区间。该方法仅适用于一维类数组对象。 如果我们有大量的标量数据并对其进行一些统计分析,我们可以使用 cut() 方法。 语法参数x: 它通常指作为要进行区间化的输入的数组。 该数组应为一维数组。 bins: 它指的是定义分割的区间边缘的 int、标量序列或 IntervalIndex 值。 在大多数情况下,我们有非常大规模的数值数据。 因此,我们可以将这些值分组到不同的区间中,以轻松地执行描述性统计,作为数据模式的概括。 将数据分到不同组的标准如下
返回值此方法返回两个对象作为输出,如下所示
示例 1: 以下示例将数字分割到不同的区间中 输出 num 0 48 1 36 2 7 3 2 4 25 5 2 6 13 7 5 8 7 9 25 10 10 num num_bins 0 48 (1.0, 25.0] 1 36 (1.0, 25.0] 2 7 (1.0, 25.0] 3 2 (1.0, 25.0] 4 25 NaN 5 2 (1.0, 25.0] 6 13 (1.0, 25.0] 7 5 (1.0, 25.0] 8 7 (1.0, 25.0] 9 25 (1.0, 25.0] 10 10 NaN [(1.0, 25.0], NaN] Categories (1, interval[int64]): [(1, 25]] 示例 2: 以下示例显示了如何向区间添加标签 输出 num 0 9 1 9 2 4 3 9 4 4 5 7 6 2 num nums_labels 0 9 Highs 1 9 Highs 2 4 Lows 3 9 Highs 4 4 Lows 5 7 Highs 6 2 Lows [Highs, Lows] Categories (2, object): [Lows < Highs] 下一个主题DataFrame.describe() |
我们请求您订阅我们的新闻通讯以获取最新更新。