Pandas Series.unique()

2024年8月29日 | 1 分钟阅读

在使用 Pandas 中的 DataFrame 时,您需要找到列中存在的唯一元素。为此,我们必须使用 unique() 方法从列中提取唯一值。 Python 中的 Pandas 库可以轻松地帮助我们找到唯一数据。

列中存在的唯一值按其出现的顺序返回。 这不会对它们的出现顺序进行排序。 此外,此方法基于哈希表

它比 numpy.unique() 方法快得多,并且还包括空值。

语法

参数

值: 它指的是一个由数组值组成的 1d 数组类对象。

返回值

此方法返回一个 numpy.ndarray 或 ExtensionArray 对象,并且可以是

  • 索引: 当用户将索引作为输入传递时返回。
  • 类别: 当用户将 Categorical dtype 作为输入传递时返回。
  • ndarray: 当用户将 ndarray/Series 作为输入传递时返回。

示例 1

输出

array(['2016-01-01T00:00:00.000000000'], dtype='datetime64[ns]')

示例 2:下面的示例从索引中提取唯一的 timestamp

输出

DatetimeIndex(['2016-01-01 00:00:00-05:00'], dtype='datetime64[ns, US/Eastern]', freq=None)