Pandas中的cut函数如何使用
Pandas中的cut函数用于将连续的数据划分为离散的间隔。其语法如下:
pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise')
参数说明:
- x:待划分的数据
- bins:用于划分数据的间隔
- right:是否包含右边界,默认为True
- labels:给每个间隔添加标签
- retbins:是否返回划分的间隔
- precision:精度
- include_lowest:是否包含最小值
- duplicates:处理重复的边界值的方式
示例:
import pandas as pd
data = [1, 5, 10, 15, 20, 25]
bins = [0, 10, 20, 30]
result = pd.cut(data, bins)
print(result)
输出:
[(0, 10], (0, 10], (0, 10], (10, 20], (10, 20], (20, 30]]
Categories (3, interval[int64]): [(0, 10] < (10, 20] < (20, 30]]
在上面的示例中,我们将数据data划分为3个间隔,分别为(0, 10],(10, 20],(20, 30]。cut函数返回一个Categorical对象,显示了每个值所属的间隔。
相关问答