groupby用法有哪些
groupby是pandas库中的一个函数,用于对数据进行分组操作。它的用法有以下几种:
- 对DataFrame对象进行分组:
-
单列分组:df.groupby(‘column_name’)
-
多列分组:df.groupby([‘column_name1’, ‘column_name2’])
-
使用字典分组:df.groupby({‘column_name1’: ‘group_name1’, ‘column_name2’: ‘group_name2’})
- 对Series对象进行分组:
-
单列分组:series.groupby(series)
-
多列分组:series.groupby([series1, series2])
- 对分组后的数据进行聚合操作:
-
常用聚合函数:sum、mean、median、min、max、count等
-
自定义聚合函数:使用agg方法,传入自定义函数
- 对分组后的数据进行遍历:
- 使用for循环遍历每个分组:for name, group in df.groupby(‘column_name’)
- 对分组后的数据进行筛选操作:
- 使用filter方法,传入筛选条件
这些是groupby的常见用法,具体使用时可以根据实际需求进行调整。