Pandas下有个pivot_table方法,可以对DataFrame进行数据透视,类似于Excel中的数据透视表,下面介绍其用法。
读取数据import pandas as pd pivot_data=pd.read_excel("../data/pivot_table.xlsx") pivot_data.head()
import numpy as np pivot_data.pivot_table(index=["学习中心"],values=["已缴纳学费"],aggfunc=np.sum)
pivot_data.pivot_table(index=["学习中心"],values=["身份证号码"],aggfunc=np.count_nonzero)
pivot_data.pivot_table(index=["学习中心"],values=["已缴纳学费","身份证号码"],aggfunc={"已缴纳学费":np.sum,"身份证号码":np.count_nonzero})
- pivot_table是Pandas中的一个方法,可以对DataFrame这种数据结构可以进行数据透视,类似于Excel中的数据透视表。
- 参数index指定按哪些字段,对数据进行分行显示,可以指定一个字段,也可以指定多个字段,类似于Excel数据透视表中行区域。
- 参数values指定要进行统计的字段,可以是数字型,也可以是分类型,类似于Excel数据透视表中的值区域。
- 参数aggfunc指定对values中的字段进行统计的函数,可以进行求和、计数等,类似于Excel数据透视表中对值区域的字段设置成求和还是计数或者其他等。
每日分享数据分析相关的知识、技巧,喜欢就赶紧关注哦。希望讲讲哪方面的数据分析知识,可以留言或者私信。