分类下重复值 透视表 计数
  X5zJxoD00Cah 2023年11月02日 70 0

https://blog.51cto.com/u_16055028/6177557

# 分类下重复值
df_test = pd.DataFrame(
    data=np.array([
        [1]*3 + [2]*3,
        np.repeat([1,2,3], 2)
    ]).T,
    columns=['col'+str(i) for i in range(1,3)]
)
# https://blog.51cto.com/u_16055028/6177557 透视表 计数
display(df_test.pivot_table(
    index=['col1', 'col2'],
    values=['col2'],
    aggfunc=len
))  # 正确
display(df_test.pivot_table(
    index=['col1', 'col2'],
    values=['col2'],
    aggfunc='count'
))  # 无效?
display(df_test.pivot_table(
    index=['col1', 'col2'],
    values=['col2'],
    aggfunc=np.count_nonzero
))  # 忽略分组,忽略空字符串
# 以下均有效,必须新增列
df_test['计数'] = df_test['col2']
display(df_test.pivot_table(
    index=['col1', 'col2'],
    values=['计数'],
    aggfunc=len
))
display(df_test.pivot_table(
    index=['col1', 'col2'],
    values=['计数'],
    aggfunc='count'
))
display(df_test.pivot_table(
    index=['col1', 'col2'],
    values=['计数'],
    aggfunc=np.count_nonzero
))
【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

X5zJxoD00Cah