当数据表某一列存在重复值时,通常需要统计该列中每个不同值的出现频次。在excel中,这一操作常通过countif函数完成;而在pandas中,则可通过内置方法高效实现去重及频次统计。
1、 当数据表中的某个字段包含重复内容时,常规处理方式是统计各唯一值的出现次数。相比Excel中的COUNTIF函数,Pandas提供了更为灵活和强大的数据操作功能来完成此类任务。
2、 首先导入pandas库

3、 接着读取外部Excel数据文件

4、 三、查看数据结构信息

公文是政府与企事业单位处理公务和行政管理工作的重要工具,在各级行政单位中,`办公`的一个重要内容就是办理和制发文件,即`办文`,办文是每个行政管理单位大量日常的工作。借助新的网络信息技术对公文进行高效有序的电子化处理,是办公自动化建设的重要组成部分,也是关系到电子化办公系统建设全局的基础性工程。
5、 在加载Excel数据时,并未将“姓名”列设置为索引,因其可能存在重复项,若强制设为索引可能导致数据对齐问题或引发异常,影响后续分析准确性。
6、 四、执行去重与频次统计

7、 五、进行数据筛选操作










