以泰坦尼克号数据集为例,如何统计每个字段的非na值数量?发布于2024年09月23日 python 实际工作中遇到的数据集都会存在着多多少少的不完美数据,即空值na数据。面对这些不完美数据,在做进一步的处理之前。还应该有个大体的空值数量的了解和认知。本文就是对这一点进行讨论的。苏南大叔的"程序如此灵动"博客,记录... 阅读更多
以泰坦尼克数据集为例,探讨空值检测手段isna()和isnull()发布于2024年09月21日 python 话题回到泰坦尼克数据集,本文以该数据集为例,探讨对数据进行清洗处理中空值检测的几种方式。因为在数据清洗的领域里面,空值是一定影响数据预测的结果的,一定要提前预防。苏南大叔的“程序如此灵动”博客,记录苏南大叔的代码经... 阅读更多
数据清洗,如何理解groupby的as_index参数?发布于2024年09月17日 python 对dataframe数据进行分组的时候,有个as_index参数。本文对这个参数进行一下简要的讨论,根据官方文档的说法,这个参数的最大的作用是控制数据输出的风格。苏南大叔的“程序如此灵动”博客,记录苏南大叔的编程经... 阅读更多
数据清洗,查看groupby分组数据的几种方法总结发布于2024年09月16日 python 目光聚焦到dataframe数据,在python中,给数据进行分组的方式就是.groupby(),得到的数据结果就是的groupby分组对象,本文主要探讨查看groupby数据的几种方法。苏南大叔的“程序如此灵动”... 阅读更多
数据清洗,如何利用pd.cut()给数字数据进行分组处理?发布于2024年06月13日 python 继续python里面,对数字数据进行分类处理的方式方法。数字数据一般指的是:年龄、工资、金额 等数据。这类数据由数字组成,每一部分数据都可以使用文字来进行描述,全部数据就可以使用多个文字来进行描述。从而实现对数字类... 阅读更多