当前位置:首页|资讯

【Pandas教程】数据清洗常用方法(二)

作者:whj199605发布时间:2024-10-08

目录

  1. 处理缺失值(删除、替换)

  2. 删除重复值

  3. 字符串操作(删除左右字符串、字符串替换、字符串分割、字符串拼接、其他操作)


处理缺失值

删除缺失值:df.dropna()

参数说明

代码示例:


替换缺失值:df.fillna()

参数说明

代码示例:


删除重复值

参数说明

代码示例:


字符串操作

  • 通过df['列名']获取Series对象,然后使用Series.str将Series对象转换为StringMethods对象,再调用StringMethods对象下的字符串处理方法

删除左右字符串


字符串替换

部分替换:Series.str.replace()

参数说明

全部替换:df.replace()

参数说明

代码示例:


字符串分割

参数说明

代码示例:


字符串拼接

参数说明

代码示例:

运行结果:

近4年中国宏观杠杆率曲线

na_rep参数的设置代码示例:


其他字符串操作

利用正则表达式提取数字代码示例:



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1