如何使用Python 对缺失值进行处理
PHP中文网
PHP中文网 2017-06-22 11:51:31
[Python讨论组]

最近项目一直在研究如何处理缺失值,因为拿来分析的数据多种多样,缺失值也占了一小部分,让人头痛的有两个问题:
1.R语言里有一个专门处理缺失值的mice包,那么万能的Python里有没有相似的呢?
2.如何对含有字符串类型的缺失值进行填充呢?聚类啊回归都是相对于数值型来说的,那么对于字符型有什么好的算法或者有什么好的封装的包来处理呢?
求大神解答。
PS:额,样例的话,比较不好描述,就如下:
name,password,age,address
张三,123456,15.3,sichuang
李四,12,12.2,wuhan
王五,232,12,
钱六,,23,nanchang
哈哈,123456,,lal
啦啦,123123,,mmm

我们希望如R语言中的mice包一样,能使用Python很快的填充里面的缺失值(当然这个例子里面的信息关联性不大,但是要处理的数据里关联性比较多),再也如例子中,通过其他的属性,将属于字符串类型的address填充完整,就是第二个问题。

PHP中文网
PHP中文网

认证高级PHP讲师

全部回复(2)
三叔
#文本保存到1.txt,删除最后一行的address值
name,password,age,address
张三,123456,15.3,sichuang
李四,12,12.2,wuhan
王五,232,12,
钱六,,23,nanchang
哈哈,123456,,lal
啦啦,123123,,
import pandas as pd
df = pd.read_table('1.txt', header=0, sep=',')
#添加一列
df['new'] = '新值'
#按当前行的其他列,填充address值
df['address'] = df.apply(lambda x: x['new'] if pd.isnull(x['address']) else x['address'], axis=1)

print df
仅有的幸福

PyMICE is a Python® library for mice behavioural data analysis.你可以看看是不是你要的?
https://neuroinflab.wordpress...
http://neuroinflab.github.io/...

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号