韩漫免费漫画在线观看方法,《好好疼爱里面》免费看,年轻漂亮的女士护士内衣,妈妈醉酒后把我当爸爸电视剧

文章 > Python基础教程 > Python实现Excel数据的探索和清洗

Python实现Excel数据的探索和清洗

头像

宋雪维

2021-02-23 15:14:413445浏览 · 0收藏 · 0评论

数据的探索和清洗

1、读取Excel文件的数据并转换为dataframe

# 1.读取Excel文件的数据并转换为dataframe
file = "d:/test/Summary/Data_Summary.xlsx"
data_raw = pd.read_excel(file, header=0, index_col=0)   
# header设定为0:是为了使第1行的数据成为列的字段名

2、查看数据集的整体状态,了解基本特征列的情况

data_raw.head()

3、删除无效的数据列

remove_col = ["序号"]
data_prep0 = data_raw.drop(columns=remove_col, axis=1, inplace=None)
data_prep0.head()

4、查看数据集的整体信息,了解缺失值的分布情况

data_prep0.info()

5、检看数据集中缺失值的状态并删除缺失值

data_prep = data_prep0.dropna(subset=["产品"], axis=0)
data_prep.info()

6、检查数据集中重复值的状态并删除重复值

print("数据集中的重复值数量:", np.sum(data_prep.duplicated()))
# 如果重复值的数量不为"0", 则表示有重复值存在,可使用下列代码删除
# data_prep.drop_duplicates(keep="first", inplace=True)
关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

国产免费观看高清电视剧在线观看 | 《帐篷里的秘密》动漫| 真实双人插画的视频| 坤坤寒入桃子里电视剧| 公憩止痒小说原著叫什么名字 | 八卦图解| 国产精品黑料吃瓜网曝事件海角| 日本动浸扑克牌动画片观看全集视..| 麻花传剧MV在线看免费版高清 | 半夜洗澡被老头添一夜| 美国大片又大又好看的PPT| 电影免费观看高清完整版在线观看 | 《交换做爰》在线观看| 青梅竹马是消防员第一部| 漂亮的小瘦子3| 女生的全身照曝光| 歪歪漫画| 人狗大战2免费观看正版| 白日梦我小说全文免费阅读| 国精产品一品二品国精| 女被扒开腿狂躁XXXXX视频| 妈妈让我戴上避孕套的下一句是啥| 狗和人胶配方20分钟一| 细川麻里| BOBO浏览器(海外版)| 《肉体暴力强伦轩》| 免费B站看大片真人电视剧| 中文在线字幕免费观看电视剧 | 打扑牌不盖被子怎么办| 为啥女的舒服了要摸自己的胸| 九1黄9·1| 第1章品尝朋友娇妻| 《法国空乘6》| 国产一区| 性感内衣女装| 年轻的女学生| 姐姐片多多免费高清电视剧叶玉卿 | 双乳被四个男人吃奶| 伦理《少妇的滋味》完整版| 年轻的母亲4| 丫头把腿开大让我添添