您当前的位置：首页 > IT编程 > python
\| C语言 \| Java \| VB \| VC \| python \| Android \| TensorFlow \| C++ \| oracle \| 学术与代码 \| cnn卷积神经网络 \| gnn \| 图像修复 \| Keras \| 数据集 \| Neo4j \| 自然语言处理 \| 深度学习 \| 医学CAD \| 医学影像 \| 超参数 \| pointnet \| pytorch \| 异常检测 \| Transformers \| 情感分类 \| 知识图谱 \|

自学教程：pandas快速处理Excel,替换Nan,转字典的操作

51自学网 2021-10-30 22:47:10

python

这篇教程pandas快速处理Excel,替换Nan,转字典的操作写得很实用，希望能帮到您。

pandas读取Excel

import pandas as pd# 参数1：文件路径，参数2：sheet名pf = pd.read_excel(path, sheet_name='sheet1')

删除指定列

# 通过列名删除指定列pf.drop(['序号', '替代', '签名'], axis=1, inplace=True)

替换列名

# 旧列名 新列名对照columns_map = {    '列名1': 'newname_1',    '列名2': 'newname_2',    '列名3': 'newname_3',    '列名4': 'newname_4',    '列名5': 'newname_5',    # 没有列名的情况    'Unnamed: 10': 'newname_6',}new_fields = list(columns_map.values())pf.rename(columns=columns_map, inplace=True)pf = pf[new_fields]

替换 Nan

通常使用

pf.fillna('新值')

替换表格中的空值，（Nan）。

但是，你可能会发现 fillna() 会有不好使的时候，记得加上 inplace=True

# 加上 inplace=True 表示修改原对象pf.fillna('新值', inplace=True)

官方对 inplace 的解释

inplace : boolean, default False
If True, fill in place. Note: this will modify any other views on this object, (e.g. a no-copy slice for a column in a DataFrame).

全列输出不隐藏

你可能会发现，输出表格的时候会出现隐藏中间列的情况，只输出首列和尾列，中间用 … 替代。

加上下面的这句话，再打印的话，就会全列打印。

pd.set_option('display.max_columns', None)print(pf)

将Excel转换为字典

pf_dict = pf.to_dict(orient='records')

全部代码

import pandas as pdpf = pd.read_excel(path, sheet_name='sheet1')columns_map = {    '列名1': 'newname_1',    '列名2': 'newname_2',    '列名3': 'newname_3',    '列名4': 'newname_4',    '列名5': 'newname_5',    # 没有列名的情况    'Unnamed: 10': 'newname_6',}new_fields = list(columns_map.values())pf.drop(['序号', '替代', '签名'], axis=1, inplace=True)pf.rename(columns=columns_map, inplace=True)pf = pf[new_fields]pf.fillna('Unknown', inplace=True)# pd.set_option('display.max_columns', None)# print(smt)pf_dict = pf.to_dict(orient='records')

补充：python pandas replace 0替换成nan，bfill/ffill

0替换成nan

一般情况下，0 替换成nan会写成

df.replace(0, None, inplace=True)

然而替换不了，应该是这样的

df.replace(0, np.nan, inplace=True)

nan替换成前值后值

df.ffill(axis=0) # 用前一个值替换df.bfill(axis=0) # 用后一个值替换

以上为个人经验，希望能给大家一个参考，也希望大家多多支持51zixue.net。如有错误或未考虑完全的地方，望不吝赐教。

pandas读取excel,txt,csv,pkl文件等命令的操作
pandas调整列的顺序以及添加列的实现