这篇教程pandas快速处理Excel,替换Nan,转字典的操作写得很实用,希望能帮到您。 pandas读取Excelimport pandas as pd# 参数1:文件路径,参数2:sheet名pf = pd.read_excel(path, sheet_name='sheet1') 删除指定列# 通过列名删除指定列pf.drop(['序号', '替代', '签名'], axis=1, inplace=True) 替换列名# 旧列名 新列名对照columns_map = { '列名1': 'newname_1', '列名2': 'newname_2', '列名3': 'newname_3', '列名4': 'newname_4', '列名5': 'newname_5', # 没有列名的情况 'Unnamed: 10': 'newname_6',}new_fields = list(columns_map.values())pf.rename(columns=columns_map, inplace=True)pf = pf[new_fields] 替换 Nan通常使用 替换表格中的空值,(Nan)。 但是,你可能会发现 fillna() 会有不好使的时候,记得加上 inplace=True # 加上 inplace=True 表示修改原对象pf.fillna('新值', inplace=True) 官方对 inplace 的解释 inplace : boolean, default False If True, fill in place. Note: this will modify any other views on this object, (e.g. a no-copy slice for a column in a DataFrame).
全列输出不隐藏你可能会发现,输出表格的时候会出现隐藏中间列的情况,只输出首列和尾列,中间用 … 替代。 加上下面的这句话,再打印的话,就会全列打印。 pd.set_option('display.max_columns', None)print(pf) 将Excel转换为字典pf_dict = pf.to_dict(orient='records') 全部代码 import pandas as pdpf = pd.read_excel(path, sheet_name='sheet1')columns_map = { '列名1': 'newname_1', '列名2': 'newname_2', '列名3': 'newname_3', '列名4': 'newname_4', '列名5': 'newname_5', # 没有列名的情况 'Unnamed: 10': 'newname_6',}new_fields = list(columns_map.values())pf.drop(['序号', '替代', '签名'], axis=1, inplace=True)pf.rename(columns=columns_map, inplace=True)pf = pf[new_fields]pf.fillna('Unknown', inplace=True)# pd.set_option('display.max_columns', None)# print(smt)pf_dict = pf.to_dict(orient='records') 补充:python pandas replace 0替换成nan,bfill/ffill 0替换成nan一般情况下,0 替换成nan会写成 df.replace(0, None, inplace=True) 然而替换不了,应该是这样的 df.replace(0, np.nan, inplace=True) nan替换成前值后值df.ffill(axis=0) # 用前一个值替换df.bfill(axis=0) # 用后一个值替换 以上为个人经验,希望能给大家一个参考,也希望大家多多支持51zixue.net。如有错误或未考虑完全的地方,望不吝赐教。 pandas读取excel,txt,csv,pkl文件等命令的操作 pandas调整列的顺序以及添加列的实现 |