这篇教程Python对Excel进行处理的实操指南写得很实用,希望能帮到您。 xlrd、xlwt和openpyxl模块的比较:
区别: 模块 | Excel格式支持 | xls | xlsx | xlrd | √ | √ | xlwt | √ | × | openpyxl | × | √ | 效率: 两种包对小文件的读写速度差别不大,而面对较大文件,xlrd/xlwt速度明显优于openpyxl,但因为xlwt无法生成xlsx是个硬伤,所以想要尽量提高效率又不影响结果时,可以考虑用xlrd读取,用openpyxl写入。 一、xlrd:对xls、xlsx文件进行读操作1.获取工作簿对象:xlrd.open_workbook() workBook = xlrd.open_workbook(filemname):打开Excel文件读取数据 注:filemname为文件名以及路径,如果路径或者文件名有中文给前面加一个r表示原生字符。 import xlrdfilename=r'D:/记录表.xls'workBook=xlrd.open_workbook(filename) 2.获取工作表(sheet)对象 1)获取所有sheet页的名字,返回一个列表 2)根据sheet页的名字获取指定表名的表,返回的是一个对象 sheetName = workBook.sheet_by_name(‘sheet1') 3)根据sheet索引获取对应sheet表(索引是从0开始的),返回的是一个对象 sheetName = workbook.sheet_by_index(0) 3.获取sheet的名称:name 4.获取行数和列数:nrows、ncols 1)获取表格的总行数 2)获取表格的总列数 5.获取整行或整列的值(数组):row_values、col_values rows = sheetName.row_values(0) # 获取第一行内容,返回一个列表cols = sheetName.col_values(0) # 获取第一列内容,返回一个列表 6.获取指定单元格的值:cell(a,b).value、row(1)[0].value sheetName.cell(1,0).value # 获取第2行第一列的单元格数据sheetName.row(1)[0].value # 获取第2行第一列的单元格数据 7.获取单元格内容的数据类型:ctype sheetName.cell(1,0).ctype 注:返回为代表数据类型的值,编码分别代表:ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error 二、xlwt:对xls文件进行写操作1.新建工作簿:xlwt.Workbook() workBook = xlwt.Workbook() 2.在工作簿中新建sheet页:add_sheet() table = workBook .add_sheet(‘Over',cell_overwrite_ok=True) # 如果对同一单元格重复操作会发生overwrite Exception,cell_overwrite_ok为可覆盖sheet = workBook .add_sheet(sheet_name) # 新增sheet表 import xlwtwb=xlwt.Workbook(encoding='utf-8') # 创建一个工作薄sheet=wb.add_sheet('文件阅读记录信息表') # 创建一个工作表 3.向表格中写入数据:write(i,j,value) sheet.write(i,j,value) # 向单元格(i,j)写入数据value 4.保存工作簿:save() 三、openpyxl:
1、对xlsx文件进行写操作 1).新建工作簿:openpyxl.Workbook() workBook = openpyxl.Workbook() # 新建工作簿 2).在工作簿中新建sheet页:create_sheet() sheet = workBook .create_sheet(sheet_name) # 新增sheet表:sheet_name 3).向表格中写入数据:cell(i,j,value) --索引从1计数 sheet= workBook .active # 获得当前活跃的工作页,默认为第一个工作页sheet.cell(i,j,value) # 向单元格(i,j)第i行第j列写入数据value 注意:行号和列号都从1开始计数,即(1,1)为第一行第一列 4).保存工作簿:save() 2、openpyxl:对xlsx文件进行读操作 1).获取工作簿对象:openpyxl.load_workbook() workBook = openpyxl.load_workbook(filemname) # 读取xlsx文件 注:filemname为文件名以及路径,如果路径或者文件名有中文给前面加一个r表示原生字符。 2).获取工作表(sheet)对象 workBook.get_sheet_names() # 获取所有sheet页的名字(所有工作表名)sheetName = workBook.get_sheet_by_name(‘sheet1') # 根据sheet页的名字获取指定表名的表sheetName = workBook.worksheets[0] # 根据sheet索引获取对应sheet表 3).获取sheet的名称:title sheetName.title # 获取sheet的名称 4).获取行数和列数:max_row、max_column sheetName.max_row # 获取表格的总行数sheetName.max_column # 获取表格的总列数 5).获取整行或整列的值(数组):rows[i]、columns[i] rows = sheetName.rows # 获取每一行内容,这是一个生成器,里面是每一行数据,每一行数据由一个元组类型包裹cols = sheetName.columns # 获取每一列内容,同上sheetName.rows[0] # 获取第一行内容–索引从0计数sheetName.columns[0] # 获取第一列内容–索引从0计数 6).获取指定单元格的值:cell(a,b).value–索引从1计数 sheetName[‘A1'].value # 获取第1行第一(A)列的单元格数据sheetName.cell(1,1).value # 获取第1行第一列的单元格数据 注:此处的行数和列数都是从1开始计数的,而在xlrd中是由0开始计数的 总结到此这篇关于Python对Excel进行处理的文章就介绍到这了,更多相关Python对Excel处理内容请搜索51zixue.net以前的文章或继续浏览下面的相关文章希望大家以后多多支持51zixue.net! Pandas 如何筛选包含特定字符的列 Python批量获取基金数据的方法步骤 |