1.3.1 python解析excel格式文件

    技术2022-07-16  72

    Excel表格

         Microsoft Excel是Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子表格软件。

    excel文档的基本定义

    工作薄(workbook)

    工作表(sheet)

    活动表(active sheet)

    行(row): 1,2,3,4,5,6……..

    列(column): A,B,C,D……..

    单元格(cell): B1, C1

     

    excel文件格式

     

    Python安装excel相关模块

         python对于Excel表格操作的模块有很多种,其中

    xlrd:对xls、xlsx、xlsm文件进行读操作–读操作效率较高,推荐

    xlwt:对xls文件进行写操作–写操作效率较高,但是不能执行xlsx文件

    openpyxl:对xlsx、xlsm文件进行读、写操作–xlsx写操作推荐使用

    Python不附带Openpyxl,因此您必须安装它。模块的名称是openpyxl,其安装方式有两种,可以直接在dos中使用下面命令:

      pip install openpyxl

    同样可以直接在pycharm中选择File | Settings | Project: python2020 | Project Interpreter

     

    操作的excel表格数据是

     

     打开一个excel文档

    import openpyxl# 打开一个excel文档, class 'openpyxl.workbook.workbook.Workbook'实例化出来的对象wb = openpyxl.load_workbook('wood.xlsx')print(wb, type(wb))# 获取当前工作薄里所有的工作表, 和正在使用的表;print(wb.sheetnames)print(wb.active)

    执行结果:

     

    选择要操作的工作表​​​​​​​

    # 2. 选择要操作的工作表, 返回工作表对象sheet = wb['Sheet1']# 获取工作表的名称print(sheet.title)

    执行结果:

     

    指定行指定列的单元格信息​​​​​​​

    # 3. 返回指定行指定列的单元格信息print(sheet.cell(row=1, column=2).value) cell = sheet['B1']print(cell)print(cell.row, cell.column, cell.value)

    执行结果:

     

    获取工作表中行和列的最大值​​​​​​​

    # 4. 获取工作表中行和列的最大值print(sheet.max_column)print(sheet.max_row)sheet.title = '学生信息'print(sheet.title)

    执行结果:

     

    访问单元格的所有信息​​​​​​​

    # 5. 访问单元格的所有信息print(sheet.rows) # 返回一个生成器, 包含文件的每一行内容, 可以通过便利访问.# 循环遍历每一行for row in sheet.rows: # 循环遍历每一个单元格 for cell in row: # 获取单元格的内容 print(cell.value, end=',')    print()

    执行结果:

     

    保存修改信息​​​​​​​

    # 6. 保存修改信息wb.save(filename='wood.xlsx')

     

    将数据写入Excel

    工作表相关

    导入WorkBook模块​​​​​​​

    from openpyxl import Workbookwb = Workbook()

     

    这样就新建了一个新的工作表(只是还没被保存)。

    若要指定只写模式,可以指定参数write_only=True。一般默认的可写可读模式就可以了。​​​​​​​

    from openpyxl import Workbookwb = Workbook()print(wb.get_sheet_names()) # 提供一个默认名叫Sheet的表#上述获取sheet的方式已经被sheetnames属性替换了:wb.sheetnames# 直接赋值就可以改工作表的名称wb["Sheet"].title = 'Sheet1'# 新建一个工作表,可以指定索引,适当安排其在工作簿中的位置wb.create_sheet('test', index=1) # 被安排到第二个工作表,index=0就是第一个位置# 删除某个工作表wb.remove(wb["Sheet1"]) #同样还可以使用del wb["Sheet1"]#保存excelwb.save("wood_test.xlsx")

    写入单元格

    还可以使用公式​​​​​​​

    #先获取test工作表的操作对象sheet=wb["test"]#直接给单元格赋值就行sheet['A1'] = 'wood'sheet["B4"]=10sheet["B8"]=20# B10处写入平均值sheet['B10'] = '=AVERAGE(B4:B8)'

    执行结果如下:

     

    append函数

    可以一次添加多行数据,从第一行空白行开始(下面都是空白行)写入。​​​​​​​

    # 添加一行row = [11, 12, 13, 14, 15]sheet.append(row)# 添加多行rows = [ ['ID', 'age1', 'age2'], [2, 40, 30], [3, 40, 25], [4, 50, 30], [5, 30, 10], [6, 25, 5], [7, 50, 10],]for value in rows: sheet.append(value)

    执行结果:  

     

     

    Excel操作总结

    导入 openpyxl 模块。

    调用 openpyxl.load_workbook()函数。

    取得 Workbook 对象。

    调用 wb.sheetnames和 wb.active 获取工作簿详细信息。

    取得 Worksheet 对象。

    使用索引或工作表的 cell()方法,带上 row 和 column 关键字参数。

    取得 Cell 对象。

    读取 Cell 对象的 value 属性

     

    了解更多信息关注公众号:

    Processed: 0.008, SQL: 9