python+pandas 1.0.5 简单处理excel数据
前言: 最近突然对pandas比较感兴趣,在网上查阅了一些pandas的资料,发现很多资料对excel处理的相关讲解不多。经过不断的摸索和试验,个人总结了一点点pandas对excel处理的理解。由于时间关系,此文中没有配图,但必要的代码和总结还是有的,希望此文能帮助到想用pandas1.0.5版本来处理excel数据的老铁们。讲解的不好,请多多包涵和斧正。
环境搭建 安装xlrd pip install xlrd 注:如果pip下载不成功,建议升级pip 命令:python -m pip install -U pip 安装pandas pip install pandas 注:pandas 1.0.5版本已经不需要单独下载所需配置软件,键入命令后,只需花费时间等待即可,如果一次下载不成功,可多次运行pandas pip install pandas 直到成功为止。
运用 安装完成后,打开pycharm pycharm的下载地址,老铁们可以百度,官网上有很多 1、导入pandas : import pandas 也可以给pandas命别名 import pandas as pd 2、利用pandas读取excel文件 pandas.read_excel(io,sheet_name = “XXX”,header =0,index_col = [“字段1”,“字段2”,“字段3”,“字段4”]) 注: io为您excel文件的路径及文件名; sheet_name默认值为0,如果不指定,默认读取您excel表格中的sheet1表格; header默认值为0,在读取excel文件时可以不写,默认读取表格中的第一行数据,如果要从第n行开始读取,可以指定header =n index_col 默认可以不指定,代表读取表格中的所有字段;当然您也可以通过指定字段1,2,3…来获取对应字段的数据; pandas.read_excel()返回的数据我们需要用参数来接收,因为返回的数据格式是dataframe,我们习惯用df变量来接收:df = pandas.read_excel(“文件的绝对路径”,sheet_name = “表格名”)。 3、获取到数据后,我们可以通过df.head(n)来获取前n行数据,返回的数据也是dataframe格式:data = df.head(n),n缺省不写时,默认获取前5行数据 4、获取excel表格中第一行数据,并以dataframe格式返回: data_1row = df.loc[[0]].values 5、获取excel表格中第一行数据,并以字典格式返回: data_1row = df.loc[[0]].to_dict() 6、获取excel表格中第n-m行数据,并以dataframe格式返回: data_1row = df.loc[n-1:m].values 7、获取excel表格中的索引值: index_v = df.index.values
小练习:将某excel表中数据读取出来,并将每行数据以字典格式嵌套在某列表中。 import pandas as pd df = pd.read_excel(r"文件绝对路径",sheet_name= “表格名”)#读取表中所有数据 index_v = df.index.values#获取excel表格中的索引值 data = []#定义空列表 for i in index_v:#利用索引值做遍历 dict_data = df.loc[i].to_dict()#按照索引值,按行获取excel表格中的数据,并将其转换为字典格式 data.append(dict_data)#将每行中字段格式的数据,追加到列表data中 print(data)