pandas read

技术2022-07-13 85

一. # read_csv与read_excel的差异性

一个pandas学习的小小记录

pandas读取excel文件代码

savapath = r"C:\Users\test.xlsx" df = pd.read_excel(savapath,names=None,usecols=[1]) #usecols=[1]代表读取excel的第一列 #usecols=[1,3]代表读取excel的第一列和第三列 data = df.values for i in range(0,len(data)): print(data[i][0])

pandas读取csv文件代码

savapath = r"C:\Users\test.csv" data = pd.read_excel(savapath,sep=',',header=None,encoding='gbk') for i in range(0,len(data)): print(data[0][i]) pandas读取excel文件时如果要将内容转为数组需要使用values属性值，而读取csv时生成的直接就是一个数组。读取excel生成的数组时取第一列的值为data[i][0]，读取csv生成的数组时取第一列的值为data[0][i]，这是因为前者的i代表excel中的第几行，后者的i代表的时第一列的第几个值。

pandas按列的值读取excel的方法：

df = pd.read_excel(xlsx_path, keep_default_na=False) for row in df.itertuples(): row_name = getattr(row, '内容1')

先利用itertuples方法获取excel表每行的元组属性集合，具体格式如下：Pandas(Index=58, 内容1=‘这里，我来分享一个我自己的故事。’)然后使用getattr获取列名为文件名称的内容。 ps：这个是截取的第58行

pandas新建一个excel表

list1 = [1, 2, 3] # 初始化一个map df = pd.DataFrame({'ID': list1, 'Name': ['Tim', 'Victor', 'Nick']}) # 定义ID为索引 df = df.set_index('ID') # 新增列 data['性别'] = None # 新增行 data.loc[3] = ['王五', 100, '男'] df.to_excel(r'C:/test/test/output.xlsx')

Processed: 0.021, SQL: 9