一. # read_csv与read_excel的差异性
一个pandas学习的小小记录
pandas读取excel文件代码
savapath
= r
"C:\Users\test.xlsx"
df
= pd
.read_excel
(savapath
,names
=None,usecols
=[1])
data
= df
.values
for i
in range(0,len(data
)):
print(data
[i
][0])
pandas读取csv文件代码
savapath
= r
"C:\Users\test.csv"
data
= pd
.read_excel
(savapath
,sep
=',',header
=None,encoding
='gbk')
for i
in range(0,len(data
)):
print(data
[0][i
])
pandas读取excel文件时如果要将内容转为数组需要使用values属性值,而读取csv时生成的直接就是一个数组。读取excel生成的数组时取第一列的值为data[i][0],读取csv生成的数组时取第一列的值为data[0][i],这是因为前者的i代表excel中的第几行,后者的i代表的时第一列的第几个值。
pandas按列的值读取excel的方法:
df
= pd
.read_excel
(xlsx_path
, keep_default_na
=False)
for row
in df
.itertuples
():
row_name
= getattr(row
, '内容1')
先利用itertuples方法获取excel表每行的元组属性集合, 具体格式如下:Pandas(Index=58, 内容1=‘这里,我来分享一个我自己的故事。’)然后使用getattr获取列名为文件名称的内容。 ps:这个是截取的第58行
pandas新建一个excel表
list1
= [1, 2, 3]
df
= pd
.DataFrame
({'ID': list1
, 'Name': ['Tim', 'Victor', 'Nick']})
df
= df
.set_index
('ID')
data
['性别'] = None
data
.loc
[3] = ['王五', 100, '男']
df
.to_excel
(r
'C:/test/test/output.xlsx')