python_pandas读取csv、excel、dat文件
csvexceldat
csv
import pandas as pd
# 有表头:
df = pd.read_csv(csv_file)
# 无表头,通过names参数添加自定义表头名:
df = pd.read_csv(csv_file, header=None, names=["表头名"])
注意点:通过df[‘表头名’]读取的数据一般为str格式,使用 eval()函数将: 字典型字符串转化为字典; 列表型字符串转化为列表; 元组型字符数转化为元组。
excel
import pandas as pd
# 有表头:
df = pd.read_excel(excel_file)
# 无表头,通过names参数添加自定义表头名:
df = pd.read_excel(excel_file, header=None, names=["表头名"])
读取excel文件方式与csv文件相似。
dat
import pandas as pd
# 一般有表头:
df = pd.read_table(dat_file, names=["表头名"], sep='\t', encoding='utf-8')
dat数据一般无表头,且encoding方式一般为‘utf-8’形式,否则会出现gbk形式无法读取的error; dat数据因无表头,一般每一行长度不同,无法用pandas读取,建议使用python自带的open()函数打开。
with open(dat_file, encoding='utf-8') as f:
lines = f.readlines()