python

    技术2022-07-10  164

    python_pandas读取csv、excel、dat文件

    csvexceldat

    csv

    import pandas as pd # 有表头: df = pd.read_csv(csv_file) # 无表头,通过names参数添加自定义表头名: df = pd.read_csv(csv_file, header=None, names=["表头名"])

    注意点:通过df[‘表头名’]读取的数据一般为str格式,使用 eval()函数将: 字典型字符串转化为字典; 列表型字符串转化为列表; 元组型字符数转化为元组。

    excel

    import pandas as pd # 有表头: df = pd.read_excel(excel_file) # 无表头,通过names参数添加自定义表头名: df = pd.read_excel(excel_file, header=None, names=["表头名"])

    读取excel文件方式与csv文件相似。

    dat

    import pandas as pd # 一般有表头: df = pd.read_table(dat_file, names=["表头名"], sep='\t', encoding='utf-8')

    dat数据一般无表头,且encoding方式一般为‘utf-8’形式,否则会出现gbk形式无法读取的error; dat数据因无表头,一般每一行长度不同,无法用pandas读取,建议使用python自带的open()函数打开。

    with open(dat_file, encoding='utf-8') as f: lines = f.readlines()
    Processed: 0.009, SQL: 12