数据格式化

    技术2023-07-11  86

    数据格式化

    数据组织的维度

    一维数据,二维数据,多维数据(表格就是典型的多维数据)

    高维数据:

    数据的操作周期

    数据存储—数据表示—数据操作

    一维数据的表示

    列表类型可以表达一维有序数据

    for循环可以遍历数据,进而对每个数据进行处理

    如果数据间无序,可以使用集合类型

    集合类型可以表达一维无序数据

    for循环可以遍历数据,进而对每个数据进行处理

    一维数据的存储

    存储方式一:空格分隔

    ​ 使用一个或多个空格分隔进行存储,不换行

    ​ 缺点:数据中不能存在空格

    存储方式一:逗号分隔

    ​ 使用英文半角逗号分隔数据进行存储,不换行

    ​ 缺点:数据中不能存在英文逗号

    其他方式:建议采用特殊符号

    ​ 缺点:通用性较差

    一维数据的处理

    从空格分隔符的文件找中读入数据

    txt = open(fname).read() Is = txt.split() f.close()

    从特殊符号分隔的文件中读入数据

    txt = open(fname).read() Is = txt.split("$") f.close()

    用空格分隔写入文件

    Is = ['中国', '美国', '日本'] f = open(fname, 'w') f.write(' '.join(Is)) f.close()

    用特殊分隔符写入文件

    Is = ['中国', '美国', '日本'] f = open(fname, 'w') f.write('$'.join(Is)) f.close()

    二维数据的表示

    列表类型表示二维数据

    使用两层for循环遍历每一个元素

    CSV数据存储格式

    如果数据中包含逗号,则在数据两侧增加一个引号,来表示这个逗号不是分隔元素的逗号

    二维数据存储和索引一般采用先行后列的方式

    二维数据的处理

    读入处理

    fo = open(fname) Is = [] for line in fo: line = line.replace("\n","") Is.append(line.split(",")) fo.close()

    写入处理

    Is = [[], [], []] f = open(fname, 'w') for item in Is: f.write(','.join(item) + '\n') f.close()
    Processed: 0.016, SQL: 10