《28天玩转TensorFlow2》第7天:TensorFlow2构建数据管道—Numpy array格式

    技术2025-09-06  59

    tf.data提供了快速、灵活、易于使用的数据管道,同时还提供同步的训练,所谓同步训练就是利用CPU处理数据,供给GPU或者TPU(如果有的话)来训练数据。将数据集转变为数据管道的形式,有助于提升训练的效率。下面通过实例Numpy array格式数据集如何构建数据管道,以及数据的预处理、模型的训练和最终结果的展示。

    实例:数字0-9和字母A-Z识别

    数据集说明:

    该数据集有36个类别标签:数字0-9,字母A-Z; 每个类别对应一个数组,数组的长度为39,也就是说每个类别有39个样本; 数组的元素是一个维度为(20, 16)的数组,数组中的元素为0或者1;

    0、可视化Tensorboard

    打开Anaconda Prompt, 激活环境activate tf2,安装pip install jupyter-tensorboard。

    %%time # 上面的语句可以查看每个单元格执行完用的时间 # 注意上面计时的命令只能在单元格的第一行,并且后面不能有任
    Processed: 0.021, SQL: 9