tf.data提供了快速、灵活、易于使用的数据管道,同时还提供同步的训练,所谓同步训练就是利用CPU处理数据,供给GPU或者TPU(如果有的话)来训练数据。将数据集转变为数据管道的形式,有助于提升训练的效率。下面通过实例Numpy array格式数据集如何构建数据管道,以及数据的预处理、模型的训练和最终结果的展示。
实例:数字0-9和字母A-Z识别
数据集说明:
该数据集有36个类别标签:数字0-9,字母A-Z;
每个类别对应一个数组,数组的长度为39,也就是说每个类别有39个样本;
数组的元素是一个维度为(20, 16)的数组,数组中的元素为0或者1;
0、可视化Tensorboard
打开Anaconda Prompt, 激活环境activate tf2,安装pip install jupyter-tensorboard。
%%time