tensorflow小技巧--binary

    技术2022-07-13  95

    tf.keras.losses下面有两个长得非常相似的损失函数,binary_crossentropy(官网传送门)与BinaryCrossentropy(官网传送门)。从官网介绍来看,博主也没看出这两个损失函数有什么区别,直到今天才明白过来,不多说,直接上代码:

    #set loss func loss=tf.losses.BinaryCrossentropy()

    这样声明一个损失函数是没有问题的。

    loss=tf.losses.binary_crossentropy() TypeError: binary_crossentropy() missing 2 required positional arguments: 'y_true' and 'y_pred'

    报错了,缺少入参。所以说明了binary_crossentropy()是用来计算给定输入y_true和y_pred的loss的,而BinaryCrossentropy()会声明一个类,然后可以使用eager execution计算y_true和y_pred的loss。

    另外,二者返回的维度也是不同的:

    import tensorflow as tf label=tf.constant([[1,1],[0,0]],dtype=tf.int32) pred=tf.constant([[0.7,0.6],[0.3,0.2]],dtype=tf.float32) loss=tf.losses.BinaryCrossentropy() #输出损失值,维度为1*1 loss(label,pred) <tf.Tensor: shape=(), dtype=float32, numpy=0.36182958> #输出损失值,维度与batch_size的维度相同 tf.losses.binary_crossentropy(label,pred) <tf.Tensor: shape=(2,), dtype=float32, numpy=array([0.4337501, 0.2899091], dtype=float32)>

    所以,BinaryCrossentropy()会返回一个最终结果,而binary_crossentropy是计算每个位置的损失值,最后返回一个矩阵,这种处理方式在某些场景下是非常有用的,可以看我的另一篇博文。

    Processed: 0.017, SQL: 10