tensorflow小技巧--binary

技术2022-07-13 118

tf.keras.losses下面有两个长得非常相似的损失函数，binary_crossentropy(官网传送门)与BinaryCrossentropy(官网传送门)。从官网介绍来看，博主也没看出这两个损失函数有什么区别，直到今天才明白过来，不多说，直接上代码：

#set loss func loss=tf.losses.BinaryCrossentropy()

这样声明一个损失函数是没有问题的。

loss=tf.losses.binary_crossentropy() TypeError: binary_crossentropy() missing 2 required positional arguments: 'y_true' and 'y_pred'

报错了，缺少入参。所以说明了binary_crossentropy()是用来计算给定输入y_true和y_pred的loss的，而BinaryCrossentropy()会声明一个类，然后可以使用eager execution计算y_true和y_pred的loss。

另外，二者返回的维度也是不同的：

import tensorflow as tf label=tf.constant([[1,1],[0,0]],dtype=tf.int32) pred=tf.constant([[0.7,0.6],[0.3,0.2]],dtype=tf.float32) loss=tf.losses.BinaryCrossentropy() #输出损失值，维度为1*1 loss(label,pred) <tf.Tensor: shape=(), dtype=float32, numpy=0.36182958> #输出损失值，维度与batch_size的维度相同 tf.losses.binary_crossentropy(label,pred) <tf.Tensor: shape=(2,), dtype=float32, numpy=array([0.4337501, 0.2899091], dtype=float32)>

所以，BinaryCrossentropy()会返回一个最终结果，而binary_crossentropy是计算每个位置的损失值，最后返回一个矩阵，这种处理方式在某些场景下是非常有用的，可以看我的另一篇博文。

Processed: 0.016, SQL: 9