tensorflow小技巧--tensor切片赋值

技术2022-07-11 109

给tensor进行切片赋值是使用tensorflow开发模型的常用操作，具体方法如下：

#定义一个5*2*3的变量 a=tf.Variable(tf.zeros((5,2,3)),name='myTensor') #对中间维度为1的切片进行赋值 a[:,1,:].assign(tf.constant([[1,2,3],[4,5,6],[7,8,9],[10,11,12],[13,14,15]],dtype=tf.float32)) #赋值后的a <tf.Variable 'myTensor:0' shape=(5, 2, 3) dtype=float32, numpy= array([[[ 0., 0., 0.], [ 1., 2., 3.]], [[ 0., 0., 0.], [ 4., 5., 6.]], [[ 0., 0., 0.], [ 7., 8., 9.]], [[ 0., 0., 0.], [10., 11., 12.]], [[ 0., 0., 0.], [13., 14., 15.]]], dtype=float32)>

关于训练：考虑一个更复杂的赋值例子，a是一个可以训练的变量，我们把a作为切片赋值为变量b，函数f(b)是否也可以对a求导呢？通过实验看一下吧。

#a是可以求导的变量 a=tf.Variable([5.0,4.0],trainable=True,name='a') #b是可以求导的变量 b=tf.Variable(tf.zeros((3,2)),trainable=True,name='b') #将a赋值给b的第一行 b[0,:].assign(a) #fun=b1*b1+...+bn*bn with tf.GradientTape() as tape: fun=tf.reduce_sum(b*b) grad=tape.gradient(fun,b) #求导结果 grad <tf.Tensor: shape=(3, 2), dtype=float32, numpy= array([[10., 8.], [ 0., 0.], [ 0., 0.]], dtype=float32)>

对b求导的结果符合预期，那对a求导呢？

with tf.GradientTape() as tape: fun=tf.reduce_sum(b*b) grad=tape.gradient(fun,a) grad

对a求导结果为空，说明导数不存在。说明切片赋值仅仅是将a的值赋给了b，b中并不包含变量a，fun仅仅是b的函数！

注：tensorflow版本 2.2 每天学习一个小技巧~~

Processed: 0.021, SQL: 9