给tensor进行切片赋值是使用tensorflow开发模型的常用操作,具体方法如下:
#定义一个5*2*3的变量 a=tf.Variable(tf.zeros((5,2,3)),name='myTensor') #对中间维度为1的切片进行赋值 a[:,1,:].assign(tf.constant([[1,2,3],[4,5,6],[7,8,9],[10,11,12],[13,14,15]],dtype=tf.float32)) #赋值后的a <tf.Variable 'myTensor:0' shape=(5, 2, 3) dtype=float32, numpy= array([[[ 0., 0., 0.], [ 1., 2., 3.]], [[ 0., 0., 0.], [ 4., 5., 6.]], [[ 0., 0., 0.], [ 7., 8., 9.]], [[ 0., 0., 0.], [10., 11., 12.]], [[ 0., 0., 0.], [13., 14., 15.]]], dtype=float32)>关于训练:考虑一个更复杂的赋值例子,a是一个可以训练的变量,我们把a作为切片赋值为变量b,函数f(b)是否也可以对a求导呢?通过实验看一下吧。
#a是可以求导的变量 a=tf.Variable([5.0,4.0],trainable=True,name='a') #b是可以求导的变量 b=tf.Variable(tf.zeros((3,2)),trainable=True,name='b') #将a赋值给b的第一行 b[0,:].assign(a) #fun=b1*b1+...+bn*bn with tf.GradientTape() as tape: fun=tf.reduce_sum(b*b) grad=tape.gradient(fun,b) #求导结果 grad <tf.Tensor: shape=(3, 2), dtype=float32, numpy= array([[10., 8.], [ 0., 0.], [ 0., 0.]], dtype=float32)>对b求导的结果符合预期,那对a求导呢?
with tf.GradientTape() as tape: fun=tf.reduce_sum(b*b) grad=tape.gradient(fun,a) grad对a求导结果为空,说明导数不存在。说明切片赋值仅仅是将a的值赋给了b,b中并不包含变量a,fun仅仅是b的函数!
注:tensorflow版本 2.2 每天学习一个小技巧~~