AI笔记: 数学基础之偏导数与方向导数

    技术2026-04-07  10

    多元函数偏导数

    在一个多变量的函数中,偏导数就是关于其中一个变量的导数而保持其他变量恒定不变。假定二元函数 z = f ( x , y ) z=f(x,y) z=f(x,y), 点(x_0, y_0)是其定义域内的一个点,将y固定在 y 0 y_0 y0上,而x在 x 0 x_0 x0上增量 △ x \triangle x x,相应的函数z有增量 △ z = f ( x 0 + △ x , y 0 ) − f ( x 0 , y 0 ) \triangle z = f(x_0 + \triangle x, y_0) - f(x_0, y_0) z=f(x0+x,y0)f(x0,y0) △ z \triangle z z △ x \triangle x x的比值当 △ x \triangle x x的值趋近于0的时候,如果极限存在,那么此极限称为函数 z = f ( x , y ) z=f(x,y) z=f(x,y) x 0 , y 0 x_0,y_0 x0,y0处对x的偏导数(partial derivative),记为: f x ′ ( x 0 , y 0 ) f'_x(x_0, y_0) fx(x0,y0)对x的偏导数: ∂ f ∂ x ∣ x = x 0 , y = y 0 \left.\frac{\partial f}{\partial x} \right|_{x=x_0, y=y_0} xfx=x0,y=y0对y的偏导数: ∂ f ∂ y ∣ x = x 0 , y = y 0 \left.\frac{\partial f}{\partial y} \right|_{x=x_0, y=y_0} yfx=x0,y=y0

    三元函数的偏导数

    对于三元函数 u = f ( x , y , z ) u = f(x,y,z) u=f(x,y,z)可类似求偏导数,定义u在点 P 0 ( x 0 , y 0 , z 0 ) P_0(x_0, y_0, z_0) P0(x0,y0,z0)分别对x,y,z的偏导数 f x ′ ( x 0 , y 0 , z 0 ) = lim ⁡ △ x → 0 f ( x 0 + △ x , y 0 , z 0 ) − f ( x 0 , y 0 , z 0 ) △ x f_x'(x_0, y_0, z_0) = \lim_{\triangle x \to 0} \frac{f(x_0 + \triangle x, y_0, z_0) - f(x_0, y_0, z_0)}{\triangle x} fx(x0,y0,z0)=limx0xf(x0+x,y0,z0)f(x0,y0,z0) f y ′ ( x 0 , y 0 , z 0 ) = lim ⁡ △ y → 0 f ( x 0 , y 0 + △ y , z 0 ) − f ( x 0 , y 0 , z 0 ) △ y f_y'(x_0, y_0, z_0) = \lim_{\triangle y \to 0} \frac{f(x_0, y_0 + \triangle y, z_0) - f(x_0, y_0, z_0)}{\triangle y} fy(x0,y0,z0)=limy0yf(x0,y0+y,z0)f(x0,y0,z0) f z ′ ( x 0 , y 0 , z 0 ) = lim ⁡ △ z → 0 f ( x 0 , y 0 , z 0 + △ x ) − f ( x 0 , y 0 , z 0 ) △ z f_z'(x_0, y_0, z_0) = \lim_{\triangle z \to 0} \frac{f(x_0, y_0, z_0 + \triangle x) - f(x_0, y_0, z_0)}{\triangle z} fz(x0,y0,z0)=limz0zf(x0,y0,z0+x)f(x0,y0,z0) 偏导数是多元函数对其中某一个自变量(其余自变量视为常量)的变化率

    案例

    z = x 2 + 3 x y + y 2 z=x^2 + 3xy + y^2 z=x2+3xy+y2在点(1,2)处的偏导数解法1: ∂ z ∂ x = 2 x + 3 y \frac{\partial z}{\partial x} = 2x + 3y xz=2x+3y ∂ z ∂ y = 3 x + 2 y \frac{\partial z}{\partial y} = 3x + 2y yz=3x+2y ∂ z ∂ x ∣ ( 1 , 2 ) = 2 ∗ 1 + 3 ∗ 2 = 8 \left.\frac{\partial z}{\partial x} \right|_{(1,2)} = 2*1 + 3*2 = 8 xz(1,2)=21+32=8 ∂ z ∂ y ∣ ( 1 , 2 ) = 3 ∗ 1 + 2 ∗ 2 = 7 \left.\frac{\partial z}{\partial y} \right|_{(1,2)} = 3*1 + 2*2 = 7 yz(1,2)=31+22=7 解法2: z ∣ y = 2 = x 2 + 6 x + 4 \left. z \right|_{y=2} = x^2 + 6x + 4 zy=2=x2+6x+4 ∂ z ∂ x ∣ ( 1 , 2 ) = ( 2 x + 6 ) ∣ x = 1 = 8 \left. \frac{\partial z}{\partial x} \right|_{(1,2)} = \left. (2x+6) \right|_{x=1} = 8 xz(1,2)=(2x+6)x=1=8 z ∣ x = 1 = 1 + 3 y + y 2 \left. z \right|_{x=1} = 1 + 3y + y^2 zx=1=1+3y+y2 ∂ z ∂ y ∣ ( 1 , 2 ) = ( 3 + 2 y ) ∣ y = 2 = 7 \left. \frac{\partial z}{\partial y} \right|_{(1,2)} = \left. (3+2y) \right|_{y=2} = 7 yz(1,2)=(3+2y)y=2=7

    高阶偏导数

    1 ) 二阶偏导

    函数 z = f ( x , y ) z=f(x,y) z=f(x,y)的二阶偏导数为:有两大类,四小类 纯偏导 ∂ ∂ x ( ∂ z ∂ x ) = ∂ 2 z ∂ x 2 = f x x ′ ′ = f 11 ′ ′ \frac{\partial}{\partial x} (\frac{\partial z}{\partial x}) = \frac{\partial^2 z}{\partial x^2} = f''_{xx} = f''_{11} x(xz)=x22z=fxx=f11 ∂ ∂ y ( ∂ z ∂ y ) = ∂ 2 z ∂ y 2 = f y y ′ ′ = f 22 ′ ′ \frac{\partial}{\partial y} (\frac{\partial z}{\partial y}) = \frac{\partial^2 z}{\partial y^2} = f''_{yy} = f''_{22} y(yz)=y22z=fyy=f22 混合偏导 ∂ ∂ y ( ∂ z ∂ x ) = ∂ 2 z ∂ x ∂ y = f x y ′ ′ = f 12 ′ ′ \frac{\partial}{\partial y} (\frac{\partial z}{\partial x}) = \frac{\partial^2 z}{\partial x \partial y} = f''_{xy} = f''_{12} y(xz)=xy2z=fxy=f12 ∂ ∂ x ( ∂ z ∂ y ) = ∂ 2 z ∂ y ∂ x = f y x ′ ′ = f 21 ′ ′ \frac{\partial}{\partial x} (\frac{\partial z}{\partial y}) = \frac{\partial^2 z}{\partial y \partial x} = f''_{yx} = f''_{21} x(yz)=yx2z=fyx=f21

    2 ) 类似可以定义更高阶的偏导数

    z = f ( x , y ) z=f(x,y) z=f(x,y)关于x的三阶偏导数为: ∂ 3 z ∂ x 3 = ∂ ∂ x ( ∂ 2 z ∂ x 2 ) \frac{\partial^3 z}{\partial x^3} = \frac{\partial}{\partial x} (\frac{\partial^2 z}{\partial x^2}) x33z=x(x22z) z = f ( x , y ) z=f(x,y) z=f(x,y)关于x的n-1阶偏导数,再关于y的一阶偏导数为: ∂ n z ∂ x n − 1 ∂ y = ∂ z ∂ y ( ∂ n − 1 z ∂ x n − 1 ) \frac{\partial^n z}{\partial x^{n-1} \partial y} = \frac{\partial z}{\partial y} (\frac{\partial^{n-1}z}{\partial x^{n-1}}) xn1ynz=yz(xn1n1z)定义:二阶及以上的偏导数统称为高阶偏导数

    方向导数

    1 ) 向量

    向量:是指具有n个相互独立的性质(维度)的对象的表示,向量常使用字母+箭头的形式进行表示,也可以使用几何坐标来表示向量, 比如: a ⃗ = O P ⃗ = x i ⃗ + y j ⃗ + z k ⃗ \vec{a} = \vec{OP} = x\vec{i} + y\vec{j} + z\vec{k} a =OP =xi +yj +zk , 可以用坐标(i,j,k)表示向量a向量的模:向量的大小,也就是向量的长度,向量坐标到原点的距离,常记为: ∣ a ∣ |a| a单位向量:长度为一个单位(即模为1)的向量叫做单位向量 备注:图片托管于github,请确保网络的可访问性

    2 ) 向量的运算

    设两向量为: a ⃗ = ( x 1 , y 1 ) , b ⃗ = ( x 2 , y 2 ) \vec{a} = (x_1,y_1), \vec{b} = (x_2, y_2) a =(x1,y1),b =(x2,y2), 并且a和b之间的夹角为: θ \theta θ数量积:两个向量的数量积(内积、点积)是一个数量/实数,记为: a ⃗ ⋅ b ⃗ \vec{a} · \vec{b} a b a ⃗ ⋅ b ⃗ = ∣ a ⃗ ∣ ∗ ∣ b ⃗ ∣ ∗ c o s θ \vec{a} · \vec{b} = |\vec{a}| * |\vec{b}| * cos \theta a b =a b cosθ 向量积:两个向量的向量积(外积、叉积)是一个向量, 记为: a ⃗ × b ⃗ \vec{a} × \vec{b} a ×b . 向量积即两个不共线的非零向量所在平面的一组法向量 ∣ a ⃗ × b ⃗ ∣ = ∣ a ⃗ ∣ ∗ ∣ b ⃗ ∣ ∗ s i n θ |\vec{a} × \vec{b}| = |\vec{a}| * |\vec{b}| * sin \theta a ×b =a b sinθ乘积的模为两个向量平移后组成的平行四边形的面积法向量方向为两个向量所组成平面的垂线方向 知道两个向量,就可以求出两个向量的夹角 θ \theta θ c o s θ = a ⃗ b ⃗ ∣ a ⃗ ∣ ∣ b ⃗ ∣ = x 1 x 2 + y 1 y 2 x 1 2 + y 1 2 ∗ x 2 2 + y 2 2 cos \theta = \frac{\vec{a} \vec{b}}{|\vec{a}||\vec{b}|} = \frac{x_1x_2 + y_1y_2}{\sqrt{x_1^2 + y_1^2} * \sqrt{x_2^2 + y_2^2}} cosθ=a b a b =x12+y12 x22+y22 x1x2+y1y2

    3 ) 正交向量

    正交向量:如果两个向量的点积为零,那么称这两个向量互为正交向量,在几何意义上来说,正交向量在二维/三维空间上其实就是两个向量相互垂直如果两个或多个向量,它们的点积均为0,那么它们互相称为正交向量

    4 ) 向量的方向角以及方向角的余弦

    设在一个三维坐标轴下有一个向量 a ⃗ = O A ⃗ \vec{a} = \vec{OA} a =OA 与x,y,z轴所成的夹角分为 α , β , γ \alpha, \beta, \gamma α,β,γ, 这些就是方向角 c o s α = x 0 ∣ O A ⃗ ∣ cos \alpha = \frac{x_0}{|\vec{OA}|} cosα=OA x0 ,其中, x 0 x_0 x0 是该向量映射到x轴的长度 c o s β = y 0 ∣ O A ⃗ ∣ cos \beta = \frac{y_0}{|\vec{OA}|} cosβ=OA y0,其中, y 0 y_0 y0 是该向量映射到y轴的长度 c o s γ = z 0 ∣ O A ⃗ ∣ cos \gamma = \frac{z_0}{|\vec{OA}|} cosγ=OA z0,其中, z 0 z_0 z0 是该向量映射到z轴的长度可见, c o s 2 α + c o s 2 β + c o s 2 γ = 1 cos^2 \alpha + cos^2 \beta + cos^2 \gamma = 1 cos2α+cos2β+cos2γ=1

    5 ) 方向导数

    定义:若函数 f ( x , y , z ) f(x,y,z) f(x,y,z)在点 P ( x , y , z ) P(x,y,z) P(x,y,z)处沿方向l(方向角为: α , β , γ \alpha, \beta, \gamma α,β,γ), 其中 ρ = ∣ P P ′ ∣ \rho = |PP'| ρ=PP, 存在下列极限 lim ⁡ ρ → 0 △ f ρ = lim ⁡ ρ → 0 f ( x + △ x , y + △ y , z + △ z ) − f ( x , y , z ) ρ = ∂ f ∂ l \lim_{\rho \to 0} \frac{\triangle f}{\rho} = \lim_{\rho \to 0} \frac{f(x + \triangle x, y + \triangle y, z + \triangle z) - f(x,y,z)}{\rho} = \frac{\partial f}{\partial l} limρ0ρf=limρ0ρf(x+x,y+y,z+z)f(x,y,z)=lf其中, ρ = ( △ x ) 2 + ( △ y ) 2 + ( △ z ) 2 \rho = \sqrt{(\triangle x)^2 + (\triangle y)^2 + (\triangle z)^2} ρ=(x)2+(y)2+(z)2 , △ x = ρ c o s α \triangle x = \rho cos \alpha x=ρcosα, △ y = ρ c o s β \triangle y = \rho cos \beta y=ρcosβ, △ z = ρ c o s γ \triangle z = \rho cos \gamma z=ρcosγ则称 ∂ f ∂ l \frac{\partial f}{\partial l} lf 为函数在点P处沿方向l的方向导数 备注:图片托管于github,请确保网络的可访问性
    Processed: 0.020, SQL: 9