力学 | Lecture 2. 力学系统的作用量与运动方程

Abstract. 拉格朗日力学。

从本章开始,我们均不从牛顿定律出发,而是从最小作用量原理和狭义相对论出发推导分析力学。因此,从此处开始,读者应当直接忘记“力”这个概念,转而接受一切相互作用都是以作用量刻画的。

最小作用量原理

原理 1.1(最小作用量原理). 一个力学系统在给定时刻 $t_1, t_2$ 的位形由广义坐标 $q^{(1)}$ 和 $q^{(2)}$ 描写。该力学系统的作用量 $S$ 为连结这两个位形之间各种可能轨道的泛函:

$$
S := \int_{t_1}^{t_2} L(q, \dot{q}, t)\mathrm{d}t
$$

此处 $L$ 称为系统的拉格朗日量,该系统的真实运动轨道即为使得 $S$ 取极值的轨道。

如果包含非完整约束,只需要引入拉格朗日乘子即可。

依据最小作用量原理,一旦知道了系统的拉格朗日量(即,系统满足何种物理规律),就可以用变分法求出运动轨迹。

将力学系统的真实轨道记作 $q_c(t)$,满足边值条件 $q_c(t_1) = q^{(1)}, q_c(t_2) = q^{(2)}$。考虑对作用量的变分

$$
\delta S := \int_{t_1}^{t_2} L(q_c + \delta q, \dot{q}_c + \delta \dot{q}, t)\mathrm{d}t - \int_{t_1}^{t_2} L(q, \dot{q}, t)\mathrm{d}t
$$

当 $\delta q$ 为无穷小量时,用中值定理算出

$$
\begin{aligned}
\delta S &= \int_{t_1}^{t_2} \left(\frac{\partial L}{\partial q_i}\delta q_i + \frac{\partial L}{\partial \dot{q}_i}\delta \dot{q}_i\right)\mathrm{d}t \\
&= \int_{t_1}^{t_2} \left(\frac{\partial L}{\partial q_i}\delta q_i + {\color{blue} \frac{\mathrm{d}}{\mathrm{d}t}\left(\frac{\partial L}{\partial \dot{q}_i}\delta q_i\right)} - \left(\frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial L}{\partial \dot{q}_i}\right)\delta q_i\right)\mathrm{d}t \\&= \int_{t_1}^{t_2} \left(\frac{\partial L}{\partial q_i} - \left(\frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial L}{\partial \dot{q}_i}\right)\right)\delta q_i\mathrm{d}t
\end{aligned}
$$

注意蓝色的项积分为 $0$,因为边值条件要求 $\delta q(t_1) = \delta q(t_2) = 0$。那么,要让 $S$ 取极值,唯一的可能就是

$$
\frac{\partial L}{\partial q_i} - \left(\frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial L}{\partial \dot{q}_i}\right) \equiv 0
$$

因此,只要知道了系统的拉格朗日量,求解运动方程的工作便无非是求解一个二阶常微分方程的问题。需要注意的是,只要 $S$ 是洛伦兹标量,$q$ 的变换服从洛伦兹变换,欧拉-拉格朗日方程就可以用于推导运动方程,无论是否考虑相对论。

这里的 $\frac{\partial L}{\partial \dot{q}_i}$ 长得像能量对速度求导即动量,称为广义动量,记作 $p_i$;$\frac{\partial L}{\partial q_i}$ 长得像能量的梯度即力,称为广义力。此时力学系统的运动方程可以简记作

$$
\frac{\mathrm{d}p_i}{\mathrm{d}t} = \frac{\partial L}{\partial q_i}
$$

这和牛顿力学中的动量定理形式如出一辙。

当然,容易发现你对拉格朗日量乘常数或者加一个 $\frac{\mathrm{d}}{\mathrm{d}t} f(q, t)$ 都不会影响运动方程。经典(相对于量子情况下),我们可以认为只要运动方程不变,两个拉格朗日量就等价。

相对论性自由粒子的作用量

现在回到狭义相对论的时空观中。此时最小作用量原理变成作用量对一切可能的世界线取极值。

最小作用量作为一条物理规律,我们至少希望它的解在不同参考系之间的变换服从洛伦兹变换。换言之我们要求系统的作用量必须满足以下几条要求:

  1. 作用量应当是一个世界线上的线积分;
  2. 作用量应当是一个洛伦兹标量;
  3. 作用量应当满足时空平移对称性。

因此作用量的定理几乎(似乎可以严格证明,但我暂时没看懂)只能是如下形式

$$
S := \alpha\int \mathrm{d}s
$$

这里 $\mathrm{d}s$ 是 $\sqrt{\mathrm{d}x_\alpha \mathrm{d}x^{\alpha}}$,$\alpha$ 是满足时空平移对称性的洛伦兹标量。一般取作 $-mc$ 以将量纲凑成和能量相同。

现在尝试从中推出粒子的拉格朗日量、广义动量等,空进而得到其运动方程。注意

$$
\begin{aligned}
S &= -mc \int \mathrm{d}s \\
&= -mc^2 \int \frac{1}{\gamma}\mathrm{d}t
\end{aligned}
$$

可知一个相对论性自由粒子的拉格朗日量为

$$
L(v) = -\frac{mc^2}{\gamma}
$$

于是其广义动量为

$$
\boldsymbol{p} = \frac{\partial L}{\partial v} = \gamma m\boldsymbol{v}
$$

完全符合预期(这正是四维动量的表达式)。因此粒子的运动方程为

$$
\frac{\mathrm{d}\boldsymbol{p}}{\mathrm{d}t} = 0 \label{freeparequ}
$$

即匀速直线运动。


最后在此展示如何不依赖于拉格朗日量,直接在四维协变形式做变分。当然,这将得到完全一致的结果。

$$
\begin{aligned}
\delta S &= -mc\int \delta\left(\sqrt{\frac{\mathrm{d}x_\mu}{\mathrm{d}\tau}\frac{\mathrm{d}x^\mu}{\mathrm{d}\tau}}\right)\mathrm{d}\tau \\
&= -mc\int \frac{(\delta u_\mu)u^\mu}{\sqrt{u_\mu u^\mu}}\mathrm{d}\tau & \color{blue}{\text{(Recall $u_\mu\delta u^\mu = u^\mu \delta u_\mu$)}} \\
&= -m\int {u^\mu}\frac{\mathrm{d}}{\mathrm{d}\tau}(\delta x_\mu)\mathrm{d}\tau & \color{blue}{\text{(Recall $\sqrt{u_\mu u^\mu} = c$)}}\\
&= m \int \left(\frac{\mathrm{d}}{\mathrm{d}\tau} u^\mu\right) \delta x_\mu \mathrm{d}\tau & \color{blue}{\text{(Integral by parts)}}
\end{aligned}
$$

这表明 $\mathrm{d}u^\mu / \mathrm{d}\tau = 0$,这无非是方程 $(\ref{freeparequ})$ 的变形。

粒子与外场的相互作用

标量场

先考虑一个粒子处于一个标量场 $\Phi$ 之中。该场对粒子的影响可以由如下作用量刻画:

$$
S = -mc \int e^{\Phi(x)}\mathrm{d}s
$$

直接对其变分导出粒子的运动方程为

$$
\frac{\partial \Phi}{\partial x^\nu}\frac{\mathrm{d}x^\nu}{\mathrm{d}s}\frac{\mathrm{d}x^\mu}{\mathrm{d}s} + \frac{\mathrm{d}^2 x^\mu}{\mathrm{d}s^2} = \frac{\partial \Phi}{\partial x^\mu}
$$

计算细节

$$
\begin{aligned}
\delta S &= -mc \int \delta \left(e^{\Phi(x)}\sqrt{u_\mu u^\mu}\right)\mathrm{d}\tau \\
&= -mc \int \left(c e^{\Phi(x)}\frac{\partial \Phi}{\partial x^\mu} \delta x^\mu + e^{\Phi(x)}u^\mu \frac{\mathrm{d}}{\mathrm{d}\tau} (\delta x_\mu)\right)\mathrm{d}\tau \\
&= -mc \int \left(
c e^{\Phi(x)}\frac{\partial \Phi}{\partial x^\mu}
- \frac 1c u^\mu e^{\Phi(\boldsymbol{x})} \frac{\partial \Phi}{\partial x^\nu} \frac{\mathrm{d}x^\nu}{\mathrm{d}\tau}
- \frac 1c e^{\Phi(x)}\frac{\mathrm{d}u^\mu}{\mathrm{d}\tau}
\right) \delta x^\mu \mathrm{d}\tau
\end{aligned}
$$

括号里面必须是 $0$,我们把 $\mathrm{d}\tau$ 全部整理成 $\mathrm{d}s$ 即可。

当然,很显然,系统的拉格朗日量如下,套上欧拉-拉格朗日方程可以得到完全一样的运动方程。

$$
L = -mc^2e^{\Phi(x, t)} / \gamma
$$

Remark. 其实我没搞清楚四维情况下怎么用欧拉-拉格朗日方程算运动方程。

四矢量场

考虑一个粒子处于一个洛伦兹四矢量场 $A_\mu$ 中。该场对粒子的影响可能会由如下作用量(显然是个洛伦兹标量)刻画。

$$
S = -mc\int\mathrm{d}s - \frac{e}{c}\int A_\mu(x)\mathrm{d}x^\mu
$$

电场对粒子的作用量便是这样的形式。其中四矢量场可分为两个部分 $A^\mu = (\Phi(x), \mathbf{A}(x))$,分别称为标势和矢势。

那么拉格朗日量为

$$
L = -mc^2 / \gamma + \frac{e}{c}\boldsymbol{v}\cdot \boldsymbol{A} - e\Phi
$$

后面没看明白,先摆了。

非相对论极限

后面讨论的基本上都是宏观低速的东西,所以取 $c\rightarrow +\infty$ 时的近似足矣。

Remark. 此处我使用「近似」而非「极限」,在下面的例子中就将看到此用词的准确性所在。

自由粒子

$$
L = -\frac{mc^2}{\gamma} = -mc^2 + \frac{1}{2} mv^2 + o\left(\frac{v}{c}\right)
$$

当 $c$ 为大常数时,只有中间的项有用。因此自由粒子的拉格朗日量为

$$
L = \frac 12 mv^2
$$

很明显解就是匀速直线运动。

标量场

假设 $\Phi(x, t) = V(x, t) / (mc^2)$,常数用途是凑能量量纲。

现在有

$$
\begin{aligned}
L &= -mc^2 e^{\Phi(x, t)} / \gamma \\
&= -mc^2 \left(1 + \frac{V(x, t)}{mc^2} + o(1 / c^2)\right)\left(-mc^2 + \frac{1}{2}\frac{v^2}{c^2} + o(1 / c^2)\right) \\
&\approx \frac 12 mv^2 - V(x, t)
\end{aligned}
$$

类似于动能减势能。对应运动方程(欧拉-拉格朗日方程)为

$$
\frac{\mathrm{d}}{\mathrm{d}t}(m\boldsymbol{v}) = -\nabla_x V
$$

即标量场中的牛顿定律方程。如果这里的 $V$ 和时间无关,则粒子和场构成的系统称为保守系统。此时拉格朗日量永不发生变化,即能量守恒。

矢量场

拉格朗日量的极限显然是

$$
L = \frac 12 m\boldsymbol{v}^2 + \frac{e}{c}\boldsymbol{v}\cdot \boldsymbol{A} - e\Phi(x, t)
$$

此拉格朗日量对应的方程是非相对论性粒子在洛伦兹力作用下的牛顿方程。

对称性与守恒律

在上一节中,我们看到了保守系统中的能量守恒。本质上,这就是:如果 $L$ 对 $t$ 的导数恒为 $0$,则能量守恒。这个结论似乎可以自然地推广到其他情形:如果 $L$ 对某个参数导数为 $0$,则必然有一个与之对应的守恒量。归纳为如下定理:

定理(Noether,1918). 一个由广义坐标 $\boldsymbol{q} = (q_1, …, q_f)$ 和拉格朗日量 $L$ 刻画的经典力学系统。令 $q$ 是一族由 $\xi$ 参数化的坐标变换

$$
q_i \mapsto \tilde{q}_i(\boldsymbol{q}, \xi), \qquad \tilde{q}_i(\boldsymbol{q}, 0) = q_i
$$

若在此变换下,拉格朗日量不变,则称 $\tilde{q}_i$ 为系统的一个对称性。若一个与系统状态有关的量不随时间变化,则称其为一个守恒量。

对于系统的每个对称性,都有一个守恒量与之对应。

证明. 对称性表明

$$
\frac{\partial L}{\partial \xi} = 0
$$

使用链式法则和欧拉-拉格朗日方程直接计算

$$
\begin{aligned}
\frac{\partial L}{\partial \xi}
&= \frac{\partial L}{\partial q}\frac{\partial \tilde{q}}{\partial \xi} + \frac{\partial L}{\partial \dot{q}}\frac{\partial \dot{\tilde{q}}}{\partial \xi} \\
&= \left(\frac{\mathrm{d}}{\mathrm{d}t}\frac{\partial L}{\partial \dot{q}}\right)\frac{\partial \tilde{q}}{\partial \xi} + \frac{\partial L}{\partial\dot{q}}\left(\frac{\mathrm{d}}{\mathrm{d}t}\frac{\partial \tilde{q}}{\partial \xi}\right) \\
&= \frac{\mathrm{d}}{\mathrm{d}t}\left(\frac{\partial L}{\partial \dot{q}}\frac{\partial \tilde{q}}{\partial \xi}\right)
\end{aligned}
$$

因此

$$
Q := \frac{\partial L}{\partial \dot{q}}\frac{\partial \tilde{q}}{\partial \xi}
$$

不随时间变化。这个 $Q$ 称为诺特守恒荷。$\blacksquare$

最后容易验证以下几个对称性对应的守恒量正是我们所熟悉的:

  • 时间平移对称性. 能量守恒。
  • 空间平移对称性. 动量守恒。
  • 空间旋转对称性. 角动量守恒。

后两者都是 Noether 定理的直接推论,前者含时间,可能形式上不太一样,但本质上思路一样,这里推一下

$$
\begin{aligned}
\frac{\mathrm{d} L}{\mathrm{d} t} &= \frac{\partial L}{\partial x_i} \dot{x}_i + \frac{\partial L}{\partial \dot{x}_i}\ddot{x}_i \\
&= \frac{\mathrm{d}}{\mathrm{d}t} (\boldsymbol{p}\cdot \dot{\boldsymbol{x}})
\end{aligned}
$$

因此下面的量守恒

$$
E := \boldsymbol{p}\cdot \boldsymbol{v} - L
$$

可以验证,对于经典的拉格朗日量 $L = \frac 12 m\boldsymbol{v}^2 - V$,推出的 $E$ 正好就是我们熟悉的动能加势能。

Remark. 需要注意的是,反过来,守恒量不一定对应一个对称性。守恒量还可能源自势能的特殊形式。统一起见,这类特殊形式称为“动力学对称性”。一个著名的代表就是拉普拉斯-龙格-楞次矢量,下一章会对其进行详细的阐述。

非惯性系

最后简单讨论一下非惯性系中的拉格朗日量和相应的运动方程。在宏观低速情况下,这无非是做一个坐标变换然后计算。考虑在惯性系 $K_0$ 中质点的拉格朗日量为

$$
L_0 = \frac{1}{2} m\boldsymbol{v}_0^2 - V
$$

现在有另一个参考系 $K’$ 相对于 $K_0$ 以速度 $\boldsymbol{V}$(关于时间的函数)平动,则有

$$
\boldsymbol{v}_0 = \boldsymbol{v}’ + \boldsymbol{V}
$$

代入得到 $K’$ 中系统的拉格朗日量为

$$
L’ = \frac 12 m \boldsymbol{v}’^2 + \frac 12 m \boldsymbol{V}^2 + m\boldsymbol{v}’\boldsymbol{V} - V
$$

Remark. 这里你可以注意 $\boldsymbol{V}$ 和 $\boldsymbol{V}\boldsymbol{x}’$ 都是只和时间、坐标有关的函数,因此在拉格朗日量上加其对时间求导丝毫不影响运动方程。据此,你也可以将拉格朗日量整理成
$$
L’ = \frac 12 m \boldsymbol{v}’^2 - m\frac{\mathrm{d}\boldsymbol{V}}{\mathrm{d}t}\cdot \boldsymbol{x}’ - V
$$

运动方程为

$$
\frac{\mathrm{d}\boldsymbol{p}}{\mathrm{d}t} = - m\frac{\mathrm{d}\boldsymbol{V}}{\mathrm{d}t} -\nabla_x V
$$

现在加上转动。假设 $K$ 和 $K’$ 中心重合,但是以角速度 $\boldsymbol{\Omega}$ 转动。则有

$$
\boldsymbol{v}’ = \boldsymbol{v} + \boldsymbol{\Omega}\times \boldsymbol{x}
$$

整理拉格朗日量(注意省略一切只和 $\boldsymbol{x}, t$ 有关的时间导数)

$$
L = \frac 12 m\boldsymbol{v}^2 + \frac 12 m (\boldsymbol{\Omega}\times \boldsymbol{x})^2 + m \boldsymbol{v}\cdot (\boldsymbol{\Omega}\times \boldsymbol{x}) - m\dot{\boldsymbol{V}}\cdot \boldsymbol{x} - V
$$

经过一些颇为琐碎的矢量分析得到运动方程为

$$
\frac{\mathrm{d}\boldsymbol{p}}{\mathrm{d}t} = -\nabla_x V - m\dot{\boldsymbol{V}} + m\boldsymbol{x}\times \dot{\boldsymbol{\Omega}} + m\boldsymbol{\Omega}\times (\boldsymbol{x}\times \boldsymbol{\Omega}) + 2m\boldsymbol{v}\times \boldsymbol{\Omega}
$$

右侧除了场的作用力之外,依次是平动惯性力,转动惯性力,惯性离心力,科里奥利力。