Problem 8.1

schwarzChapter 8

习题 8.1

来源: 第8章, PDF第138页

8.1 Show that having a probability interpretation, with $0 \le P \le 1$ , requires us to have only positive (or only negative) norm states.

习题 8.1 - 解答

在量子力学与量子场论中，系统的状态由希尔伯特空间（或具有不定度规的内积空间）中的矢量描述。为了使理论具有自洽的概率诠释，测量结果的概率 $P$ 必须满足 $0 \le P \le 1$ ，且所有可能结果的概率之和必须为 1。

根据量子力学的广义概率假设，在状态 $|\psi\rangle$ 中测量得到状态 $|i\rangle$ 的概率 $P_i$ 定义为： $P_i = \frac{|\langle i | \psi \rangle|^2}{\langle i | i \rangle \langle \psi | \psi \rangle}$ 这个定义确保了总概率守恒，即 $\sum_i P_i = 1$ 。对于上述叠加态 $|\psi\rangle$ ，我们可以分别计算测量得到 $|1\rangle$ 和 $|2\rangle$ 的概率： $P_1 = \frac{|\langle 1 | \psi \rangle|^2}{\langle 1 | 1 \rangle \langle \psi | \psi \rangle} = \frac{|\alpha|^2}{1 \cdot (|\alpha|^2 - |\beta|^2)} = \frac{|\alpha|^2}{|\alpha|^2 - |\beta|^2}$ $P_2 = \frac{|\langle 2 | \psi \rangle|^2}{\langle 2 | 2 \rangle \langle \psi | \psi \rangle} = \frac{|\beta|^2}{(-1) \cdot (|\alpha|^2 - |\beta|^2)} = \frac{-|\beta|^2}{|\alpha|^2 - |\beta|^2}$

为了使概率诠释成立，必须对任意的 $\alpha$ 和 $\beta$ 都有 $0 \le P_1 \le 1$ 且 $0 \le P_2 \le 1$ 。我们来分析不同取值下的情况：

当 $|\alpha| > |\beta| > 0$ 时：此时态矢量的总模方 $\langle \psi | \psi \rangle > 0$ 。计算得到 $P_2 = \frac{-|\beta|^2}{|\alpha|^2 - |\beta|^2} < 0$ 。这给出了一个负概率，违反了 $P \ge 0$ 的要求。同时 $P_1 > 1$ ，也违反了 $P \le 1$ 的要求。
当 $0 < |\alpha| < |\beta|$ 时：此时态矢量的总模方 $\langle \psi | \psi \rangle < 0$ 。计算得到 $P_1 = \frac{|\alpha|^2}{|\alpha|^2 - |\beta|^2} < 0$ 。同样给出了负概率，违反了 $P \ge 0$ 的要求。
当 $|\alpha| = |\beta| \neq 0$ 时：此时态矢量的总模方 $\langle \psi | \psi \rangle = 0$ （零模态）。概率 $P_1$ 和 $P_2$ 的分母为零，概率发散且无定义，无法给出合理的物理诠释。

上述分析表明，只要状态空间中混合存在正模态和负模态，就必然可以通过线性叠加构造出导致负概率（或大于1的概率）的物理态，从而彻底破坏 $0 \le P \le 1$ 的概率诠释。

反之，如果状态空间仅包含单一符号的模态：

若仅有正模态（即所有基矢 $\langle n | n \rangle > 0$ ）：对于任意态 $|\psi\rangle = \sum_n c_n |n\rangle$ ，其概率为 $P_n = \frac{|c_n|^2}{\sum_m |c_m|^2}$ 。显然对所有 $n$ 都有 $0 \le P_n \le 1$ 。
若仅有负模态（即所有基矢 $\langle n | n \rangle < 0$ ）：对于任意态 $|\psi\rangle = \sum_n c_n |n\rangle$ ，其概率为 $P_n = \frac{-|c_n|^2}{-\sum_m |c_m|^2} = \frac{|c_n|^2}{\sum_m |c_m|^2}$ 。负号在分子分母中完全抵消，同样对所有 $n$ 都有 $0 \le P_n \le 1$ 。

因此，为了保证量子理论中概率诠释的自洽性，状态空间不能同时混合正模态和负模态。

\boxed{\text{To maintain } 0 \le P \le 1 \text{ for all superpositions, the state space must consist exclusively of positive (or exclusively negative) norm states.}}

8.2

Problem 8.2

schwarzChapter 8

习题 8.2

来源: 第8章, PDF第138页

8.2 Calculate the energy-momentum tensor corresponding to the Lagrangian $\mathcal{L} = -\frac{1}{4} F_{\mu\nu}^2$ . Show that the energy density is positive definite, up to a total spatial divergence $\mathcal{E} - \partial_i X_i > 0$ for some $X_i$ .

习题 8.2 - 解答

习题分析

本题要求计算自由电磁场的正则能动张量（Canonical Energy-Momentum Tensor），并证明其能量密度 $\mathcal{E} = T^{00}$ 在扣除一个空间全散度项后是正定的。

在推导过程中，我们采用自然单位制 $c=\hbar=1$ 以及平直时空度规 $\eta_{\mu\nu} = \text{diag}(1, -1, -1, -1)$ 。电磁场张量定义为 $F_{\mu\nu} = \partial_\mu A_\nu - \partial_\nu A_\mu$ 。

第一步：计算正则能动张量

根据诺特定理，对应于时空平移对称性的正则能动张量定义为： $T^{\mu}_{\phantom{\mu}\nu} = \frac{\partial \mathcal{L}}{\partial (\partial_\mu A_\rho)} \partial_\nu A_\rho - \delta^\mu_\nu \mathcal{L}$

已知拉格朗日密度为 $\mathcal{L} = -\frac{1}{4} F_{\alpha\beta} F^{\alpha\beta}$ 。首先计算拉格朗日密度对场导数的偏导： $\frac{\partial \mathcal{L}}{\partial (\partial_\mu A_\rho)} = -\frac{1}{4} \frac{\partial}{\partial (\partial_\mu A_\rho)} \left( F_{\alpha\beta} F^{\alpha\beta} \right)$ 由于 $F_{\alpha\beta} = \partial_\alpha A_\beta - \partial_\beta A_\alpha$ ，利用链式法则和指标的反对称性，可得： $\frac{\partial \mathcal{L}}{\partial (\partial_\mu A_\rho)} = -F^{\mu\rho}$

将其代入能动张量的定义式，并将指标 $\nu$ 升上去，得到正则能动张量的表达式： $T^{\mu\nu} = -F^{\mu\rho} \partial^\nu A_\rho + \eta^{\mu\nu} \mathcal{L}$ $\boxed{ T^{\mu\nu} = -F^{\mu\rho} \partial^\nu A_\rho - \frac{1}{4} \eta^{\mu\nu} F_{\alpha\beta} F^{\alpha\beta} }$

第二步：计算能量密度 $\mathcal{E}$

能量密度对应于能动张量的 $00$ 分量，即 $\mathcal{E} = T^{00}$ ： $\mathcal{E} = T^{00} = -F^{0\rho} \partial^0 A_\rho - \frac{1}{4} \eta^{00} F_{\alpha\beta} F^{\alpha\beta}$

为了将其与物理可观测的电场 $\mathbf{E}$ 和磁场 $\mathbf{B}$ 联系起来，我们引入以下关系：

电场分量： $E^i = F^{i0} = -F^{0i}$ 。
规范势与电场的关系： $E^i = -\partial^0 A^i - \partial^i A^0 = -\partial_0 A^i + \partial_i A^0$ （注意空间指标升降会引入负号， $\partial^i = -\partial_i$ ）。
洛伦兹不变量： $F_{\alpha\beta} F^{\alpha\beta} = 2(\mathbf{B}^2 - \mathbf{E}^2)$ 。
$\eta^{00} = 1$ 。

首先处理第一项 $-F^{0\rho} \partial^0 A_\rho$ 。由于 $F^{00}=0$ ，求和只包含空间分量 $\rho = i$ ： $-F^{0i} \partial^0 A_i = -(-E^i) \partial_0 (-A^i) = -E^i \partial_0 A^i$ 利用电场的定义 $\partial_0 A^i = -E^i - \partial^i A^0 = -E^i + \partial_i A^0$ ，代入上式： $-F^{0i} \partial^0 A_i = -E^i (-E^i + \partial_i A^0) = \mathbf{E}^2 - E^i \partial_i A^0$

接着处理第二项： $-\frac{1}{4} \eta^{00} F_{\alpha\beta} F^{\alpha\beta} = -\frac{1}{4} (1) \times 2(\mathbf{B}^2 - \mathbf{E}^2) = \frac{1}{2} \mathbf{E}^2 - \frac{1}{2} \mathbf{B}^2$

将两项相加，得到能量密度： $\mathcal{E} = \left( \mathbf{E}^2 - E^i \partial_i A^0 \right) + \left( \frac{1}{2} \mathbf{E}^2 - \frac{1}{2} \mathbf{B}^2 \right)$ $\mathcal{E} = \frac{1}{2} (\mathbf{E}^2 + \mathbf{B}^2) + \mathbf{E}^2 - E^i \partial_i A^0 - \frac{1}{2} \mathbf{E}^2 - \frac{1}{2} \mathbf{B}^2$ （修正代数合并过程）： $\mathcal{E} = \mathbf{E}^2 - E^i \partial_i A^0 - \frac{1}{2} \mathbf{E}^2 + \frac{1}{2} \mathbf{B}^2 = \frac{1}{2} (\mathbf{E}^2 + \mathbf{B}^2) - E^i \partial_i A^0$ (注：若采用 $\partial^i A^0$ 形式，则为 $+ E^i \partial_i A^0$ ，此处统一使用下指标空间导数 $\partial_i = \frac{\partial}{\partial x^i}$ ，则 $E^i = -\partial_0 A^i - \partial_i A^0$ ，故 $\partial_0 A^i = -E^i - \partial_i A^0$ 。代入得 $-E^i(-E^i - \partial_i A^0) = \mathbf{E}^2 + E^i \partial_i A^0$ 。)

重新严格计算第一项： $-F^{0i} \partial^0 A_i = -(-E^i) \partial_0 (-A^i) = E^i (-\partial_0 A^i) = E^i (E^i + \partial_i A^0) = \mathbf{E}^2 + E^i \partial_i A^0$ 因此，正确的能量密度表达式为： $\mathcal{E} = \mathbf{E}^2 + E^i \partial_i A^0 - \frac{1}{2} \mathbf{E}^2 + \frac{1}{2} \mathbf{B}^2 = \frac{1}{2} (\mathbf{E}^2 + \mathbf{B}^2) + E^i \partial_i A^0$

第三步：证明正定性与分离空间全散度

对上述结果中的 $E^i \partial_i A^0$ 项使用乘积法则（分部积分的微分形式）： $E^i \partial_i A^0 = \partial_i (E^i A^0) - A^0 (\partial_i E^i)$

根据自由电磁场的欧拉-拉格朗日方程（即无源麦克斯韦方程组）： $\partial_\mu F^{\mu\nu} = 0$ 取 $\nu = 0$ ，得到高斯定律： $\partial_i F^{i0} = \partial_i E^i = \nabla \cdot \mathbf{E} = 0$

因此，散度项化简为： $E^i \partial_i A^0 = \partial_i (E^i A^0)$

将此结果代回能量密度的表达式中： $\mathcal{E} = \frac{1}{2} (\mathbf{E}^2 + \mathbf{B}^2) + \partial_i (E^i A^0)$

令 $X_i = E^i A^0$ （此处 $X_i$ 代表矢量 $\mathbf{X}$ 的第 $i$ 个分量），将其移项可得： $\mathcal{E} - \partial_i X_i = \frac{1}{2} (\mathbf{E}^2 + \mathbf{B}^2)$

因为电场平方 $\mathbf{E}^2$ 和磁场平方 $\mathbf{B}^2$ 均为实数的平方和，必然大于等于零，且在场不恒为零时严格大于零。因此： $\boxed{ \mathcal{E} - \partial_i X_i = \frac{1}{2} (\mathbf{E}^2 + \mathbf{B}^2) \ge 0 }$ 这就证明了在扣除一个空间全散度项 $\partial_i X_i$ （其中 $X_i = E^i A^0$ ）之后，自由电磁场的能量密度是正定的。

8.3

Problem 8.3

schwarzChapter 8

习题 8.3

来源: 第8章, PDF第138页

8.3 Calculate the classical propagator for a massive spin-1 particle by inverting the equations of motion to the form $A_\mu = \Pi_{\mu\nu} J_\nu$ .

习题 8.3 - 解答

物理背景与分析

对于带有质量 $m$ 的自旋-1 粒子（例如 $W^\pm$ 或 $Z^0$ 玻色子），其经典场由 Proca 拉格朗日量描述。与无质量的光子不同，质量项 $\frac{1}{2}m^2 A_\mu A^\mu$ 显式地破坏了规范不变性。这一物理特性的直接数学推论是：无质量电磁场的运动方程算符是奇异的（不可逆），必须引入规范固定项（Gauge-fixing term）才能求解传播子；而有质量的 Proca 场的运动方程算符是非奇异的，可以直接求逆得到传播子。

推导过程

带有外部源 $J_\mu$ 的有质量自旋-1 场 $A_\mu$ 的拉格朗日密度为： $\mathcal{L} = -\frac{1}{4} F_{\mu\nu} F^{\mu\nu} + \frac{1}{2} m^2 A_\mu A^\mu - J_\mu A^\mu$ 其中电磁张量定义为 $F_{\mu\nu} = \partial_\mu A_\nu - \partial_\nu A_\mu$ 。

通过欧拉-拉格朗日方程 $\partial_\mu \left( \frac{\partial \mathcal{L}}{\partial (\partial_\mu A_\nu)} \right) - \frac{\partial \mathcal{L}}{\partial A_\nu} = 0$ ，我们可以得到该场的经典运动方程（Proca 方程）： $\partial_\mu F^{\mu\nu} + m^2 A^\nu = J^\nu$

将 $F^{\mu\nu}$ 的定义代入并展开： $\partial_\mu (\partial^\mu A^\nu - \partial^\nu A^\mu) + m^2 A^\nu = J^\nu$ $\square A^\nu - \partial^\nu (\partial_\mu A^\mu) + m^2 A^\nu = J^\nu$

为了将方程写成算符作用在场上的形式，我们引入度规张量 $\eta^{\mu\nu}$ （采用 $(+,-,-,-)$ 符号约定），将上式改写为： $\left[ (\square + m^2) \eta^{\mu\nu} - \partial^\mu \partial^\nu \right] A_\nu = J^\mu$

为了求逆，我们将方程通过傅里叶变换转换到动量空间。在动量空间中，导数算符被替换为动量： $\partial^\mu \to -ik^\mu$ ，达朗贝尔算符 $\square \to -k^2$ 。于是动量空间的运动方程变为： $\left[ (-k^2 + m^2) \eta^{\mu\nu} - (-ik^\mu)(-ik^\nu) \right] \tilde{A}_\nu(k) = \tilde{J}^\mu(k)$ $\underbrace{\left[ (-k^2 + m^2) \eta^{\mu\nu} + k^\mu k^\nu \right]}_{O^{\mu\nu}(k)} \tilde{A}_\nu(k) = \tilde{J}^\mu(k)$

题目要求将方程求逆至 $A_\mu = \Pi_{\mu\nu} J^\nu$ 的形式（注意指标的升降），因此我们需要找到动量空间中的逆算符 $\tilde{\Pi}_{\nu\rho}(k)$ ，使其满足： $O^{\mu\nu}(k) \tilde{\Pi}_{\nu\rho}(k) = \delta^\mu_\rho$

由于 $\tilde{\Pi}_{\nu\rho}(k)$ 必须由动量空间中仅有的二阶张量结构 $\eta_{\nu\rho}$ 和 $k_\nu k_\rho$ 构成，我们假设其具有以下最一般的形式： $\tilde{\Pi}_{\nu\rho}(k) = A \eta_{\nu\rho} + B k_\nu k_\rho$ 其中 $A$ 和 $B$ 是待定的标量函数。将其代入求逆方程： $\left[ (-k^2 + m^2) \eta^{\mu\nu} + k^\mu k^\nu \right] \left( A \eta_{\nu\rho} + B k_\nu k_\rho \right) = \delta^\mu_\rho$

展开左侧的乘积： $A(-k^2 + m^2) \delta^\mu_\rho + B(-k^2 + m^2) k^\mu k_\rho + A k^\mu k_\rho + B k^2 k^\mu k_\rho = \delta^\mu_\rho$ 合并同类项，整理得到： $A(-k^2 + m^2) \delta^\mu_\rho + \left[ B(-k^2 + m^2) + A + B k^2 \right] k^\mu k_\rho = \delta^\mu_\rho$ $A(-k^2 + m^2) \delta^\mu_\rho + \left( B m^2 + A \right) k^\mu k_\rho = \delta^\mu_\rho$

为了使等式对任意动量 $k$ 恒成立，张量结构 $\delta^\mu_\rho$ 和 $k^\mu k_\rho$ 的系数必须分别匹配：

对于 $\delta^\mu_\rho$ 的系数： $A(-k^2 + m^2) = 1 \implies A = \frac{-1}{k^2 - m^2}$
对于 $k^\mu k_\rho$ 的系数： $B m^2 + A = 0 \implies B = -\frac{A}{m^2} = \frac{1}{m^2(k^2 - m^2)}$

将求得的 $A$ 和 $B$ 代回假设的传播子形式中： $\tilde{\Pi}_{\mu\nu}(k) = \frac{-1}{k^2 - m^2} \eta_{\mu\nu} + \frac{1}{m^2(k^2 - m^2)} k_\mu k_\nu$ 提取公因子后，即可得到动量空间中的经典传播子。在量子场论中，为了处理极点 $k^2 = m^2$ 处的奇异性并满足因果律（Feynman 边界条件），通常会在分母中引入一个无穷小的虚数项 $+i\epsilon$ 。

最终结果

有质量自旋-1 粒子的动量空间经典传播子为： $\boxed{ \tilde{\Pi}_{\mu\nu}(k) = \frac{-\eta_{\mu\nu} + \frac{k_\mu k_\nu}{m^2}}{k^2 - m^2} }$

8.4

Problem 8.4

schwarzChapter 8

习题 8.4

来源: 第8章, PDF第138页

8.4 Calculate the propagator for a photon in axial gauge, where $A_0 = 0$ .

习题 8.4 - 解答

为了计算光子在轴规范（Axial gauge，此处特指 $A_0 = 0$ 的时间规范）下的传播子，我们需要从包含规范固定项的电磁场拉格朗日密度出发，在动量空间中提取逆传播子，并通过张量求逆得到传播子的具体表达式。

1. 物理背景与拉格朗日密度

自由光子的标准拉格朗日密度为： $\mathcal{L} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu}$ 由于规范对称性的存在，算符在动量空间中是不可逆的。为了固定规范 $A_0 = 0$ ，我们引入一个常矢量 $n^\mu = (1, 0, 0, 0)$ ，使得规范条件可以写为协变形式 $n^\mu A_\mu = 0$ 。

我们在拉格朗日密度中加入规范固定项（采用参数 $\xi$ ）： $\mathcal{L}_{gf} = -\frac{1}{2\xi}(n^\mu A_\mu)^2$ 严格的 $n^\mu A_\mu = 0$ 规范对应于极限 $\xi \to 0$ 。

总作用量在动量空间中可以写为： $S = \int d^4x (\mathcal{L} + \mathcal{L}_{gf}) = \frac{1}{2} \int \frac{d^4k}{(2\pi)^4} A_\mu(-k) \left[ k^2 g^{\mu\nu} - k^\mu k^\nu + \frac{1}{\xi} n^\mu n^\nu \right] A_\nu(k)$ （注：此处采用大多数量子场论教材的标准度规约定 $\eta_{\mu\nu} = \text{diag}(1, -1, -1, -1)$ ，因此 $n^2 = n^\mu n_\mu = 1$ ）。

2. 提取逆传播子并构造拟设

由作用量可知，动量空间中的逆传播子（乘上 $i$ ）为： $\Gamma^{\mu\nu}(k) = i(D^{-1})^{\mu\nu}(k) = -k^2 g^{\mu\nu} + k^\mu k^\nu - \frac{1}{\xi} n^\mu n^\nu$ 我们需要寻找传播子 $D_{\rho\nu}(k)$ ，使其满足： $\Gamma^{\mu\rho} D_{\rho\nu} = \delta^\mu_\nu$

由于体系中只有度规张量 $g_{\mu\nu}$ 以及动量 $k_\mu$ 和规范矢量 $n_\mu$ ，传播子必须由这些张量结构线性组合而成。我们构造最一般的对称张量拟设（Ansatz）： $D_{\rho\nu} = A g_{\rho\nu} + B k_\rho k_\nu + C n_\rho n_\nu + E (k_\rho n_\nu + n_\rho k_\nu)$ 其中 $A, B, C, E$ 是待定的标量系数（它们是 $k^2, n^2, n\cdot k$ 的函数）。

3. 张量代数与系数求解

将 $\Gamma^{\mu\rho}$ 和 $D_{\rho\nu}$ 代入求逆方程： $\left( -k^2 g^{\mu\rho} + k^\mu k^\rho - \frac{1}{\xi} n^\mu n^\rho \right) \Big[ A g_{\rho\nu} + B k_\rho k_\nu + C n_\rho n_\nu + E (k_\rho n_\nu + n_\rho k_\nu) \Big] = \delta^\mu_\nu$

展开并合并同类张量项：

\begin{aligned} \delta^\mu_\nu &: -A k^2 \\ k^\mu k_\nu &: -B k^2 + A + B k^2 + E(n\cdot k) \\ k^\mu n_\nu &: -E k^2 + C(n\cdot k) + E k^2 \\ n^\mu k_\nu &: -E k^2 - \frac{1}{\xi} B(n\cdot k) - \frac{1}{\xi} E n^2 \\ n^\mu n_\nu &: -C k^2 - \frac{1}{\xi} A - \frac{1}{\xi} C n^2 - \frac{1}{\xi} E(n\cdot k) \end{aligned}

令上述各项分别等于等式右侧 $\delta^\mu_\nu$ 的对应系数，我们得到以下方程组：

$-A k^2 = 1 \implies A = -\frac{1}{k^2}$
$A + E(n\cdot k) = 0 \implies E = -\frac{A}{n\cdot k} = \frac{1}{k^2 (n\cdot k)}$
$C(n\cdot k) = 0 \implies C = 0$
$-E k^2 - \frac{1}{\xi} B(n\cdot k) - \frac{1}{\xi} E n^2 = 0 \implies B(n\cdot k) = -E(\xi k^2 + n^2) \implies B = -\frac{\xi k^2 + n^2}{k^2 (n\cdot k)^2}$
$-\frac{1}{\xi} [A + E(n\cdot k)] - C(k^2 + \frac{n^2}{\xi}) = 0$ （由于 $C=0$ 且 $A+E(n\cdot k)=0$ ，此方程自然满足，验证了拟设的自洽性）。

将求得的系数代回拟设中，得到任意 $\xi$ 下的传播子： $D_{\mu\nu}(k) = \frac{-1}{k^2} \left[ g_{\mu\nu} - \frac{k_\mu n_\nu + n_\mu k_\nu}{n\cdot k} + \frac{n^2 + \xi k^2}{(n\cdot k)^2} k_\mu k_\nu \right]$

4. 严格规范极限与最终结果

题目要求的是严格的 $A_0 = 0$ 规范，这对应于取极限 $\xi \to 0$ 。此时传播子简化为： $D_{\mu\nu}(k) = \frac{-1}{k^2} \left[ g_{\mu\nu} - \frac{k_\mu n_\nu + n_\mu k_\nu}{n\cdot k} + \frac{n^2}{(n\cdot k)^2} k_\mu k_\nu \right]$

代入具体的规范矢量 $n^\mu = (1, 0, 0, 0)$ 。在此条件下：

$n^2 = 1$
$n \cdot k = k_0$
$n_\mu = \delta_{\mu 0}$

为了得到费曼传播子（Feynman propagator），我们需要在分母的 $k^2$ 处引入 $+i\epsilon$ 极点处方（注：对于 $(n\cdot k)$ 产生的额外极点，在实际圈图计算中通常需要引入 Mandelstam-Leibbrandt 处方或主值处方，但就代数形式而言，直接写出 $k_0$ 即可）。

将 $n^\mu$ 的分量形式代入，得到最终的传播子表达式：

\boxed{ D_{\mu\nu}(k) = \frac{-i}{k^2 + i\epsilon} \left[ g_{\mu\nu} - \frac{k_\mu \delta_{\nu 0} + \delta_{\mu 0} k_\nu}{k_0} + \frac{k_\mu k_\nu}{k_0^2} \right] }

(注：若不显式写出 $\delta_{\mu 0}$ ，保留 $n^\mu$ 形式的等价答案为 $D_{\mu\nu}(k) = \frac{-i}{k^2 + i\epsilon} \left[ g_{\mu\nu} - \frac{k_\mu n_\nu + n_\mu k_\nu}{n\cdot k} + \frac{k_\mu k_\nu}{(n\cdot k)^2} \right]$ )

8.5

Problem 8.5

schwarzChapter 8

习题 8.5

来源: 第8章, PDF第138页

8.5 Vector polarization sums. In this problem you can build some intuition for the way in which the numerator of a spin-1 particle propagator represents an outer product of physical polarizations $|\epsilon\rangle \langle\epsilon|$ . Calculate the $4 \times 4$ matrix outer product $|\epsilon\rangle \langle\epsilon| \equiv \sum_j \epsilon_\mu^j \epsilon_\nu^j$ by the following:

(a) Sum over the physical polarizations for a massive spin-1 particle in some frame. Re-express your answer in a Lorentz-covariant way, in terms of $m$ , $k_\mu k_\nu$ and $g_{\mu\nu}$ .

(b) Show that the numerator of the massive vector propagator (Problem 8.3) is the same as the polarization sum. Why should this be true?

(c) Sum over the two physical polarizations for a massless vector. A helpful basis for these polarizations comes from choosing them orthogonal to both momentum, $\epsilon^i \cdot p = 0$ and an arbitrary reference vector $r^\mu$ : $\epsilon^i \cdot r = 0$ . Find explicit forms for the two polarizations, do the sum, and then express your answer in a Lorentz-covariant way (i.e. in terms of $p^\mu$ and $r^\mu$ ).

(d) Write down a Lagrangian so that the photon propagator derived from it has the numerator you found in part (c).

(e) Compare the numerator from part (c) to the numerator of the photon propagator in the $R_\xi$ gauges. What might be an advantage of using the numerator from (c) rather than Feynman gauge? What might be a disadvantage?

习题 8.5 - 解答

(a) 对于质量为 $m$ 的自旋-1 粒子，最方便的参考系是其静止系。在静止系中，粒子的四维动量为 $k^\mu = (m, 0, 0, 0)$ 。物理极化矢量 $\epsilon^\mu$ 必须满足横向条件 $k \cdot \epsilon = 0$ 。在静止系中，这意味着 $\epsilon^0 = 0$ 。因此，存在三个独立的物理极化状态，可以选取为沿空间坐标轴的单位矢量： $\epsilon^1 = (0, 1, 0, 0), \quad \epsilon^2 = (0, 0, 1, 0), \quad \epsilon^3 = (0, 0, 0, 1)$ 计算极化求和矩阵 $\Pi^{\mu\nu} = \sum_{j=1}^3 \epsilon_j^\mu \epsilon_j^{\nu *}$ （这里极化矢量为实数，复共轭可省略）。对于时间分量，由于 $\epsilon_j^0 = 0$ ，有 $\Pi^{00} = \Pi^{0i} = \Pi^{i0} = 0$ 。对于空间分量， $\Pi^{il} = \sum_{j=1}^3 \epsilon_j^i \epsilon_j^l = \delta^{il}$ 。采用度规约定 $g^{\mu\nu} = \text{diag}(1, -1, -1, -1)$ ，空间部分的克罗内克函数可以写为 $\delta^{il} = -g^{il}$ 。因此在静止系中，极化求和可以写为： $\sum_{j=1}^3 \epsilon_j^\mu \epsilon_j^\nu = -g^{\mu\nu} + \delta^{\mu 0}\delta^{\nu 0}$ 为了将其写成洛伦兹协变的形式，我们需要用四维动量 $k^\mu$ 来表示 $\delta^{\mu 0}\delta^{\nu 0}$ 。在静止系中， $k^\mu k^\nu / m^2 = \delta^{\mu 0}\delta^{\nu 0}$ 。将其代入上式，得到协变的极化求和公式： $\boxed{ \sum_{j=1}^3 \epsilon_j^\mu \epsilon_j^\nu = -g^{\mu\nu} + \frac{k^\mu k^\nu}{m^2} }$

(b) 大质量矢量场的 Proca 拉格朗日量为 $\mathcal{L} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu} + \frac{1}{2}m^2 A_\mu A^\mu$ 。在动量空间中，二次项对应的波动算符为 $\mathcal{O}^{\mu\nu} = -g^{\mu\nu}(k^2 - m^2) + k^\mu k^\nu$ 。传播子是该算符的逆，满足 $\mathcal{O}^{\mu\alpha} D_{\alpha\nu} = \delta^\mu_\nu$ 。求逆得到大质量矢量传播子： $D^{\mu\nu}(k) = \frac{-g^{\mu\nu} + k^\mu k^\nu / m^2}{k^2 - m^2 + i\epsilon}$ 其分子正是 (a) 中求得的极化求和 $\sum_j \epsilon_j^\mu \epsilon_j^\nu$ 。

原因分析：传播子在物理极点 $k^2 = m^2$ 处的留数代表了物理态的传播。根据量子场论中的 LSZ 约化公式或插入完备态集 $\sum_j |j\rangle \langle j|$ 的方法，传播子的分子必须对应于所有在壳（on-shell）物理自由度的外积之和。因为大质量自旋-1 粒子只有三个物理极化态，所以传播子的分子必然等于这三个物理极化矢量的求和。

(c) 对于无质量矢量粒子（光子），动量满足 $p^2 = 0$ 。选取动量沿 $z$ 轴方向： $p^\mu = (E, 0, 0, E)$ 。引入任意参考矢量 $r^\mu$ ，为方便起见，选取一个与 $p^\mu$ 线性无关的类光矢量 $r^\mu = (E, 0, 0, -E)$ （此时 $r^2=0$ 且 $p \cdot r = 2E^2 \neq 0$ ）。物理极化矢量需满足 $\epsilon \cdot p = 0$ 且 $\epsilon \cdot r = 0$ 。由 $\epsilon \cdot p = \epsilon^0 E - \epsilon^3 E = 0 \implies \epsilon^0 = \epsilon^3$ 。由 $\epsilon \cdot r = \epsilon^0 E + \epsilon^3 E = 0 \implies \epsilon^0 = -\epsilon^3$ 。因此 $\epsilon^0 = \epsilon^3 = 0$ 。两个物理极化矢量完全位于横向平面内，其显式形式为： $\epsilon_1^\mu = (0, 1, 0, 0), \quad \epsilon_2^\mu = (0, 0, 1, 0)$ 计算极化求和 $\Pi^{\mu\nu} = \epsilon_1^\mu \epsilon_1^\nu + \epsilon_2^\mu \epsilon_2^\nu$ 。非零分量仅有 $\Pi^{11} = 1$ 和 $\Pi^{22} = 1$ 。为了将其写成协变形式，我们构造由 $g^{\mu\nu}, p^\mu, r^\mu$ 组成的张量： $\Pi^{\mu\nu} = -g^{\mu\nu} + A p^\mu p^\nu + B (p^\mu r^\nu + p^\nu r^\mu) + C r^\mu r^\nu$ 利用正交条件 $p_\mu \Pi^{\mu\nu} = 0$ 和 $r_\mu \Pi^{\mu\nu} = 0$ 来确定系数：

$p_\mu \Pi^{\mu\nu} = -p^\nu + B(p \cdot r)p^\nu + C(p \cdot r)r^\nu = 0$ （利用了 $p^2=0$ ）。这要求 $C = 0$ 且 $B = \frac{1}{p \cdot r}$ 。
$r_\mu \Pi^{\mu\nu} = -r^\nu + A(p \cdot r)p^\nu + B(r^2 p^\nu + (p \cdot r)r^\nu) = 0$ 。代入 $B = \frac{1}{p \cdot r}$ ，得到 $-r^\nu + A(p \cdot r)p^\nu + \frac{r^2}{p \cdot r}p^\nu + r^\nu = 0 \implies A = -\frac{r^2}{(p \cdot r)^2}$ 。因此，协变的极化求和公式为： $\boxed{ \sum_{j=1}^2 \epsilon_j^\mu \epsilon_j^\nu = -g^{\mu\nu} + \frac{p^\mu r^\nu + p^\nu r^\mu}{p \cdot r} - \frac{r^2}{(p \cdot r)^2} p^\mu p^\nu }$

(d) 为了得到分子如 (c) 所示的光子传播子，我们需要在拉格朗日量中引入轴规范（Axial gauge）或光锥规范（Light-cone gauge）的规范固定项。规范条件为 $r \cdot A = 0$ 。对应的拉格朗日量为： $\boxed{ \mathcal{L} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu} - \frac{1}{2\xi} (r \cdot A)^2 }$ 在严格取 $\xi \to 0$ 的极限下，该拉格朗日量导出的传播子分子精确等于 (c) 中的极化求和。

(e) $R_\xi$ 规范下的光子传播子分子为： $-g^{\mu\nu} + (1-\xi)\frac{p^\mu p^\nu}{p^2}$ 。 (c) 中的传播子分子为： $-g^{\mu\nu} + \frac{p^\mu r^\nu + p^\nu r^\mu}{p \cdot r} - \frac{r^2}{(p \cdot r)^2} p^\mu p^\nu$ 。

优势 (Advantage)：使用 (c) 中的分子（即轴规范/物理规范）的最大优势是传播子仅包含物理的横向自由度。这意味着在计算圈图或散射截面时，不需要引入 Faddeev-Popov 鬼场（Ghosts）来抵消非物理的纵向和时间极化态。鬼场在此规范下完全退耦，Ward 恒等式在没有鬼场参与的情况下自动满足，物理图像更加清晰。

劣势 (Disadvantage)：

破坏显式洛伦兹不变性：传播子中显式依赖于任意参考矢量 $r^\mu$ ，使得中间计算过程失去了显式的洛伦兹协变性（尽管最终的物理可观测量与 $r^\mu$ 无关）。
圈图计算极其困难：传播子中存在额外的非物理极点（即 $p \cdot r = 0$ 处），这使得在进行圈积分时，标准的费曼参数化方法和留数定理的应用变得非常复杂，极大地增加了高阶微扰计算的数学难度。

8.6

Problem 8.6

schwarzChapter 8

习题 8.6

来源: 第8章, PDF第139页

8.6 Tensor polarization sums. A spin-2 particle can be embedded in a 2-index tensor $h_{\mu\nu}$ . Therefore, its polarizations are tensors too, $\epsilon_{\mu\nu}^i$ . These should be orthonormal, $\epsilon_{\mu\nu}^i \epsilon_{\mu\nu}^{*j} = \delta^{ij}$ , where the sum is over $\mu$ and $\nu$ contracted with the Minkowski metric. (a) The polarizations should be transverse, $k_\mu \epsilon_{\mu\nu}^i = 0$ , and symmetric, $\epsilon_{\mu\nu}^i = \epsilon_{\nu\mu}^i$ . How many degrees of freedom do these conditions remove? (b) For a massive spin-2 particle, choose a frame in which the momentum $k_\mu$ is simple. How many orthonormal $\epsilon_{\mu\nu}^i$ can you find? Write your basis out explicitly, as $4 \times 4$ matrices. (c) Guess which of these correspond to spin 0, spin 1 or spin 2. What kind of Lorentz-invariant condition can you impose so that you just get the spin-2 polarizations? (d) If you use the same conditions but take $k_\mu$ to be the momentum of a massless tensor, what are the polarizations? Do you get the right number? (e) What would you embed a massive spin-3 field in? What conditions could you impose to get the right number of degrees of freedom?

习题 8.6 - 解答

(a) 极化张量的对称性与横截性条件移除的自由度

一个一般的二阶张量 $\epsilon_{\mu\nu}$ 在四维时空中具有 $4 \times 4 = 16$ 个独立分量（自由度）。

对称性条件： $\epsilon_{\mu\nu}^i = \epsilon_{\nu\mu}^i$ 。对称张量的独立分量数为 $\frac{4 \times (4+1)}{2} = 10$ 。因此，对称性条件移除了反对称部分的自由度，共计 $16 - 10 = 6$ 个自由度。
横截性条件： $k^\mu \epsilon_{\mu\nu}^i = 0$ 。由于 $\epsilon_{\mu\nu}$ 已经是对称的，该条件给出了 4 个独立的线性约束方程（对应 $\nu = 0, 1, 2, 3$ ）。这进一步移除了 4 个自由度。

综上所述，这两个条件总共移除了 $6 + 4 = 10$ 个自由度，剩余 $16 - 10 = 6$ 个自由度。

$\boxed{\text{对称性移除 6 个自由度，横截性移除 4 个自由度，共移除 10 个自由度}}$

(b) 质量非零的自旋-2粒子的正交归一基底

对于有质量的粒子（ $k^2 = m^2 > 0$ ），我们可以选择其静止参考系，此时动量为简单形式： $k^\mu = (m, 0, 0, 0)$

代入横截性条件 $k^\mu \epsilon_{\mu\nu}^i = m \epsilon_{0\nu}^i = 0$ ，由于 $m \neq 0$ ，必然有 $\epsilon_{0\nu}^i = \epsilon_{\mu 0}^i = 0$ 。这意味着极化张量只有纯空间分量 $\epsilon_{ab}^i$ （ $a,b = 1,2,3$ ）非零。纯空间对称张量具有 $\frac{3 \times 4}{2} = 6$ 个独立分量。因此，我们可以找到 6 个正交归一的极化张量。

根据正交归一条件 $\epsilon_{\mu\nu}^i \epsilon^{*j\mu\nu} = \delta^{ij}$ ，在静止系中退化为空间分量的内积 $\sum_{a,b=1}^3 \epsilon_{ab}^i \epsilon_{ab}^{*j} = \delta^{ij}$ 。为了方便后续区分自旋态，我们将这 6 个基底分为无迹部分（5个）和纯迹部分（1个），写成 $4 \times 4$ 矩阵形式如下：

对角无迹基底（2个）： $\epsilon^1 = \frac{1}{\sqrt{2}} \begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix}, \quad \epsilon^2 = \frac{1}{\sqrt{6}} \begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & -2 \end{pmatrix}$

非对角无迹基底（3个）： $\epsilon^3 = \frac{1}{\sqrt{2}} \begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix}, \quad \epsilon^4 = \frac{1}{\sqrt{2}} \begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \end{pmatrix}, \quad \epsilon^5 = \frac{1}{\sqrt{2}} \begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 1 & 0 \end{pmatrix}$

纯迹基底（1个）： $\epsilon^6 = \frac{1}{\sqrt{3}} \begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix}$

$\boxed{\text{可以找到 6 个正交归一的极化张量}}$

(c) 自旋态的对应与洛伦兹不变量条件

在三维空间旋转群 $SO(3)$ 下，一个二阶对称空间张量（6个自由度）可以分解为一个无迹对称张量（5个自由度）和一个标量迹（1个自由度）。

自旋 2：对应于上述基底中的 $\epsilon^1, \epsilon^2, \epsilon^3, \epsilon^4, \epsilon^5$ （无迹对称部分，共 $2s+1 = 5$ 个状态）。
自旋 0：对应于上述基底中的 $\epsilon^6$ （纯迹部分，共 1 个状态）。
自旋 1：不存在（因为自旋 1 对应于反对称张量，而极化张量已被限制为对称的）。

为了仅保留自旋-2 的极化态，我们需要消除自旋-0 的纯迹部分。对应的洛伦兹不变量条件是无迹条件（Traceless condition）： $\boxed{\epsilon^\mu_{\;\;\mu} = \eta^{\mu\nu}\epsilon_{\mu\nu} = 0}$ 施加此条件后，自由度从 6 减少到 5，恰好对应有质量自旋-2 粒子的物理自由度。

(d) 无质量张量场的极化

对于无质量张量（ $k^2 = 0$ ），选择动量方向沿 $z$ 轴： $k^\mu = (E, 0, 0, E)$ 。施加对称性（10个自由度）、横截性 $k^\mu \epsilon_{\mu\nu} = 0$ （移除4个）和无迹性 $\epsilon^\mu_{\;\;\mu} = 0$ （移除1个）后，剩余 $10 - 4 - 1 = 5$ 个自由度。

由横截性 $E(\epsilon_{0\nu} - \epsilon_{3\nu}) = 0 \implies \epsilon_{0\nu} = \epsilon_{3\nu}$ ，可得： $\epsilon_{00} = \epsilon_{03} = \epsilon_{30} = \epsilon_{33}$ ，且 $\epsilon_{01} = \epsilon_{31}$ ， $\epsilon_{02} = \epsilon_{32}$ 。由无迹性 $-\epsilon_{00} + \epsilon_{11} + \epsilon_{22} + \epsilon_{33} = 0 \implies \epsilon_{11} + \epsilon_{22} = 0$ 。

这 5 个独立的极化状态可参数化为：

$\epsilon_{11} = -\epsilon_{22}$ （横向无迹，1个自由度）
$\epsilon_{12} = \epsilon_{21}$ （横向无迹，1个自由度）
$\epsilon_{01} = \epsilon_{31}$ （纵向/时间混合，1个自由度）
$\epsilon_{02} = \epsilon_{32}$ （纵向/时间混合，1个自由度）
$\epsilon_{00} = \epsilon_{33} = \epsilon_{03}$ （纯纵向/时间，1个自由度）

是否得到了正确的自由度数量？ 没有。 无质量自旋-2 粒子（如引力子）应该只有 2 个物理自由度（螺旋度 $\pm 2$ ），但这里我们得到了 5 个。 原因分析：对于无质量场，存在规范对称性 $\delta h_{\mu\nu} = \partial_\mu \xi_\nu + \partial_\nu \xi_\mu$ 。在动量空间中，极化张量存在等价类 $\epsilon_{\mu\nu} \sim \epsilon_{\mu\nu} + k_\mu \xi_\nu + k_\nu \xi_\mu$ 。为了保持横截性和无迹性，规范参数 $\xi_\mu$ 必须满足 $k \cdot \xi = 0$ 。这提供了 3 个独立的规范自由度，可以用来消除上述 5 个状态中的 3 个非物理状态（即包含下标 0 和 3 的分量）。最终只剩下 2 个物理的横向无迹（TT）极化态： $\boxed{\text{得到 5 个极化态。数量不正确（应为 2 个），多出的 3 个自由度需通过规范不变性消除}}$

(e) 有质量自旋-3 场的嵌入与条件

为了描述有质量的自旋-3 场，我们需要将其嵌入到一个完全对称的三阶张量 $h_{\mu\nu\rho}$ 中。在四维时空中，完全对称的三阶张量具有 $\binom{4+3-1}{3} = 20$ 个独立分量。一个有质量的自旋-3 粒子应该具有 $2s + 1 = 2(3) + 1 = 7$ 个物理自由度。

为了从 20 个自由度中提取出正确的 7 个自由度，我们需要施加以下洛伦兹不变量条件：

横截性条件： $k^\mu \epsilon_{\mu\nu\rho} = 0$ 。由于 $\epsilon_{\mu\nu\rho}$ 是完全对称的，该条件构成了一个对称的二阶张量约束，包含 10 个独立方程。这移除了 10 个自由度，剩余 $20 - 10 = 10$ 个自由度。（在静止系中，这等价于所有包含时间分量 0 的项均为零，只剩下纯空间的对称三阶张量 $\epsilon_{ijk}$ ，其独立分量数为 $\binom{3+3-1}{3} = 10$ ）。
无迹条件： $\eta^{\mu\nu} \epsilon_{\mu\nu\rho} = 0$ 。这是一个矢量约束，包含 4 个方程。但在静止系且已满足横截性的前提下，时间分量自动为零，该条件退化为纯空间迹 $\delta^{ij}\epsilon_{ij\rho} = 0$ ，即 3 个独立的约束方程。这进一步移除了 3 个自由度。

最终剩余自由度为 $10 - 3 = 7$ ，恰好对应有质量自旋-3 粒子的物理自由度。

$\boxed{\text{嵌入到完全对称的三阶张量 } h_{\mu\nu\rho} \text{ 中。需施加横截性 } k^\mu \epsilon_{\mu\nu\rho} = 0 \text{ 和无迹性 } \eta^{\mu\nu} \epsilon_{\mu\nu\rho} = 0 \text{ 条件}}$

8.7

Problem 8.7

schwarzChapter 8

习题 8.7

来源: 第8章, PDF第139页

8.7 Using the method of Section 8.7.2 construct the set of cubic interactions of a massless spin-2 field embedded in $h_{\mu\nu}$ . There are many terms, all with two derivatives, but their coefficients are precisely fixed. You can also check that this is the same thing you get from expanding $M_{\text{Pl}}^2 \sqrt{\eta_{\mu\nu} + \frac{1}{M_{\text{Pl}}} h_{\mu\nu}} R \left[ \eta_{\mu\nu} + \frac{1}{M_{\text{Pl}}} h_{\mu\nu} \right]$ to cubic order in $h_{\mu\nu}$ . It should be clear that the same method will produce the terms fourth order in $h_{\mu\nu}$ , however, these are suppressed by $\frac{1}{M_{\text{Pl}}^2}$ . Most tests of general relativity probe only that it is described by a minimally coupled spin-2 field (e.g. bending of light, gravitational waves, frame dragging). Some precision tests assay the cubic interactions (e.g. the perihelion shift of Mercury). No experiment has yet tested the quartic interactions.

习题 8.7 - 解答

物理分析与解题思路

题目要求构造无质量自旋-2场 $h_{\mu\nu}$ 的三次相互作用项 $\mathcal{L}^{(3)}$ 。根据第8.7.2节的 Noether 过程（规范自举法），自由的无质量自旋-2场由 Fierz-Pauli 作用量描述，具有线性化的规范对称性 $\delta^{(0)} h_{\mu\nu} = \partial_\mu \xi_\nu + \partial_\nu \xi_\mu$ 。为了引入相互作用，必须在作用量中添加高阶项 $\mathcal{L}^{(3)} \sim h (\partial h)^2$ ，同时对规范变换进行形变 $\delta^{(1)} h_{\mu\nu} \sim h \partial \xi$ 。要求总作用量在 $\mathcal{O}(h)$ 阶保持规范不变，即 $\delta^{(0)} \mathcal{L}^{(3)} + \delta^{(1)} \mathcal{L}^{(2)} = 0$ （相差一个全导数），这会唯一地固定所有三次项的系数。

广义相对论正是这一自举过程的唯一非线性完备化理论。因此，正如题目所述，直接将 Einstein-Hilbert 作用量 $S = \int d^4x \frac{M_{\text{Pl}}^2}{2} \sqrt{-g} R$ 在平直时空背景 $g_{\mu\nu} = \eta_{\mu\nu} + \frac{1}{M_{\text{Pl}}} h_{\mu\nu}$ 下展开至 $h_{\mu\nu}$ 的三次阶，是获得这些精确系数最严谨且高效的方法。

推导过程

为了方便计算，定义微扰展开参数 $\kappa = \frac{1}{M_{\text{Pl}}}$ ，度规及其逆度规展开为： $g_{\mu\nu} = \eta_{\mu\nu} + \kappa h_{\mu\nu}$ $g^{\mu\nu} = \eta^{\mu\nu} - \kappa h^{\mu\nu} + \kappa^2 h^{\mu\rho} h_\rho^\nu + \mathcal{O}(\kappa^3)$ 度规行列式的平方根展开为： $\sqrt{-g} = 1 + \frac{1}{2}\kappa h + \frac{1}{8}\kappa^2 h^2 - \frac{1}{4}\kappa^2 h_{\mu\nu}h^{\mu\nu} + \mathcal{O}(\kappa^3)$ 其中 $h = \eta^{\mu\nu} h_{\mu\nu}$ 。

在忽略全导数项（边界项）的前提下，Einstein-Hilbert 作用量可以写为仅包含一阶导数的 $\Gamma\Gamma$ 形式： $\mathcal{L}_{\text{EH}} = \frac{1}{2\kappa^2} \sqrt{-g} g^{\mu\nu} \left( \Gamma^\rho_{\rho\lambda}\Gamma^\lambda_{\mu\nu} - \Gamma^\rho_{\nu\lambda}\Gamma^\lambda_{\mu\rho} \right)$

接下来展开 Christoffel 符号 $\Gamma^\lambda_{\mu\nu} = \frac{1}{2} g^{\lambda\sigma} (\partial_\mu g_{\sigma\nu} + \partial_\nu g_{\sigma\mu} - \partial_\sigma g_{\mu\nu})$ 。定义线性化的 Christoffel 符号为： $\gamma^\lambda_{\mu\nu} = \frac{1}{2} \eta^{\lambda\sigma} (\partial_\mu h_{\sigma\nu} + \partial_\nu h_{\sigma\mu} - \partial_\sigma h_{\mu\nu})$ 则完整的 Christoffel 符号展开至 $\mathcal{O}(\kappa^2)$ 为： $\Gamma^\lambda_{\mu\nu} = \kappa \gamma^\lambda_{\mu\nu} - \kappa^2 h^{\lambda\sigma} \gamma_{\sigma\mu\nu} + \mathcal{O}(\kappa^3)$

将上述展开代入作用量中的缩并项 $K_{\mu\nu} \equiv \Gamma^\rho_{\rho\lambda}\Gamma^\lambda_{\mu\nu} - \Gamma^\rho_{\nu\lambda}\Gamma^\lambda_{\mu\rho}$ ，可得： $K_{\mu\nu} = \kappa^2 K^{(2)}_{\mu\nu} + \kappa^3 K^{(3)}_{\mu\nu} + \mathcal{O}(\kappa^4)$ 其中： $K^{(2)}_{\mu\nu} = \gamma^\rho_{\rho\lambda}\gamma^\lambda_{\mu\nu} - \gamma^\rho_{\nu\lambda}\gamma^\lambda_{\mu\rho}$ $K^{(3)}_{\mu\nu} = - h^{\rho\sigma} \gamma_{\sigma\rho\lambda} \gamma^\lambda_{\mu\nu} - \gamma^\rho_{\rho\lambda} h^{\lambda\sigma} \gamma_{\sigma\mu\nu} + h^{\rho\sigma} \gamma_{\sigma\nu\lambda} \gamma^\lambda_{\mu\rho} + \gamma^\rho_{\nu\lambda} h^{\lambda\sigma} \gamma_{\sigma\mu\rho}$

现在提取总拉格朗日量 $\mathcal{L}_{\text{EH}} = \frac{1}{2\kappa^2} \left(1 + \frac{\kappa}{2} h\right) \left(\eta^{\mu\nu} - \kappa h^{\mu\nu}\right) \left(\kappa^2 K^{(2)}_{\mu\nu} + \kappa^3 K^{(3)}_{\mu\nu}\right)$ 中 $\mathcal{O}(\kappa)$ 的部分，即为三次相互作用项： $\mathcal{L}^{(3)} = \frac{\kappa}{2} \left[ \frac{1}{2} h \eta^{\mu\nu} K^{(2)}_{\mu\nu} - h^{\mu\nu} K^{(2)}_{\mu\nu} + \eta^{\mu\nu} K^{(3)}_{\mu\nu} \right]$

我们对 $\eta^{\mu\nu} K^{(3)}_{\mu\nu}$ 进行化简。利用对称性 $\gamma_{\sigma\mu\nu} = \gamma_{\sigma\nu\mu}$ 以及哑指标的替换，可以发现 $K^{(3)}_{\mu\nu}$ 缩并后的四项两两相同： $\eta^{\mu\nu} K^{(3)}_{\mu\nu} = - 2 h^{\rho\sigma} \gamma_{\sigma\rho\lambda} \gamma^{\lambda\mu}_{\;\;\;\;\mu} + 2 h^{\rho\sigma} \gamma_{\sigma\nu\lambda} \gamma^{\lambda\nu}_{\;\;\;\;\rho}$

将所有部分组合起来，并代回 $\kappa = \frac{1}{M_{\text{Pl}}}$ ，我们得到了结构紧凑且系数精确固定的三次相互作用拉格朗日量。

最终结果

无质量自旋-2场的三次相互作用项（即广义相对论在弱场近似下的领头阶非线性项）可以精确地写为如下形式：

$\boxed{ \mathcal{L}^{(3)} = \frac{1}{2M_{\text{Pl}}} \left[ \left( \frac{1}{2} h \eta^{\mu\nu} - h^{\mu\nu} \right) \left( \gamma^\rho_{\rho\lambda}\gamma^\lambda_{\mu\nu} - \gamma^\rho_{\nu\lambda}\gamma^\lambda_{\mu\rho} \right) - 2 h^{\rho\sigma} \gamma_{\sigma\rho\lambda} \gamma^{\lambda\mu}_{\;\;\;\;\mu} + 2 h^{\rho\sigma} \gamma_{\sigma\nu\lambda} \gamma^{\lambda\nu}_{\;\;\;\;\rho} \right] }$

注：其中 $\gamma^\lambda_{\mu\nu} = \frac{1}{2}(\partial_\mu h^\lambda_\nu + \partial_\nu h^\lambda_\mu - \partial^\lambda h_{\mu\nu})$ 为线性化的 Christoffel 符号。若将其完全展开为 $h \partial h \partial h$ 的形式，将产生十余项具有两阶导数的复杂组合（如 $h^{\mu\nu}\partial_\mu h^{\rho\sigma}\partial_\nu h_{\rho\sigma}$ 等），但上述 $\gamma\gamma$ 形式不仅完全等价，且最清晰地展现了规范自举所要求的几何结构。

8.8

Problem 8.8

schwarzChapter 8

习题 8.8

来源: 第8章, PDF第139页

8.8 Construct the free kinetic Lagrangian for a massive spin-3 particle by embedding it in a tensor $Z_{\mu\nu\alpha}$ .

习题 8.8 - 解答

为了构造一个质量为 $m$ 的自旋-3 粒子的自由拉格朗日量，并将其嵌入到一个全对称的三阶张量 $Z_{\mu\nu\alpha}$ 中，我们需要确保运动方程能够正确给出该粒子所需的自由度。

先分析物理背景与约束条件： 在 4 维时空中，一个全对称的三阶张量 $Z_{\mu\nu\alpha}$ 具有 20 个独立分量。然而，一个质量为 $m$ 的自旋 $s=3$ 的粒子只有 $2s + 1 = 7$ 个物理自由度。因此，拉格朗日量导出的运动方程必须自然地包含 $20 - 7 = 13$ 个约束条件。这些约束条件为：

无迹性 (Tracelessness)： $Z^\mu_{\phantom{\mu}\mu\alpha} = 0$ （4个约束）
横向性 (Transversality)： $\partial^\mu Z_{\mu\nu\alpha} = 0$ （10个约束，其中1个与无迹性的散度重合，故独立约束为 13 个）

此外，物理分量必须满足克莱因-戈尔登方程 (Klein-Gordon equation)： $(\square + m^2)Z_{\mu\nu\alpha} = 0$ 。

分两步处理拉格朗日量的构造：

第一步：构造无质量的动能项 (Fronsdal 拉格朗日量) 在无质量极限下 ( $m \to 0$ )，理论必须具有规范对称性以消除非物理的纵向极化模式。对于自旋-3 场，规范变换形式为： $\delta Z_{\mu\nu\alpha} = \partial_{(\mu} \Lambda_{\nu\alpha)} = \partial_\mu \Lambda_{\nu\alpha} + \partial_\nu \Lambda_{\mu\alpha} + \partial_\alpha \Lambda_{\mu\nu}$ 其中规范参数 $\Lambda_{\nu\alpha}$ 是一个对称且无迹的二阶张量（即 $\Lambda^\mu_{\phantom{\mu}\mu} = 0$ ）。

我们写出包含所有可能的二次导数项的最广义洛伦兹不变拉格朗日量： $\mathcal{L}_{kin} = c_1 \partial_\lambda Z_{\mu\nu\alpha} \partial^\lambda Z^{\mu\nu\alpha} + c_2 \partial_\mu Z^{\mu\nu\alpha} \partial^\lambda Z_{\lambda\nu\alpha} + c_3 \partial^\mu Z_{\mu\nu\alpha} \partial^\nu Z^\alpha + c_4 \partial_\lambda Z_\mu \partial^\lambda Z^\mu + c_5 \partial_\mu Z^\mu \partial_\nu Z^\nu$ 这里定义 $Z_\mu \equiv Z^\lambda_{\phantom{\lambda}\lambda\mu}$ 为张量场的迹。

假设度规符号为 $(+---)$ ，为了保证物理空间分量（如 $Z_{ijk}$ ）具有正的动能，最高阶导数项的系数必须取为 $c_1 = -\frac{1}{2}$ 。要求作用量 $S = \int d^4x \mathcal{L}_{kin}$ 在上述规范变换下不变（相差一个全导数），可以唯一确定剩余的系数。这对应于自旋 $s=3$ 的 Fronsdal 系数： $c_2 = \frac{3}{2}, \quad c_3 = -3, \quad c_4 = \frac{3}{2}, \quad c_5 = \frac{3}{4}$

第二步：构造质量项 (Fierz-Pauli 质量项) 为了赋予粒子质量 $m$ 同时不引入病态的 Boulware-Deser 鬼场（Ghost），质量项不能随意添加，必须采用推广的 Fierz-Pauli 质量项结构。对于任意自旋 $s$ 的全对称张量，唯一无鬼场的质量项组合为： $\mathcal{L}_{mass} = -\frac{1}{2} m^2 \left( \phi_{\mu_1\dots\mu_s} \phi^{\mu_1\dots\mu_s} - s \phi^\prime_{\mu_3\dots\mu_s} \phi^{\prime \mu_3\dots\mu_s} \right)$ 将 $s=3$ 代入，并用迹 $Z_\mu$ 表示，我们得到自旋-3 的质量项： $\mathcal{L}_{mass} = -\frac{1}{2} m^2 \left( Z_{\mu\nu\alpha} Z^{\mu\nu\alpha} - 3 Z_\mu Z^\mu \right)$

最终结果： 将动能项与质量项相加，我们得到嵌入在全对称张量 $Z_{\mu\nu\alpha}$ 中的大质量自旋-3 粒子的完整自由拉格朗日量：

\boxed{ \begin{aligned} \mathcal{L} = &-\frac{1}{2} \partial_\lambda Z_{\mu\nu\alpha} \partial^\lambda Z^{\mu\nu\alpha} + \frac{3}{2} \partial_\mu Z^{\mu\nu\alpha} \partial^\lambda Z_{\lambda\nu\alpha} - 3 \partial^\mu Z_{\mu\nu\alpha} \partial^\nu Z^\alpha \\ &+ \frac{3}{2} \partial_\lambda Z_\mu \partial^\lambda Z^\mu + \frac{3}{4} \partial_\mu Z^\mu \partial_\nu Z^\nu - \frac{1}{2} m^2 \left( Z_{\mu\nu\alpha} Z^{\mu\nu\alpha} - 3 Z_\mu Z^\mu \right) \end{aligned} }

(注：式中 $Z_\mu \equiv Z^\lambda_{\phantom{\lambda}\lambda\mu}$ 代表张量 $Z_{\mu\nu\alpha}$ 的迹。)

8.9

Problem 8.9

schwarzChapter 8

习题 8.9

来源: 第8章, PDF第139页

8.9 Show that it is impossible to write down a Lorentz-invariant Lagrangian for a single scalar field with 4-derivative kinetic terms (e.g. $\mathcal{L} = -\phi \square^2 \phi$ ) that generates a non-negative energy density.

习题 8.9 - 解答

为了证明包含四阶导数项的单标量场理论无法产生非负的能量密度，我们需要利用奥斯特罗格拉德斯基定理 (Ostrogradsky's Theorem)。该定理指出，任何包含高于一阶时间导数的非退化拉格朗日量，其对应的哈密顿量（即能量）在相空间中必然是无下界的。

1. 物理背景与拉格朗日量的等效形式

考虑一个具有四阶导数动能项的洛伦兹不变拉格朗日量。题目中给出的例子是 $\mathcal{L} = -\frac{1}{2}\phi \square^2 \phi$ （这里引入 $\frac{1}{2}$ 以符合标准动能项约定，不影响物理结论）。为了便于进行正则哈密顿分析，我们可以通过分部积分（忽略无穷远处的边界项）将其改写为等效的形式：

S = \int d^4x \left( -\frac{1}{2}\phi \square^2 \phi \right) = \int d^4x \left( \frac{1}{2} (\square \phi)^2 \right)

为了保持一般性，我们考虑包含该四阶导数项以及任意低阶导数项（如标准动能项和势能项）的最广义拉格朗日量密度：

\mathcal{L} = \frac{1}{2} (\square \phi)^2 + \mathcal{L}_{\text{lower}}(\phi, \partial_\mu \phi)

展开达朗贝尔算符 $\square = \partial_t^2 - \nabla^2$ ，拉格朗日量显式包含标量场的二阶时间导数 $\ddot{\phi}$ ：

\mathcal{L} = \frac{1}{2} (\ddot{\phi} - \nabla^2 \phi)^2 + \mathcal{L}_{\text{lower}}(\phi, \dot{\phi}, \nabla \phi)

由于 $\frac{\partial^2 \mathcal{L}}{\partial \ddot{\phi}^2} = 1 \neq 0$ ，这是一个非退化的高阶导数理论。

2. 奥斯特罗格拉德斯基相空间与共轭动量

由于拉格朗日量依赖于 $\ddot{\phi}$ ，我们需要扩展相空间。定义两个独立的广义坐标：

\phi_1 \equiv \phi, \quad \phi_2 \equiv \dot{\phi}

根据高阶导数理论的广义正则动量定义，对应的共轭动量分别为：

\pi_2 = \frac{\partial \mathcal{L}}{\partial \ddot{\phi}}

\pi_1 = \frac{\partial \mathcal{L}}{\partial \dot{\phi}} - \partial_t \left( \frac{\partial \mathcal{L}}{\partial \ddot{\phi}} \right) - \nabla \cdot \left( \frac{\partial \mathcal{L}}{\partial (\nabla \dot{\phi})} \right)

代入我们的拉格朗日量，计算得到：

\pi_2 = \ddot{\phi} - \nabla^2 \phi = \square \phi

\pi_1 = \frac{\partial \mathcal{L}_{\text{lower}}}{\partial \dot{\phi}} - \dot{\pi}_2

利用 $\pi_2$ 的表达式，我们可以将最高的导数 $\ddot{\phi}$ 用相空间变量表示出来：

\ddot{\phi} = \pi_2 + \nabla^2 \phi_1

3. 哈密顿量密度的推导

通过勒让德变换 (Legendre Transformation)，哈密顿量密度 $\mathcal{H}$ 定义为：

\mathcal{H} = \pi_1 \dot{\phi}_1 + \pi_2 \dot{\phi}_2 - \mathcal{L}

将 $\dot{\phi}_1 = \phi_2$ 以及 $\dot{\phi}_2 = \ddot{\phi} = \pi_2 + \nabla^2 \phi_1$ 代入上式：

\mathcal{H} = \pi_1 \phi_2 + \pi_2 (\pi_2 + \nabla^2 \phi_1) - \left[ \frac{1}{2} (\pi_2)^2 + \mathcal{L}_{\text{lower}}(\phi_1, \phi_2, \nabla \phi_1) \right]

化简后得到最终的哈密顿量密度（即能量密度）：

\mathcal{H} = \pi_1 \phi_2 + \frac{1}{2} \pi_2^2 + \pi_2 \nabla^2 \phi_1 - \mathcal{L}_{\text{lower}}(\phi_1, \phi_2, \nabla \phi_1)

4. 能量密度无下界分析

观察上述哈密顿量密度 $\mathcal{H}$ 的结构，最关键的特征在于第一项 $\pi_1 \phi_2$ 。

在正则相空间 $(\phi_1, \phi_2, \pi_1, \pi_2)$ 中，这四个变量是完全独立且可以取任意实数值的。
动量 $\pi_1$ 仅以线性形式出现在哈密顿量中，它没有对应的二次项（如 $\pi_1^2$ ）来提供下界约束。
对于任意给定的非零场演化速率 $\phi_2 \neq 0$ ，我们可以让共轭动量 $\pi_1 \to -\text{sgn}(\phi_2) \infty$ 。
在这个极限下，无论其他项（如 $\frac{1}{2}\pi_2^2$ 或势能项）如何取值，线性项 $\pi_1 \phi_2$ 都会趋于 $-\infty$ 。

因此，系统的能量密度可以被任意地推向负无穷大。这种经典层面的不稳定性（Ostrogradsky Instability）在量子化后会表现为理论中必然存在负模态（鬼场，Ghosts）或负能量态，从而破坏系统的幺正性或真空稳定性。

结论

通过广义正则哈密顿分析证明，任何包含非退化四阶导数动能项的洛伦兹不变标量场理论，其哈密顿量必然对其中一个共轭动量呈线性依赖。

\boxed{\text{由于哈密顿量密度 } \mathcal{H} \text{ 包含线性项 } \pi_1 \phi_2 \text{，能量密度在相空间中无下界，因此不可能构造出具有非负能量密度的此类理论。}}