[提案] 把 NCT 扩到 J>0 振转：第一性原理、对称分辨指认 CH5+ 实验精细结构（重型方法开发）

把神经正则变换扩到 J>0：第一性原理、对称分辨地指认 CH5+ 的实验精细结构

范围修订（v3，重立为重型方法开发项目）：本提案前一版以「对 J=0 振动本征态做对称投影、几周内复现 Asvany 组合差」为头条。经导师与审稿反馈澄清，这是口径错配：Asvany 组合差是纯转动量（基态不同 J 转动能级之差），而 NCT 现在只给 J=0 本征值，原理上拿不到。要真正解读实验精细结构，必须把 NCT 扩到 J>0 振转——而组内经验是「J>0 相对 J=0 有阶跃式难度增长、方法上有本质区别」。故本提案重立为**「对称分辨的全维 J>0 振转 NCT」方法开发**，按季度~年级排期，正面对标 Wang–Carrington。原 J=0 对称工作降级为阶段 0 的验证里程碑与保底交付，不再是头条。

背景

质子化甲烷 CH5+ 是已知最「没有固定结构」的分子之一：五个氢原子围着中心碳原子来回 scrambling（互换位置），把它们隔开的势垒几乎为零（内转 ≈30 cm⁻¹、flip ≈340 cm⁻¹），而零点能高达 ~10918 cm⁻¹——远高于所有势垒，于是基态波函数离域在全部 5! = 120 个等价构型上，「分子结构」这一概念在它身上失效。正因如此，它的红外谱（1999 年 Oka 组在 2770–3150 cm⁻¹ 测到约 900 条谱线）被称为分子光谱学的「enfant terrible」，25 年来几乎一条线都没能被严格指认。要理解谱，等价于回答一个量子力学问题：在五个全同质子的置换-反演对称下，哪些态真的存在、哪些被泡利原理禁阻、它们各属于哪种对称性——而实验能直接卡住的，是含转动（J>0）的精细结构。

核心问题

能否把王磊组的 NCT 从 J=0 纯振动扩展为对称分辨的全维 J>0 振转变分方法，从而在真实 12 维势能面上、第一性原理地重现 Asvany 等 (2015) 测得的 CH5+ 基态组合差谱，并裁决 Wang–Carrington 2016 提出的、「只有当正负两种宇称的态都存在时才成立」的重新指认？——若扩到 J>0 后对称分辨的 NCT 振转能级无法自洽重现该组合差集合，或仅用单一宇称即可重现，则命题被证伪。

为什么必须做到 J>0（难度的「阶跃」，不是平滑加难）

这是本提案的核心判断，也是它从「几周」变成「大项目」的原因：

组合差是纯转动量。 基态组合差（如 R(J−1) − P(J+1) = E″(J+1) − E″(J−1)）减掉了共享的上态，剩下的是振动基态内部不同转动能级 J 之间的间距。要算它必须有 E″(J=0,1,2,…) 这把转动梯子；J=0 计算每个振动态只有一根横杆，横杆之间的间距物理上不存在于 J=0 数据里。所以「用现成 32 个 J=0 本征态复现组合差」原理上做不到。
J=0 其实绕开了整个转动问题。 总角动量为零时，振转哈密顿量塌缩为纯内坐标（CH5+ 12 维）的振动问题：体固定坐标系（embedding）怎么选都不影响本征值、没有 Coriolis 耦合、波函数只依赖内坐标。这正是 NCT 现在做的。
J>0 一次性涌入一整套新结构。 必须先定 body-frame，于是冒出转动动能项（∝ J²·惯量逆张量，依赖内坐标）、Coriolis 耦合（转动↔振动交叉项）；每个振动态裂成 (2J+1) 个 k 分量并被非对称陀螺/Coriolis 项稠密耦合（基组与矩阵 ×(2J+1) 且不再分块）；转动动能算符还带奇点（惯量逆在共线/共面构型发散）。0→1 是从「没有转动算符」到「有一整套转动+Coriolis+embedding+k 耦合」的结构性新增，所以是阶跃；有了这套机器后 1→2→3 才是增量。这与组内「J=0 与 J≠0 在方法上有本质区别」的经验完全一致。
CH5+ 是这个阶跃里的最坏情形。 它流动、约 120 个近简并极小、势垒近零 → 没有好的 body-frame：Eckart embedding 假设在参考结构附近小位移，对 CH5+ 直接失效；转动与大幅度内运动不可分，标准振转分离前提崩塌，不能把刚性转子的转动梯子「贴」到 J=0 振动态上。这正是 Wang–Carrington 当年要做一整套昂贵的精确-KEO J>0 计算才能对上组合差的原因。

为什么值得做（PRL 级意义）

了结一桩 25 年悬案的关键一步。 CH5+ 谱至今没有被第一性原理逐线指认；它还是「molecular structure 概念失效」的教科书范例（Marx–Parrinello）、超酸化学的核心中间体（Olah 诺奖）与星际化学中合成有机分子的关键离子。在真实全维 PES 上给出对称分辨的 J>0 振转能级、据此逐条指认实验组合差，是把这只「难驯之兽」真正驯服的核心环节。
填补一个别人填不了的空位。 现有第一性原理理解分三路：(i) 模型哈密顿量（超转子 / 量子图）能解释能级的对称性与「块结构」，但都对真实 12 维 PES 做了强简化；(ii) 路径积分分子动力学（Marx 组 2024，CCSD(T) 精度）能重现宽带红外包络，但给不出量子化的单条能级与对称标签；(iii) 收缩基变分（Wang–Carrington）能算 J>0 振转能级、是当前 SOTA。本项目要补的，是在真实全维 PES 上、构造即对称分辨、且能原生处理 120 重离域的机器学习变分 J>0 方法——若做成，是这条赛道上一种新的、可扩展的求解范式。
把该组的 SOTA「能量」升级为可证伪的「光谱物理」。 王磊组已把 ZPE 与低能 J=0 激发态算到 SOTA，但这些能级目前没有对称标签、也接不上含转动的实验量。补齐对称投影 + J>0 + 统计权重后，理论第一次能对「实验该看到哪些线、不该看到哪些线、间距是多少」给出可被直接检验的预言。
概念回报干净利落。 每条振转本征态的不可约表示，正是「哪些质子置换在量子力学上真正『活跃』」的严格答案——把含糊的「scrambling」翻译成可证伪的群论陈述。

现状与争议

SOTA（2024–2026 优先）

本组自有工作、提案的直接基础：R. Wang, Q. Zhang, L. Wang, Neural Canonical Transformation for the Spectra of Fluxional Molecule CH5+, Mach. Learn.: Sci. Technol. 7, 035027 (2026)；arXiv:2509.23731。笛卡尔坐标、J=0 纯振动，ZPE = 10917.98(2.90) cm⁻¹，给出最低 32 条振动能级，波函数离域于三个驻点。论文在 Discussion 中明确把「强加质子置换对称性 / 置换等变 flow」列为下一步——本提案要做的是它再往前的一大步：J>0 振转。
R. Beckmann, C. Schran, F. Brieuc, D. Marx, Theoretical infrared spectroscopy of protonated methane isotopologues, Phys. Chem. Chem. Phys. 26, 22846 (2024), DOI:10.1039/D4CP02295E。CCSD(T) 精度神经网络 PES + 偶极，路径积分给出全部 H/D 同位素体的宽带红外谱——但非逐线、无对称性分辨。
I. Simkó, C. Fábri, A. G. Császár, Quantum-Chemical and Quantum-Graph Models of the Dynamical Structure of CH5+, J. Chem. Theory Comput. 19, 42 (2023), DOI:10.1021/acs.jctc.2c00991。把量子化学与量子图模型对照，刻画能级的对称性与「块结构」。

直接竞争对手（J>0 的现 SOTA，必须正面对标） 4. X.-G. Wang, T. Carrington Jr., Calculated rotation-bending energy levels of CH5+ and a comparison with experiment, J. Chem. Phys. 144, 204304 (2016), DOI:10.1063/1.4948549。收缩基 + Lanczos + 精确 KEO 的 J>0（rotation–bending）变分计算，提出与 Asvany 2015 不同的重新指认，把最大偏差从 34 cm⁻¹ 压到 2 cm⁻¹，但**「只有当实验中正、负两种宇称的态都存在时才成立」**——这就是本提案要证实/证伪的核心争议；其更早的 J=0 振动能级见 J. Chem. Phys. 129, 234102 (2008)。Carrington 组是这条赛道世界最强；本项目是硬碰硬，差异化见下。

实验标尺（landmark） 5. O. Asvany, K. M. T. Yamada, S. Brünken, A. Potapov, S. Schlemmer, Experimental ground-state combination differences of CH5+, Science 347, 1346 (2015), DOI:10.1126/science.aaa3304（配 T. Oka 评论 Science 347, 1313 (2015), DOI:10.1126/science.aaa6935，提出「CH4 的每条转动能级对应 CH5+ 的 2×5! = 240 个态」）；精度改进见 S. Brackertz, S. Schlemmer, O. Asvany, J. Mol. Spectrosc. 342, 73 (2017)。这是迄今最干净的实验标尺，且是含转动的 J>0 量。

额外争议（「哪条 scrambling 路径活跃」）：Witt–Ivanov–Marx (Phys. Rev. Lett. 110, 083003 (2013)) 主张内转 + flip 两种运动共同才导致完全 scrambling；而 Rawlinson–Fábri–Császár (Chem. Commun. 57, 4827 (2021), DOI:10.1039/D1CC01214B) 的 Γ60 量子图把 flip 边收缩为零、仅靠内转就重现了能级块结构 [(15,15) ⊕ (15,15)] 及其宇称关系，与前者明确相左。超转子模型（H. Schmiedt, P. Jensen, S. Schlemmer, Phys. Rev. Lett. 117, 223002 (2016)）给出又一套 H2/G2 指认。模型彼此部分一致、部分冲突，尚无在真实全维 PES 上、对称完备且含转动的第一性原理裁决。

关键事实：变分计算与量子图都会同时给出 Pauli 允许与禁阻的态；五质子下只有 A2±、G2±、H2± 对称性的态具有非零核自旋统计权重，其余「应当缺失」。本提案的可观测预言正建立在这条规则 + J>0 能级结构上。

差异化：NCT 在 J>0 能带来什么 Lanczos 做不到的？

正面对标 Carrington，必须先想清楚增量在哪，否则沦为重复：

原生处理 120 重离域 + 高维。 NCT 的归一化流在 J=0 上已证明能在真实 12 维 PES、波函数离域于全部等价构型时拿到 SOTA 精度；收缩基方法在如此强离域 + 高维下构造收缩基本身很吃力。
构造即对称分辨。 经置换等变 flow（Wirnsberger et al., J. Chem. Phys. 153, 144112 (2020)），对称标签可由构造保证，而非事后投影——这对「哪些态 Pauli 允许」是天然契合。
可扩展性。 若 J>0 的代价在 NCT 框架下随分子尺寸/维度增长得更温和，则不止能解 CH5+，而是一类流动分子振转谱的新工具。
诚实边界：以上是假设，需要在阶段 1 用 J>0 的实际收敛与代价验证；做不到就要承认 Lanczos 仍是更优解。

路线图（按重型方法开发排期）

方法是项目主体，问题是判据。原 J=0 工作保留为去风险的起点与保底交付，但不是头条。

阶段 0（数周，验证里程碑 / 保底交付，非 PRL 头条）：对论文里已算好的 32 条 J=0 NCT 本征态做 S5*(G240) 对称投影（群平均 / 置换-反演重叠分析），验证：(1) 近简并团（如 #8 (closed)–11，341.6/342.0/342.9/343.3 cm⁻¹，落在 ~1.7 cm⁻¹ 内）是否塌缩为单一简并不可约表示（A/G/H/I 简并度 1/4/5/6）；(2) 0–100 与 ~300–480 cm⁻¹ 两团是否重现 (15,15) Block-1/Block-2 组成。意义：方法自检 + 确认 NCT 态确实收敛到对称本征态；定位：这是方法学/对称性结果（除非冒出意外对称结构，否则更像 JCP），用来给阶段 1 打地基，而非交付实验指认。
阶段 1（核心攻坚：把 NCT 扩到对称分辨 J>0 振转）。技术要件：

选/构造适配流动分子的坐标与 KEO——避开 Eckart embedding（对 CH5+ 失效）；候选是精确 KEO 的多球/内坐标，或 lab-frame 全 3N 维 + 角动量投影。
把转动动能 + Coriolis 耦合纳入变分目标，处理转动动能算符奇点的数值稳定性。
构造对 k 条件化或耦合的 rovibrational flow ansatz，承载 (2J+1) 个稠密耦合的 k 分量。
群论上同时对转动 + 振动做对称投影 / 等变化，得到对称分辨的 J>0 能级。这是新方法开发，是项目主体，按季度~年级计。早期 go/no-go：先做 J=1（最小非平凡），看能否在已知小体系/或 CH5+ 低能段拿到与 Carrington 一致的 J=1 能级；不行就回到阶段 0 收尾。

阶段 2（命题判定）：用收敛的 J>0 振转能级算基态组合差，与 Asvany 2015 / Brackertz 2017 逐条比对；明确回答「是否必须同时含正、负两种宇称」（裁决 Wang–Carrington 2016）。
阶段 3（独立证伪 / 加分）：换 CD5+（氘为玻色子，统计权重与 CH5+ 完全不同；据 Ivanov 等 Nat. Chem. 2, 298 (2010)「H/D 占位是非组合、非经典的零点对称破缺，且只有 CD5+ 与 CH5+ 相似」）与 CH4D+（2025 年氦纳米液滴实验中其谱带相对 CH5+ 显著「变锐」，提示 H/D 交换被部分淬灭；该实验确切出处待核实）作为独立的可测量签名再证伪一次；并借对称关系是否成立裁决「内转 vs flip 哪条路径主导」（Γ60 vs 全维）。

计算成本（J=0 基线 → J>0 乘数）

J=0 基线（原文实测规模，arXiv:2509.23731）：RNVP flow 88,754 个参数；基态 batch 6000；32 态联合计算每态 1200 样本、共 10,000 步优化；能量估计每态再等效 12 万样本。单样本算力瓶颈是 18 维 local energy 里 ln|Ψ| 的拉普拉斯（autodiff 二阶导）。原文未报 wall-clock；按此规模，32 态一次完整计算约 O(1 GPU-天) 量级（精确机时待向王睿思/代码确认）。

J>0 的成本乘数（按方法结构逐项）：

转动流形 ×(2J+1)：每个 J 需 2J+1 个 k 分量且稠密耦合；要覆盖 Asvany 涉及的低 J（约 Jmax≈5–7，以 Asvany/Brackertz 数据为准）→ 目标态数较 32 个 J=0 态增至约 10–50×（按 J 与对称允许分支求和）。
local energy ×(2–5)：振转 KEO 多出转动动能（∝J²·惯量逆）与 Coriolis 项，每样本算力小幅常数倍增。
精度 ×(10–100)：组合差是两个相近能级相减、误差按平方相加，要从现在的 ~1–3 cm⁻¹ 压到亚 cm⁻¹，统计方差 ~1/N → 样本数需 10–100×。这是成本的主控项。
方法迭代开销（最大但最难预算）：无好 body-frame，坐标 / KEO / ansatz 要反复试错；早期失败 run 的机时通常超过最终生产 run。

量级估计：联合训练对 flow 有摊销（非简单连乘），但综合以上，低 J 振转谱做到光谱精度估计是 J=0 的 ~10²–10⁴×，即 O(数百~~数千 GPU-天)、多卡数周~~数月，外加难以预算的方法开发开销。对照：Wang–Carrington 的收缩基 + Lanczos J>0 本身就是当年的重型计算——J>0 贵是这条赛道的共性，不是 NCT 独有，但也意味着「便宜地碾压 SOTA」不现实。

成本止损机制：阶段 1 先做 J=1（最小非平凡），它既是物理 go/no-go，也是算力计——实测每 J 的真实乘数后，再决定 full Jmax 是否可负担，避免在未知 scaling 上一次性押注。

风险与证伪

无好的 body-frame（最高风险）：流动分子没有参考结构，Eckart 失效。须走精确-KEO 内坐标或 lab-frame 角动量投影——两条都难，是阶段 1 成败所系；这也是把它定为重型项目而非数周任务的根本原因。
规模与收敛：(2J+1)·对称分块后的基组/矩阵规模、Coriolis 稠密耦合下的变分收敛与 MCMC 统计误差（需分辨 ~1 cm⁻¹ 近简并，须多随机种子 + 误差棒证明统计显著）。
与 Carrington 组正面竞争：必须先证 NCT 在 J>0 有 Lanczos 做不到的增量（见「差异化」），否则即便做出也只是复现 SOTA。这是科学风险，不是工程风险。
PES 误差：即便核运动算得精确，结果仍受限于 2006 年的 CCSD(T) 全维 PES；若与实验不符，须先排除是 PES 而非方法所致。
排期诚实分级：阶段 0 是唯一数周可交付的部分，且不构成 PRL 头条；阶段 1–2 才是 PRL 卖点，但按重型方法开发计，存在做不出 J>0 的实质可能。
明确的证伪条件：(a) 阶段 0——若收敛 J=0 态对称投影无法重现已知 (15,15) 块结构的不可约表示与简并度 → NCT 态未真正收敛或对称机制有误，地基不稳；(b) 阶段 1——若 J=1 都拿不到与 Carrington 一致的能级 → 方法路线需推倒重来；(c) 阶段 2——若统计权重筛后的 J>0 能级无法对应任何自洽的 Asvany 组合差指认 → 要么真实指认与现有所有模型都不同（强结论、可发表），要么 PES/方法不足。

👍 可做 · 👎 不行 · 🤔 不确定 · 🚀 优先 · ❓ 需补充

Edited Jun 16, 2026 by Osgood Ou