[提案] 把 NCT 扩到 J>0 振转:第一性原理、对称分辨指认 CH5+ 实验精细结构(重型方法开发)
把神经正则变换扩到 J>0:第一性原理、对称分辨地指认 CH5+ 的实验精细结构
范围修订(v3,重立为重型方法开发项目):本提案前一版以「对 J=0 振动本征态做对称投影、几周内复现 Asvany 组合差」为头条。经导师与审稿反馈澄清,这是口径错配:Asvany 组合差是纯转动量(基态不同 J 转动能级之差),而 NCT 现在只给 J=0 本征值,原理上拿不到。要真正解读实验精细结构,必须把 NCT 扩到 J>0 振转——而组内经验是「J>0 相对 J=0 有阶跃式难度增长、方法上有本质区别」。故本提案重立为**「对称分辨的全维 J>0 振转 NCT」方法开发**,按季度~年级排期,正面对标 Wang–Carrington。原 J=0 对称工作降级为阶段 0 的验证里程碑与保底交付,不再是头条。
背景
质子化甲烷 CH5+ 是已知最「没有固定结构」的分子之一:五个氢原子围着中心碳原子来回 scrambling(互换位置),把它们隔开的势垒几乎为零(内转 ≈30 cm⁻¹、flip ≈340 cm⁻¹),而零点能高达 ~10918 cm⁻¹——远高于所有势垒,于是基态波函数离域在全部 5! = 120 个等价构型上,「分子结构」这一概念在它身上失效。正因如此,它的红外谱(1999 年 Oka 组在 2770–3150 cm⁻¹ 测到约 900 条谱线)被称为分子光谱学的「enfant terrible」,25 年来几乎一条线都没能被严格指认。要理解谱,等价于回答一个量子力学问题:在五个全同质子的置换-反演对称下,哪些态真的存在、哪些被泡利原理禁阻、它们各属于哪种对称性——而实验能直接卡住的,是含转动(J>0)的精细结构。
核心问题
能否把王磊组的 NCT 从 J=0 纯振动扩展为对称分辨的全维 J>0 振转变分方法,从而在真实 12 维势能面上、第一性原理地重现 Asvany 等 (2015) 测得的 CH5+ 基态组合差谱,并裁决 Wang–Carrington 2016 提出的、「只有当正负两种宇称的态都存在时才成立」的重新指认?——若扩到 J>0 后对称分辨的 NCT 振转能级无法自洽重现该组合差集合,或仅用单一宇称即可重现,则命题被证伪。
为什么必须做到 J>0(难度的「阶跃」,不是平滑加难)
这是本提案的核心判断,也是它从「几周」变成「大项目」的原因:
- 组合差是纯转动量。 基态组合差(如 R(J−1) − P(J+1) = E″(J+1) − E″(J−1))减掉了共享的上态,剩下的是振动基态内部不同转动能级 J 之间的间距。要算它必须有 E″(J=0,1,2,…) 这把转动梯子;J=0 计算每个振动态只有一根横杆,横杆之间的间距物理上不存在于 J=0 数据里。所以「用现成 32 个 J=0 本征态复现组合差」原理上做不到。
- J=0 其实绕开了整个转动问题。 总角动量为零时,振转哈密顿量塌缩为纯内坐标(CH5+ 12 维)的振动问题:体固定坐标系(embedding)怎么选都不影响本征值、没有 Coriolis 耦合、波函数只依赖内坐标。这正是 NCT 现在做的。
-
J>0 一次性涌入一整套新结构。 必须先定 body-frame,于是冒出转动动能项(∝ J²·惯量逆张量,依赖内坐标)、Coriolis 耦合(转动
↔ 振动交叉项);每个振动态裂成 (2J+1) 个 k 分量并被非对称陀螺/Coriolis 项稠密耦合(基组与矩阵 ×(2J+1) 且不再分块);转动动能算符还带奇点(惯量逆在共线/共面构型发散)。0→1 是从「没有转动算符」到「有一整套转动+Coriolis+embedding+k 耦合」的结构性新增,所以是阶跃;有了这套机器后 1→2→3 才是增量。这与组内「J=0 与 J≠0 在方法上有本质区别」的经验完全一致。 - CH5+ 是这个阶跃里的最坏情形。 它流动、约 120 个近简并极小、势垒近零 → 没有好的 body-frame:Eckart embedding 假设在参考结构附近小位移,对 CH5+ 直接失效;转动与大幅度内运动不可分,标准振转分离前提崩塌,不能把刚性转子的转动梯子「贴」到 J=0 振动态上。这正是 Wang–Carrington 当年要做一整套昂贵的精确-KEO J>0 计算才能对上组合差的原因。
为什么值得做(PRL 级意义)
- 了结一桩 25 年悬案的关键一步。 CH5+ 谱至今没有被第一性原理逐线指认;它还是「molecular structure 概念失效」的教科书范例(Marx–Parrinello)、超酸化学的核心中间体(Olah 诺奖)与星际化学中合成有机分子的关键离子。在真实全维 PES 上给出对称分辨的 J>0 振转能级、据此逐条指认实验组合差,是把这只「难驯之兽」真正驯服的核心环节。
- 填补一个别人填不了的空位。 现有第一性原理理解分三路:(i) 模型哈密顿量(超转子 / 量子图)能解释能级的对称性与「块结构」,但都对真实 12 维 PES 做了强简化;(ii) 路径积分分子动力学(Marx 组 2024,CCSD(T) 精度)能重现宽带红外包络,但给不出量子化的单条能级与对称标签;(iii) 收缩基变分(Wang–Carrington)能算 J>0 振转能级、是当前 SOTA。本项目要补的,是在真实全维 PES 上、构造即对称分辨、且能原生处理 120 重离域的机器学习变分 J>0 方法——若做成,是这条赛道上一种新的、可扩展的求解范式。
- 把该组的 SOTA「能量」升级为可证伪的「光谱物理」。 王磊组已把 ZPE 与低能 J=0 激发态算到 SOTA,但这些能级目前没有对称标签、也接不上含转动的实验量。补齐对称投影 + J>0 + 统计权重后,理论第一次能对「实验该看到哪些线、不该看到哪些线、间距是多少」给出可被直接检验的预言。
- 概念回报干净利落。 每条振转本征态的不可约表示,正是「哪些质子置换在量子力学上真正『活跃』」的严格答案——把含糊的「scrambling」翻译成可证伪的群论陈述。
现状与争议
SOTA(2024–2026 优先)
- 本组自有工作、提案的直接基础:R. Wang, Q. Zhang, L. Wang, Neural Canonical Transformation for the Spectra of Fluxional Molecule CH5+, Mach. Learn.: Sci. Technol. 7, 035027 (2026);arXiv:2509.23731。笛卡尔坐标、J=0 纯振动,ZPE = 10917.98(2.90) cm⁻¹,给出最低 32 条振动能级,波函数离域于三个驻点。论文在 Discussion 中明确把「强加质子置换对称性 / 置换等变 flow」列为下一步——本提案要做的是它再往前的一大步:J>0 振转。
- R. Beckmann, C. Schran, F. Brieuc, D. Marx, Theoretical infrared spectroscopy of protonated methane isotopologues, Phys. Chem. Chem. Phys. 26, 22846 (2024), DOI:10.1039/D4CP02295E。CCSD(T) 精度神经网络 PES + 偶极,路径积分给出全部 H/D 同位素体的宽带红外谱——但非逐线、无对称性分辨。
- I. Simkó, C. Fábri, A. G. Császár, Quantum-Chemical and Quantum-Graph Models of the Dynamical Structure of CH5+, J. Chem. Theory Comput. 19, 42 (2023), DOI:10.1021/acs.jctc.2c00991。把量子化学与量子图模型对照,刻画能级的对称性与「块结构」。
直接竞争对手(J>0 的现 SOTA,必须正面对标) 4. X.-G. Wang, T. Carrington Jr., Calculated rotation-bending energy levels of CH5+ and a comparison with experiment, J. Chem. Phys. 144, 204304 (2016), DOI:10.1063/1.4948549。收缩基 + Lanczos + 精确 KEO 的 J>0(rotation–bending)变分计算,提出与 Asvany 2015 不同的重新指认,把最大偏差从 34 cm⁻¹ 压到 2 cm⁻¹,但**「只有当实验中正、负两种宇称的态都存在时才成立」**——这就是本提案要证实/证伪的核心争议;其更早的 J=0 振动能级见 J. Chem. Phys. 129, 234102 (2008)。Carrington 组是这条赛道世界最强;本项目是硬碰硬,差异化见下。
实验标尺(landmark) 5. O. Asvany, K. M. T. Yamada, S. Brünken, A. Potapov, S. Schlemmer, Experimental ground-state combination differences of CH5+, Science 347, 1346 (2015), DOI:10.1126/science.aaa3304(配 T. Oka 评论 Science 347, 1313 (2015), DOI:10.1126/science.aaa6935,提出「CH4 的每条转动能级对应 CH5+ 的 2×5! = 240 个态」);精度改进见 S. Brackertz, S. Schlemmer, O. Asvany, J. Mol. Spectrosc. 342, 73 (2017)。这是迄今最干净的实验标尺,且是含转动的 J>0 量。
额外争议(「哪条 scrambling 路径活跃」):Witt–Ivanov–Marx (Phys. Rev. Lett. 110, 083003 (2013)) 主张内转 + flip 两种运动共同才导致完全 scrambling;而 Rawlinson–Fábri–Császár (Chem. Commun. 57, 4827 (2021), DOI:10.1039/D1CC01214B) 的 Γ60 量子图把 flip 边收缩为零、仅靠内转就重现了能级块结构 [(15,15) ⊕ (15,15)] 及其宇称关系,与前者明确相左。超转子模型(H. Schmiedt, P. Jensen, S. Schlemmer, Phys. Rev. Lett. 117, 223002 (2016))给出又一套 H2/G2 指认。模型彼此部分一致、部分冲突,尚无在真实全维 PES 上、对称完备且含转动的第一性原理裁决。
关键事实:变分计算与量子图都会同时给出 Pauli 允许与禁阻的态;五质子下只有 A2±、G2±、H2± 对称性的态具有非零核自旋统计权重,其余「应当缺失」。本提案的可观测预言正建立在这条规则 + J>0 能级结构上。
差异化:NCT 在 J>0 能带来什么 Lanczos 做不到的?
正面对标 Carrington,必须先想清楚增量在哪,否则沦为重复:
- 原生处理 120 重离域 + 高维。 NCT 的归一化流在 J=0 上已证明能在真实 12 维 PES、波函数离域于全部等价构型时拿到 SOTA 精度;收缩基方法在如此强离域 + 高维下构造收缩基本身很吃力。
- 构造即对称分辨。 经置换等变 flow(Wirnsberger et al., J. Chem. Phys. 153, 144112 (2020)),对称标签可由构造保证,而非事后投影——这对「哪些态 Pauli 允许」是天然契合。
- 可扩展性。 若 J>0 的代价在 NCT 框架下随分子尺寸/维度增长得更温和,则不止能解 CH5+,而是一类流动分子振转谱的新工具。
- 诚实边界:以上是假设,需要在阶段 1 用 J>0 的实际收敛与代价验证;做不到就要承认 Lanczos 仍是更优解。
路线图(按重型方法开发排期)
方法是项目主体,问题是判据。原 J=0 工作保留为去风险的起点与保底交付,但不是头条。
- 阶段 0(数周,验证里程碑 / 保底交付,非 PRL 头条):对论文里已算好的 32 条 J=0 NCT 本征态做 S5*(G240) 对称投影(群平均 / 置换-反演重叠分析),验证:(1) 近简并团(如 #8 (closed)–11,341.6/342.0/342.9/343.3 cm⁻¹,落在 ~1.7 cm⁻¹ 内)是否塌缩为单一简并不可约表示(A/G/H/I 简并度 1/4/5/6);(2) 0–100 与 ~300–480 cm⁻¹ 两团是否重现 (15,15) Block-1/Block-2 组成。意义:方法自检 + 确认 NCT 态确实收敛到对称本征态;定位:这是方法学/对称性结果(除非冒出意外对称结构,否则更像 JCP),用来给阶段 1 打地基,而非交付实验指认。
- 阶段 1(核心攻坚:把 NCT 扩到对称分辨 J>0 振转)。技术要件:
- 选/构造适配流动分子的坐标与 KEO——避开 Eckart embedding(对 CH5+ 失效);候选是精确 KEO 的多球/内坐标,或 lab-frame 全 3N 维 + 角动量投影。
- 把转动动能 + Coriolis 耦合纳入变分目标,处理转动动能算符奇点的数值稳定性。
- 构造对 k 条件化或耦合的 rovibrational flow ansatz,承载 (2J+1) 个稠密耦合的 k 分量。
- 群论上同时对转动 + 振动做对称投影 / 等变化,得到对称分辨的 J>0 能级。 这是新方法开发,是项目主体,按季度~年级计。早期 go/no-go:先做 J=1(最小非平凡),看能否在已知小体系/或 CH5+ 低能段拿到与 Carrington 一致的 J=1 能级;不行就回到阶段 0 收尾。
- 阶段 2(命题判定):用收敛的 J>0 振转能级算基态组合差,与 Asvany 2015 / Brackertz 2017 逐条比对;明确回答「是否必须同时含正、负两种宇称」(裁决 Wang–Carrington 2016)。
- 阶段 3(独立证伪 / 加分):换 CD5+(氘为玻色子,统计权重与 CH5+ 完全不同;据 Ivanov 等 Nat. Chem. 2, 298 (2010)「H/D 占位是非组合、非经典的零点对称破缺,且只有 CD5+ 与 CH5+ 相似」)与 CH4D+(2025 年氦纳米液滴实验中其谱带相对 CH5+ 显著「变锐」,提示 H/D 交换被部分淬灭;该实验确切出处待核实)作为独立的可测量签名再证伪一次;并借对称关系是否成立裁决「内转 vs flip 哪条路径主导」(Γ60 vs 全维)。
计算成本(J=0 基线 → J>0 乘数)
J=0 基线(原文实测规模,arXiv:2509.23731):RNVP flow 88,754 个参数;基态 batch 6000;32 态联合计算每态 1200 样本、共 10,000 步优化;能量估计每态再等效 12 万样本。单样本算力瓶颈是 18 维 local energy 里 ln|Ψ| 的拉普拉斯(autodiff 二阶导)。原文未报 wall-clock;按此规模,32 态一次完整计算约 O(1 GPU-天) 量级(精确机时待向王睿思/代码确认)。
J>0 的成本乘数(按方法结构逐项):
- 转动流形 ×(2J+1):每个 J 需 2J+1 个 k 分量且稠密耦合;要覆盖 Asvany 涉及的低 J(约 Jmax≈5–7,以 Asvany/Brackertz 数据为准)→ 目标态数较 32 个 J=0 态增至约 10–50×(按 J 与对称允许分支求和)。
- local energy ×(2–5):振转 KEO 多出转动动能(∝J²·惯量逆)与 Coriolis 项,每样本算力小幅常数倍增。
- 精度 ×(10–100):组合差是两个相近能级相减、误差按平方相加,要从现在的 ~1–3 cm⁻¹ 压到亚 cm⁻¹,统计方差 ~1/N → 样本数需 10–100×。这是成本的主控项。
- 方法迭代开销(最大但最难预算):无好 body-frame,坐标 / KEO / ansatz 要反复试错;早期失败 run 的机时通常超过最终生产 run。
量级估计:联合训练对 flow 有摊销(非简单连乘),但综合以上,低 J 振转谱做到光谱精度估计是 J=0 的 ~10²–10⁴×,即 O(数百数千 GPU-天)、多卡数周数月,外加难以预算的方法开发开销。对照:Wang–Carrington 的收缩基 + Lanczos J>0 本身就是当年的重型计算——J>0 贵是这条赛道的共性,不是 NCT 独有,但也意味着「便宜地碾压 SOTA」不现实。
成本止损机制:阶段 1 先做 J=1(最小非平凡),它既是物理 go/no-go,也是算力计——实测每 J 的真实乘数后,再决定 full Jmax 是否可负担,避免在未知 scaling 上一次性押注。
风险与证伪
- 无好的 body-frame(最高风险):流动分子没有参考结构,Eckart 失效。须走精确-KEO 内坐标或 lab-frame 角动量投影——两条都难,是阶段 1 成败所系;这也是把它定为重型项目而非数周任务的根本原因。
- 规模与收敛:(2J+1)·对称分块后的基组/矩阵规模、Coriolis 稠密耦合下的变分收敛与 MCMC 统计误差(需分辨 ~1 cm⁻¹ 近简并,须多随机种子 + 误差棒证明统计显著)。
- 与 Carrington 组正面竞争:必须先证 NCT 在 J>0 有 Lanczos 做不到的增量(见「差异化」),否则即便做出也只是复现 SOTA。这是科学风险,不是工程风险。
- PES 误差:即便核运动算得精确,结果仍受限于 2006 年的 CCSD(T) 全维 PES;若与实验不符,须先排除是 PES 而非方法所致。
- 排期诚实分级:阶段 0 是唯一数周可交付的部分,且不构成 PRL 头条;阶段 1–2 才是 PRL 卖点,但按重型方法开发计,存在做不出 J>0 的实质可能。
- 明确的证伪条件:(a) 阶段 0——若收敛 J=0 态对称投影无法重现已知 (15,15) 块结构的不可约表示与简并度 → NCT 态未真正收敛或对称机制有误,地基不稳;(b) 阶段 1——若 J=1 都拿不到与 Carrington 一致的能级 → 方法路线需推倒重来;(c) 阶段 2——若统计权重筛后的 J>0 能级无法对应任何自洽的 Asvany 组合差指认 → 要么真实指认与现有所有模型都不同(强结论、可发表),要么 PES/方法不足。
👍 可做 ·👎 不行 ·🤔 不确定 ·🚀 优先 ·❓ 需补充