[提案] RL+DFT 超导发现 pipeline 自动化与复现
问题
RL + DFT/DFPT 超导发现的后续:能否用 Agent 自动维护「结构 → DFT → 性质 → RL reward」pipeline,并 open-source 可复现脚本?
为什么现在可以做
- Shigang Ou 2026-01-16 组会已展示 SC discovery via RL finetune + DFT/DFPT 结果
- 组内对 agentic coding(Fortran SSE demo)已有经验
科学意义
把 RL 材料发现从 one-off demo 变成 可复跑、可扩展 的 research pipeline;其他方向(拓扑、强关联)可复用 harness。
可行性
- 已有初步结果与工具链经验
- Agent 适合 glue code + batch job + 结果 ledger
- 需专家确认 DFT 计算资源配额
建议首步
- 梳理 2026-01-16 slide 中的 data flow
- 写
docs/todo.md:最小 1 个 structure → DFT → reward 闭环 - 用 autoresearch 调 RL hyperparam(小 scale)
风险
- DFT 成本高,Agent 易跑飞
- 需严格 scope:先 1 个 material family
相关
👍 可行 ·👎 不可行 ·🤔 不确定 ·🚀 优先