Decision-Focused Learning 最新进展

                    
                        DFL 正在从"预测驱动优化"演化为"分布建模 + 闭环决策 + 高效训练"的统一决策学习范式，并逐步融合生成模型、强化学习与鲁棒优化。

最新进展总览

方向	核心问题	本质变化	最新进展（2024–2026）	关键技术	代表工作
基础定义与综述	预测与决策割裂	从"预测准确"→"决策最优"	统一 end-to-end 决策学习框架	decision loss / regret	Mandi et al. (2024)
不确定性建模 🔥	点预测不鲁棒	从"一个值"→"整个分布"	分布建模 + 生成模型（risk-aware）	diffusion、generative model、DRO、CVaR	Gen-DFL、Diffusion-DFL、DF²
在线与闭环决策 🔥	静态数据、单步优化	从"单步优化"→"序列决策系统"	online + recursive DFL	unrolling、feedback、regret learning	Online DFL、Recursive DFL
训练效率优化 🔥	求解器慢、不可导	从"依赖求解器"→"摆脱求解器"	solver-free / proxy / dual方法	surrogate loss、dual reformulation、implicit gradient	Solver-Free DFL、Dual DFL
理论深化	梯度不稳定	从"经验方法"→"理论可解释"	梯度表达与优化路径改进	tangent-space projection、prediction-guided gradient	Lee et al. (2026)、Jeon et al. (2025)
鲁棒性与泛化	分布偏移（OOD）	从"拟合数据"→"对抗环境变化"	DRO + uncertainty-aware DFL	worst-case optimization、distributionally robust learning	DR-DFL、Generalized DFL
复杂约束与可行性	约束难处理/不确定	从"参数预测"→"约束学习"	可学习约束 + 概率约束优化	constraint learning、chance constraint	Feasibility-aware DFL
大规模与工业化	计算复杂、难落地	从"论文方法"→"工业系统"	real-time + large-scale optimization	approximate solver、caching、warm-start	DeepChance-OPT、Planning DFL

三大核心演化主线

主线	本质变化
建模对象	点预测 → 分布 / 生成模型
决策结构	单步 → 在线 / 闭环
训练范式	solver-based → solver-free

统一DFL框架（系统视角）

模块	作用	对应方向
分布建模	学习不确定性	Diffusion-DFL / Gen-DFL
决策优化	输出最优决策	Solver-free / Proxy
系统演化	多轮决策影响状态	Recursive / Online
鲁棒机制	抵抗分布偏移	DR-DFL
高效训练	降低计算成本	Dual / Gradient方法

导航菜单

主要章节

相关页面

Decision-Focused Learning（DFL）最新进展总结（2024–2026）

最新进展总览

三大核心演化主线

统一DFL框架（系统视角）