Decision-Focused Learning(DFL)最新进展总结(2024–2026)

DFL 正在从"预测驱动优化"演化为"分布建模 + 闭环决策 + 高效训练"的统一决策学习范式,并逐步融合生成模型、强化学习与鲁棒优化。

最新进展总览

方向 核心问题 本质变化 最新进展(2024–2026) 关键技术 代表工作
基础定义与综述 预测与决策割裂 从"预测准确"→"决策最优" 统一 end-to-end 决策学习框架 decision loss / regret Mandi et al. (2024)
不确定性建模 🔥 点预测不鲁棒 从"一个值"→"整个分布" 分布建模 + 生成模型(risk-aware) diffusion、generative model、DRO、CVaR Gen-DFL、Diffusion-DFL、DF²
在线与闭环决策 🔥 静态数据、单步优化 从"单步优化"→"序列决策系统" online + recursive DFL unrolling、feedback、regret learning Online DFL、Recursive DFL
训练效率优化 🔥 求解器慢、不可导 从"依赖求解器"→"摆脱求解器" solver-free / proxy / dual方法 surrogate loss、dual reformulation、implicit gradient Solver-Free DFL、Dual DFL
理论深化 梯度不稳定 从"经验方法"→"理论可解释" 梯度表达与优化路径改进 tangent-space projection、prediction-guided gradient Lee et al. (2026)、Jeon et al. (2025)
鲁棒性与泛化 分布偏移(OOD) 从"拟合数据"→"对抗环境变化" DRO + uncertainty-aware DFL worst-case optimization、distributionally robust learning DR-DFL、Generalized DFL
复杂约束与可行性 约束难处理/不确定 从"参数预测"→"约束学习" 可学习约束 + 概率约束优化 constraint learning、chance constraint Feasibility-aware DFL
大规模与工业化 计算复杂、难落地 从"论文方法"→"工业系统" real-time + large-scale optimization approximate solver、caching、warm-start DeepChance-OPT、Planning DFL

三大核心演化主线

主线 本质变化
建模对象 点预测 → 分布 / 生成模型
决策结构 单步 → 在线 / 闭环
训练范式 solver-based → solver-free

统一DFL框架(系统视角)

模块 作用 对应方向
分布建模 学习不确定性 Diffusion-DFL / Gen-DFL
决策优化 输出最优决策 Solver-free / Proxy
系统演化 多轮决策影响状态 Recursive / Online
鲁棒机制 抵抗分布偏移 DR-DFL
高效训练 降低计算成本 Dual / Gradient方法