| 基础定义与综述 |
预测与决策割裂 |
从"预测准确"→"决策最优" |
统一 end-to-end 决策学习框架 |
decision loss / regret |
Mandi et al. (2024) |
| 不确定性建模 🔥 |
点预测不鲁棒 |
从"一个值"→"整个分布" |
分布建模 + 生成模型(risk-aware) |
diffusion、generative model、DRO、CVaR |
Gen-DFL、Diffusion-DFL、DF² |
| 在线与闭环决策 🔥 |
静态数据、单步优化 |
从"单步优化"→"序列决策系统" |
online + recursive DFL |
unrolling、feedback、regret learning |
Online DFL、Recursive DFL |
| 训练效率优化 🔥 |
求解器慢、不可导 |
从"依赖求解器"→"摆脱求解器" |
solver-free / proxy / dual方法 |
surrogate loss、dual reformulation、implicit gradient |
Solver-Free DFL、Dual DFL |
| 理论深化 |
梯度不稳定 |
从"经验方法"→"理论可解释" |
梯度表达与优化路径改进 |
tangent-space projection、prediction-guided gradient |
Lee et al. (2026)、Jeon et al. (2025) |
| 鲁棒性与泛化 |
分布偏移(OOD) |
从"拟合数据"→"对抗环境变化" |
DRO + uncertainty-aware DFL |
worst-case optimization、distributionally robust learning |
DR-DFL、Generalized DFL |
| 复杂约束与可行性 |
约束难处理/不确定 |
从"参数预测"→"约束学习" |
可学习约束 + 概率约束优化 |
constraint learning、chance constraint |
Feasibility-aware DFL |
| 大规模与工业化 |
计算复杂、难落地 |
从"论文方法"→"工业系统" |
real-time + large-scale optimization |
approximate solver、caching、warm-start |
DeepChance-OPT、Planning DFL |