学习领域

🤖 AI

大语言模型与智能体的前沿研究

深入探讨大语言模型的基础架构、设计原理、技术演进及注意力机制等核心概念。

全面解析大语言模型训练全流程：从预训练到后训练，涵盖 SFT、RLHF、GRPO 等核心技术方法。

Function Calling、MCP 和 Skills 详解，掌握 AI 智能体的工具调用机制。

ReAct、Plan-and-Solve 等规划框架，探索智能体的决策和规划能力。

智能体的记忆机制，涵盖短期、长期和工作记忆的三维框架。

自我进化智能体的调查，探讨智能体如何通过自我反思和学习不断改进。

多智能体系统的设计与优化，包括强化学习、博弈论和协调机制。

检索增强生成完全指南，解决 LLM 知识过时和幻觉问题。

LLM在运筹学中的应用：自动建模、辅助优化与直接求解三大范式深度解析，涵盖方法、应用与挑战。

探索如何将预测模型与决策优化紧密结合

系统梳理三大主流范式（SO、E2E、DL）的理论基础、优势和局限，深入讲解E2E的三种方法：隐式微分、SPO+和近似方法。

详解 R-DFL 框架：从顺序到递归，通过双向反馈增强决策聚焦学习，涵盖显式展开与隐式微分两种梯度计算方法。

2024-2026年DFL研究全景：不确定性建模、在线闭环决策、训练效率优化等8大方向的最新进展与统一框架。

京东 & 美团：Decision-Focused Learning 在供应链库存管理与营销预算分配中的工业化落地实践。

深度学习和大模型在时间序列预测中的应用研究

系统梳理了6个深度学习模型和4个基础模型系列在时间序列预测中的应用，包括模型对比、架构分析和性能评估。

视频推荐系统中的观看时长预测，分类-恢复框架与误差自适应离散化方法，快手线上验证观看时长提升 0.291%。

全面总结时间序列 Patching 技术的优势与劣势：计算效率、局部语义、边界截断、超参数敏感性等深度分析，附适用场景指南。