📚 索引
  • 🏠 首页
  • 🤖 AI
    • 1. Model
      • GPT 模型原理
      • 注意力机制
    • Training
      • Pre-training
      • Post-training 全景指南
      • PEFT 详解
    • 4. Agent
      • LLM Agent Survey
      • Agentic Reasoning
      • Memory
      • Self-Evolving
      • Multi-Agent Systems
      • Agentic RL
      • Knowledge Graph
      • RAG
      • Tree of Thoughts
      • Tools
  • 🔄 端到端
  • ⏱️ 预测

🤖 AI

大语言模型与智能体的前沿研究

🏗️ 基座

1. Model

深入探讨大语言模型的基础架构、设计原理、技术演进及注意力机制等核心概念。

🔄 Training

Pre-training + Mid-training + Post-training

全面解析大语言模型训练全流程:从预训练到后训练,涵盖 SFT、RLHF、GRPO 等核心技术方法。

🤖 Agent

Tools

Function Calling、MCP 和 Skills 详解,掌握 AI 智能体的工具调用机制。

Planning

ReAct、Plan-and-Solve 等规划框架,探索智能体的决策和规划能力。

Memory

智能体的记忆机制,涵盖短期、长期和工作记忆的三维框架。

Self-Evolving

自我进化智能体的调查,探讨智能体如何通过自我反思和学习不断改进。

Multi-Agent

多智能体系统的设计与优化,包括强化学习、博弈论和协调机制。

RAG

检索增强生成完全指南,解决 LLM 知识过时和幻觉问题。

📱 Application

OR * AI

LLM在运筹学中的应用:自动建模、辅助优化与直接求解三大范式深度解析,涵盖方法、应用与挑战。

🔄 端到端

探索如何将预测模型与决策优化紧密结合

预测与决策结合的范式

系统梳理三大主流范式(SO、E2E、DL)的理论基础、优势和局限,深入讲解E2E的三种方法:隐式微分、SPO+和近似方法。

R-DFL 递归决策聚焦学习

详解 R-DFL 框架:从顺序到递归,通过双向反馈增强决策聚焦学习,涵盖显式展开与隐式微分两种梯度计算方法。

Decision-Focused Learning 最新进展

2024-2026年DFL研究全景:不确定性建模、在线闭环决策、训练效率优化等8大方向的最新进展与统一框架。

端到端业内落地调研

京东 & 美团:Decision-Focused Learning 在供应链库存管理与营销预算分配中的工业化落地实践。

⏱️ 预测

深度学习和大模型在时间序列预测中的应用研究

时序模型调研

系统梳理了6个深度学习模型和4个基础模型系列在时间序列预测中的应用,包括模型对比、架构分析和性能评估。

CREAD 论文详解

视频推荐系统中的观看时长预测,分类-恢复框架与误差自适应离散化方法,快手线上验证观看时长提升 0.291%。

Patching 技术优劣分析

全面总结时间序列 Patching 技术的优势与劣势:计算效率、局部语义、边界截断、超参数敏感性等深度分析,附适用场景指南。