Agent 那些事儿：从 Function Calling 到 Agent OS

项目名称

中文名：Agent 那些事儿
仓库名：agent-things

这个项目是什么

AI 应用开发过程中，以“问题驱动”方式整理的学习笔记。

以“遇到问题 → 产生需求 → 诞生解决方案”的演进逻辑，从 Function Calling 一路学到 Agent OS，覆盖大模型应用工程的完整技术栈。最终以开源项目的形式发布，帮助更多同路人。

为什么要做这件事

起因

在做 AI 应用开发的过程中遇到了一个结构性的困境：

市面上不缺知识。论文、博客、官方文档、开源框架，多到溢出。但它们几乎都是按知识点分类的：这里一篇 RAG 教程，那里一篇 Agent 框架对比。

读完之后知道了很多“是什么”，但始终不清楚：

这些东西为什么会出现？它解决了谁的什么问题？它和上一个方案之间是什么关系？

碎片化的知识像散落的拼图，你拿到了每一块，但没有盒子上的完整图案。

我需要的

一条有因果链的学习路线。不是“你应该学这些知识点”，而是“这些技术为什么会按这个顺序出现”。

这条路线在 2026 年 4 月的今天并不存在。所以我决定自己整理一份。

核心观点

观点 1：学习应该是问题驱动的，不是知识点驱动的

后端工程师学分布式系统，不是先背 Paxos 再背 Raft，而是：

单机扛不住了 → 要加机器 → 数据怎么一致？→ Paxos → Paxos 太难落地 → Raft

每一个方案都是对上一个问题的回应。没有前一个问题，后一个方案就没有存在的意义。

LLM 应用工程的演进也是这样一条因果链：

遇到的问题	诞生的解决方案
模型只会聊天，不会做事	Function Calling
模型知识有截止日期，私有数据不知道	RAG
工具接入碎片化，每家格式不一样	MCP 协议
单次调用不够，需要多步规划执行	Agent
Agent 反复编排相同的工具组合	Skill 封装
每次对话都从零开始，跨会话失忆	Memory
检索策略越来越多，需要智能调度	Agentic RAG
单 Agent 搞不定，需要专业分工	Multi-Agent + 协议栈
零件齐了，怎么组装成可用的产品	Agent OS
Demo 和生产之间的鸿沟	工程实战

把这条链讲清楚，比把每个知识点讲透更重要。

观点 2：从历史事件中学习，比从抽象概念中学习更高效

每一项技术背后都有一个具体的事件：谁、在什么时间、面对什么问题、发布了什么。

你不需要先读 MCP 协议规范全文。你只需要知道：2024 年 11 月，Anthropic 发现 Function Calling 的碎片化已经严重阻碍了 Agent 生态，OpenAI、Claude、Gemini 各有各的格式，工具开发者要适配三遍，于是提出了一个标准化协议层。

知道了“为什么”，“是什么”自然就好理解了。

把技术挂在事件上，学习就有了时间感和因果感，不再是悬浮在空中的概念。这也是为什么本项目梳理了从 2017 年 Transformer 到 2026 年的 67 个关键事件。它们不是附录，而是叙事骨架。

观点 3：后端工程师的视角本身就是一种价值

AI 应用开发的资料大多出自两类人：AI 研究者（偏理论）和全栈独立开发者（偏 Demo）。

但真正在企业里把 AI 能力落地成产品的，往往是从后端 / 基础架构转型过来的工程师。

后端工程师天然关心的问题，可靠性、可观测性、协议标准化、系统分层、错误恢复，恰好是 AI 应用从 Demo 走向生产最缺的那一环。

这份笔记带着后端的思维惯性去审视 LLM 应用工程，这不是局限，而是一种独特的切入角度。

项目价值

对自己

将零散的学习过程结构化，从“用过这些工具”变成“理解这条演进链”
写下来的过程就是整理思路的过程，写不清楚说明没想明白

对同路人

提供一条有因果逻辑的学习路径，不用在碎片化资料中自己拼图
每章从“痛点”开始，天然解决“我为什么要学这个”的动机问题

对社区

67 个关键事件串联的时间线，本身就是一份有价值的行业演进记录
抽象概念配真实例子、真实交互和系统视角，帮助建立更稳的工程认知

怎么把 README、TIMELINE 和章节连起来

这三个层级各自回答不同的问题：

README.md：这是什么，为什么值得读，应该怎么读
TIMELINE.md：这些技术是怎么一步步出现的，为什么会在那个时间点出现
各章 README.md：某个具体问题是怎么被解决的，方案又留下了什么新问题

如果你是第一次进入这个项目，最推荐的顺序是：

先读当前这份 README，理解项目立场和整体主线。
再读 TIMELINE.md，把 67 个关键事件放回一条连续的历史骨架里。
最后按 Ch0 -> Ch10 进入章节正文。

这本书的时间线骨架

完整时间线在 TIMELINE.md，但如果你先想抓住全局，可以先看这五个阶段：

2017 — 2022：基础奠基
Transformer、RLHF、ChatGPT 让模型具备了“会说话”的能力，但系统边界也同时暴露出来。
2023：工具与框架涌现
Function Calling、Plugins、AutoGPT、MetaGPT 让行业第一次认真尝试“让模型做事”。
2024：能力跃升与协议萌芽
长上下文、多模态、推理模型和 MCP 同时出现，模型开始真正接入外部世界。
2025：Agent 产品化与协议栈成型
Agent 从概念验证走向产品，协议分层和工程化设计开始成形。
2026：Agent OS 与多 Agent 时代
系统视角成为主角，多 Agent、Harness Engineering 和产品级架构被公开学习。

如果你更关心“时间线最终是怎么映射到章节里的”，可以直接跳到 TIMELINE.md 的章节映射部分。

技术演进全链

主线：章与章之间的因果链

章次	主题	引出的下一问题
第 0 章	被困在房间里的天才（LLM 的能力边界）	模型需要“手”和“工具”
第 1 章	Function Calling — 让模型学会使用工具	模型知道怎么做了，但仍然不知道训练外的新知识
第 2 章	RAG — 让模型获取外部知识	工具接入和数据接入都开始碎片化
第 3 章	MCP — 工具与数据接入的标准化	有了能力接入，但还缺多步规划与执行
第 4 章	Agent — 自主规划与多步执行	Agent 反复重做相同流程，缺少能力封装
第 5 章	Skill — 可复用的能力封装	会做事了，但系统还会失忆
第 6 章	Memory — 给 Agent 装上长期记忆	检索仍然是一条静态管线
第 7 章	Agentic RAG — 当 Agent 接管检索	单 Agent 开始逼近上限
第 8 章	Multi-Agent 与协议全景	零件齐了，怎么组织成产品级系统
第 9 章	Agent OS — 从组件到产品级系统	Demo 和生产之间还有巨大鸿沟
第 10 章	工程实战 — 把 Agent 推向生产

穿插专题：以真实产业事件为学习素材

专题	内容	学习价值
A：Claude Code 源码泄露	2026.03 npm 包意外包含完整源码	目前最详实的产品级 Agent 系统设计公开资料
B：协议之战	MCP vs A2A vs ACP 三层协议栈	理解“为什么需要分层”而非“该选哪个”
C：Coding Agent 演化史	从 AutoGPT 到 OpenClaw	理解 Agent 产品化的完整演进脉络
D：Manus 与 Prompt 泄露	System Prompt 泄露与安全反思	Prompt Injection 是 Agent 时代的 SQL Injection
E：Zed ACP	AI 编码工具的 “LSP 时刻”	理解 Agent 系统的前端协议层

当前版本的表达方式

原始设想里，每一章都可以有代码实践、可运行 lab 和更完整的工程实验。

但当前第一版的重点，不是先把整套内容做成代码课，而是先把问题和解法讲清楚。

所以当前版本优先做的是：

把 11 章主线讲顺
把章节统一成可公开阅读的长文 README
用真实例子、真实交互和真实数据形状把抽象概念讲具体

等整条叙事真正稳定下来，再决定哪些章节适合补代码、补 lab、补可运行示例。

每章的叙事结构

这套内容原本的理想结构，仍然成立：

模块	内容	作用
问题引入	“上一章的方案在 X 场景下失败了”	建立学习动机
历史背景	关键事件、时间、发起者	建立时间感
概念讲解	核心原理、架构图、对比表	理解“是什么”
真实例子 / 交互	具体数据形状、请求响应、运行轨迹	理解“系统里到底发生了什么”
深入剖析	设计决策、trade-off、反直觉洞察	理解“为什么”
遗留痛点	本章方案的局限，引出下一章	保持演进链

当前仓库里的第一版，优先保证这条叙事链不断裂。后续如果补代码，也会服务于这条主线，而不是反过来挤压它。

不是什么

为了让定位更锐利，明确划定边界：

不是模型训练教程
聚焦应用层工程，不涉及预训练、RLHF、模型量化。
不是框架使用文档
不教“怎么用 LangChain”，而是讲“LangChain 要解决什么问题”。
不是知识百科
只保留因果链上的关键节点，有意识地做减法。
不是纯客观综述
会标注“我认为”和“行业共识”的区别，保留个人判断。
不是面向 AI 研究者的
面向想用 LLM 构建产品的工程师。

目标受众

主要受众

有后端 / 系统编程基础，正在或准备转型 AI 应用开发的工程师。

典型画像

熟悉至少一门后端语言，有 API 设计和系统架构经验
用过 ChatGPT / Claude 等产品，对 LLM 有直觉但缺乏系统认知
试过一些 LLM API 调用或 RAG Demo，但不确定“下一步该学什么”
关心“怎么在生产环境跑起来”，而不只是“怎么跑通一个 Demo”

次要受众

任何对 LLM 应用工程全貌感兴趣、希望建立系统认知的技术人。

项目原则

因果链优先
宁可少覆盖一个知识点，也不能断裂章与章之间的因果逻辑。
事件驱动叙事
每项技术都锚定在具体的历史事件上，有时间、有人物、有背景。
故事优先于代码堆砌
第一版先把问题和解法讲清楚，不急着把每章都做成代码课。
例子必须具体
抽象概念尽量配真实例子、真实交互或真实数据形状。
诚实标注主观
个人观点用“我认为”标注，与行业共识区分。
渐进式深入
同一个概念可以在不同章出现，每次加深一层，不要求一次讲透。

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
ch00-llm-limitations		ch00-llm-limitations
ch01-function-calling		ch01-function-calling
ch02-rag		ch02-rag
ch03-mcp		ch03-mcp
ch04-agent		ch04-agent
ch05-skill		ch05-skill
ch06-memory		ch06-memory
ch07-agentic-rag		ch07-agentic-rag
ch08-multi-agent		ch08-multi-agent
ch09-agent-os		ch09-agent-os
ch10-production		ch10-production
.gitignore		.gitignore
CONTRIBUTING.md		CONTRIBUTING.md
README.md		README.md
TIMELINE.md		TIMELINE.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Agent 那些事儿：从 Function Calling 到 Agent OS

这个项目是什么

为什么要做这件事

起因

我需要的

核心观点

观点 1：学习应该是问题驱动的，不是知识点驱动的

观点 2：从历史事件中学习，比从抽象概念中学习更高效

观点 3：后端工程师的视角本身就是一种价值

项目价值

对自己

对同路人

对社区

怎么把 README、TIMELINE 和章节连起来

这本书的时间线骨架

技术演进全链

主线：章与章之间的因果链

穿插专题：以真实产业事件为学习素材

当前版本的表达方式

每章的叙事结构

不是什么

目标受众

项目原则

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

Agent 那些事儿：从 Function Calling 到 Agent OS

这个项目是什么

为什么要做这件事

起因

我需要的

核心观点

观点 1：学习应该是问题驱动的，不是知识点驱动的

观点 2：从历史事件中学习，比从抽象概念中学习更高效

观点 3：后端工程师的视角本身就是一种价值

项目价值

对自己

对同路人

对社区

怎么把 README、TIMELINE 和章节连起来

这本书的时间线骨架

技术演进全链

主线：章与章之间的因果链

穿插专题：以真实产业事件为学习素材

当前版本的表达方式

每章的叙事结构

不是什么

目标受众

项目原则

About

Resources

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages