开发历程

从 QQ bot 原型到长期运行 Agent Runtime

基于约 608 次 Git 提交梳理的演进主线。这不是完整提交清单,而是项目如何从"能回复的 QQ bot"变成"可诊断、可维护、可长期运行的 Agent 系统"的关键阶段。

2026-04-15 起 · 608+ 提交 · 4 月 62 / 5 月 159 / 6 月 387 次

四个开发阶段

① 功能验证(2026-04)

快速接入 QQ 消息、流式回复、图片理解、空间能力、基础记忆与 Agent run,先证明方向能跑通。早期不追求架构优雅,只验证:消息能进、模型能回、角色能维持、QQ 特色能力能接。

② 工程化重构(2026-04 末 ~ 2026-05)

从"功能堆叠"转向"Runtime 化":重构 Agent Runtime 降低回复延迟,用 native skills 替换 MCP bridge,提升 planner 工具选择精度,引入模块化 persona prompt、session summary、记忆压缩,加固工具调用上限、安全检查、并发保护与推理 fallback。开始拆大文件、回流 facade、归档历史代码。

这一阶段解决 Agent 系统的基本工程问题:不能所有请求靠一个大 prompt 扛;工具必须有边界;planner 需知道何时调用工具;记忆需要压缩;并发、超时、fallback 必须进主流程。

③ 记忆系统与 RAG 治理(2026-05 中)

记忆进入快速扩张期:LanceDB 召回质量与速度、向量回填接入记忆写入、Memory V3 lifecycle、profile memory 生命周期、memory quality governance、recall observability、memory index health gating。MemOS 收窄为远端只读召回,与本地记忆去重。

核心转变:记忆不再只是"存聊天记录",而是开始处理 RAG 真正困难的部分——召回什么、信不信、过期怎么办、冲突怎么办、污染怎么发现。

④ 真实运行驱动(2026-06)

进入真实运行问题密集收口期。围绕回复延迟、NapCat 离线、Windows 重启稳定性、模型请求格式、Anthropic prompt cache、图片 token 预算、被动群感知漏图、reasoning 外发泄漏等问题做可复跑修复。README 收口为项目入口,维护日志结构化,岗位说明与开发历程独立成文。

重点从"做新功能"转向"让系统在坏现场里能恢复、能诊断、能复现"——用 request trace、model-calls、健康诊断、目标测试与真实重启演练定义"完成"。

关键技术主线

验收习惯

历史提交中反复出现的验收方式,让每次"修好了"尽量有证据:

当前状态

参考入口

更新时间:2026-06-22 · 查看 Markdown 原文