开发历程

从 QQ bot 原型到长期运行 Agent Runtime

基于约 608 次 Git 提交梳理的演进主线。这不是完整提交清单,而是项目如何从"能回复的 QQ bot"变成"可诊断、可维护、可长期运行的 Agent 系统"的关键阶段。

2026-04-15 起 · 608+ 提交 · 4 月 62 / 5 月 159 / 6 月 387 次

四个开发阶段

① 功能验证(2026-04)

快速接入 QQ 消息、流式回复、图片理解、空间能力、基础记忆与 Agent run,先证明方向能跑通。早期不追求架构优雅,只验证:消息能进、模型能回、角色能维持、QQ 特色能力能接。

② 工程化重构(2026-04 末 ~ 2026-05)

从"功能堆叠"转向"Runtime 化":重构 Agent Runtime 降低回复延迟,用 native skills 替换 MCP bridge,提升 planner 工具选择精度,引入模块化 persona prompt、session summary、记忆压缩,加固工具调用上限、安全检查、并发保护与推理 fallback。开始拆大文件、回流 facade、归档历史代码。

这一阶段解决 Agent 系统的基本工程问题:不能所有请求靠一个大 prompt 扛;工具必须有边界;planner 需知道何时调用工具;记忆需要压缩;并发、超时、fallback 必须进主流程。

③ 记忆系统与 RAG 治理(2026-05 中)

记忆进入快速扩张期:LanceDB 召回质量与速度、向量回填接入记忆写入、Memory V3 lifecycle、profile memory 生命周期、memory quality governance、recall observability、memory index health gating。MemOS 收窄为远端只读召回,与本地记忆去重。

核心转变:记忆不再只是"存聊天记录",而是开始处理 RAG 真正困难的部分——召回什么、信不信、过期怎么办、冲突怎么办、污染怎么发现。

④ 真实运行驱动(2026-06)

进入真实运行问题密集收口期。围绕回复延迟、NapCat 离线、Windows 重启稳定性、模型请求格式、Anthropic prompt cache、图片 token 预算、被动群感知漏图、reasoning 外发泄漏等问题做可复跑修复。README 收口为项目入口,维护日志结构化,岗位说明与开发历程独立成文。

重点从"做新功能"转向"让系统在坏现场里能恢复、能诊断、能复现"——用 request trace、model-calls、健康诊断、目标测试与真实重启演练定义"完成"。

关键技术主线

Agent 编排 —— 从 Agent run V2/V4 演进到 Runtime V2,路由、planner、工具 dispatch、回复生成、校验、持久化节点化,解决复杂 Agent 不可维护问题。
Prompt 工程 —— 从普通系统提示词到 manifest、persona worldbook、runtime protocol、admin prompt、reasoning forward prompt 与检查脚本,解决角色一致性、安全边界与多模型差异。
RAG 与记忆治理 —— 从 Memory V3 / MemOS 原型到 LanceDB、向量回填、lifecycle、profile journal、quality gate、recall observability、磁盘优先召回,解决长期对话连续性与记忆污染。
运行稳定性 —— 补齐 restart、daemon、NapCat health、main reply lag、runtime exceptions、request trace、prompt assembly timing、pre-release smoke 等诊断入口,解决长期运行的可恢复性。
性能与成本 —— token budget、prompt cache、normal fast reply、planner timeout、inline image cap、LanceDB PQ、worker RSS、disk-backed recall,解决"能跑"和"跑得起"。

验收习惯

历史提交中反复出现的验收方式,让每次"修好了"尽量有证据:

node scripts/run-tests.js ... 跑目标回归测试
node --check ... 语法检查
npm run check:prompts 检查 prompt manifest 装配
npm run diag:* 复核运行态、记忆、主回复、NapCat、请求 trace
实际执行 restart-bot.cmd 验证 Windows 运行链路
对 request-trace.ndjson、model-calls.ndjson、inbound_timing.jsonl 做只读诊断

当前状态

可运行的 QQ AI Agent 主链路
Runtime V2 节点化执行结构
分层记忆与 RAG 召回体系
post-reply worker 后台学习闭环
Prompt manifest、persona worldbook 与角色运行协议
NapCat/OneBot 接入、HTTP action、健康诊断、重启恢复
主回复延迟、token 预算、模型请求、prompt cache 与运行异常诊断

参考入口

README.md —— 项目介绍与项目经历
docs/maintenance-log.md —— 详细维护记录与验收结果
docs/ai-agent-job-application.md —— 面向 AI 开发工程师岗位的项目说明
docs/repository-structure.md —— 目录边界与清理规则

更新时间:2026-06-22 · 查看 Markdown 原文