Report

纳米级 clawdbot(nanobot/OpenClaw)替代方案调研

围绕“原版 clawdbot”核心能力:对话、记忆、工具调用、集成与性能取舍(含可复现对比方法)

纳米级 clawdbot:对比 nanobot/OpenClaw 与原版差异

2026-02-07 19:49
clawdbotnanobotOpenClawLLMAgent记忆RAG

TL;DR

  • 定义:本文将“clawdbot”视为带工具调用与记忆的 LLM 对话式 Agent;非爬虫 Bot(另一种定义见 Options)。
  • “纳米级/极简替代品”通常保留核心 agent loop(对话→调用工具→写回上下文→生成回答),删除 UI、账号、插件生态等外围。
  • 判断与原版差距最可靠的方法:做能力矩阵 + 3 个标准化场景 PoC(纯聊天/工具任务/RAG)。
  • 如果你要个人本地可控与易改代码,优先从 nanobot/OpenClaw 这类极简内核入手;要上生产则需补齐持久化、鉴权、监控等。

Key Insights

  • “最小复刻”往往不是“阉割”,而是把系统拆成:LLM 客户端、提示词/策略、工具适配器、(可选)记忆存储四块;其余全部外置。
  • 记忆可分三层:对话历史(短期)、长期知识库(向量检索/全文检索)、任务状态(plan/step/scratchpad);极简实现常只保留前两者的最小版本。
  • “快”主要来自更少抽象层、并发与流式输出、缓存(embedding/检索结果/工具调用)以及更轻的 Web/CLI 框架;需端到端实测。
  • 选型的关键不是“像不像”,而是你的优先级:可改性/可审计/本地运行 vs 多用户/稳定性/生态与可观测性。

Playbook

  • 统一基线:拉取原版 clawdbot、HKUDS/nanobot、OpenClaw(若有 GitHub 仓库)并锁定 commit hash;记录语言、依赖与启动命令。
  • 做能力矩阵:对话、多轮会话管理、工具调用协议、RAG/索引、长期记忆持久化、UI/API、鉴权、日志与 tracing、部署(Docker/单文件)逐项对照。
  • 代码快速定位:用 ripgrep 搜索关键词 tool/function_call/agent loop/embed/vector/sqlite/qdrant/chroma/FAISS;看是否有会话表、向量库 schema、重试/超时逻辑。
  • 3 场景 PoC:a) 10 轮纯聊天;b) 一个“需要工具”的任务(如读写文件/搜索);c) 导入 20–50 篇 markdown 做 RAG 问答;固定同一模型与参数,记录成功率、平均延迟与成本。

Diagrams

Decision Map ↑ Control / Consistency Speed / Convenience → 1 方案 A(极简内核路线):以 … 2 方案 B(成熟框架路线):用 … 3 方案 C(性能优先路线):若 … 4 分支(若 clawdbot=爬…
Options · 速度 vs 可控性 的决策图(基于 Options 文本自动定位)
Execution Steps 1 统一基线 2 做能力矩阵 3 代码快速定位 4 3 场景 PoC
Playbook · 执行步骤时间线(基于 Playbook 文本自动提取)

Options

  • 方案 A(极简内核路线):以 nanobot 类项目为基础,按需增加模块:会话与记忆落盘(SQLite/JSONL)、检索(Chroma/Qdrant/FAISS 或 SQLite FTS)、工具插件目录、OpenTelemetry tracing。
  • 方案 B(成熟框架路线):用 LangChain/LlamaIndex/Haystack 复现原版能力,优先得到稳定的 memory、retriever、tool calling 与生态;代价是抽象层更重、性能与可调试性需额外优化。
  • 方案 C(性能优先路线):若 OpenClaw 主打“快”,重点验证:是否支持流式、并发工具调用、embedding/检索缓存、以及是否减少中间层;当前无法在线核验其实现细节。
  • 分支(若 clawdbot=爬虫/采集 Bot):对比维度改为抓取协议(HTTP/JS 渲染)、反爬、队列与去重、断点续跑与存储;此时“记忆”更多是状态管理而非对话记忆。

Expert Views

  • 开源数据工程师(paraphrase):极简仓库的价值在“可读、可改、可审计”;但要长期可用必须补持久化(SQLite/对象存储)与可观测性(结构化日志/trace)。
  • LLM 应用工程师(paraphrase):核心看 agent loop 是否可控:工具调用的输入输出 schema、错误恢复、最大迭代次数、以及工具结果如何压缩进上下文,决定稳定性与 token 成本。
  • 产品经理(paraphrase):个人场景里“启动快、少配置、能嵌入现有工作流(如 Obsidian)”最重要;团队场景会迅速需要权限、共享与审计。
  • 隐私与安全顾问(paraphrase):一旦引入“记忆”,就要明确哪些内容会发给第三方模型、是否脱敏、API key 如何最小权限与轮换;否则替代品再轻也会变成风险点。

Evidence & Confidence

  • “极简替代品通常保留 agent loop、移除外围集成”:置信度 medium;符合常见开源复刻模式,但未能在线核验 nanobot/OpenClaw 的具体代码结构。
  • “记忆=短期对话历史 + 长期知识库 + 任务状态”的分层:置信度 high;属于通用架构划分,多框架文档与实践一致。
  • “快主要来自并发/流式/缓存与更少抽象层”:置信度 medium;工程上常见,但需要在同一模型基线下做端到端 benchmark。
  • “用能力矩阵 + 3 场景 PoC 最能客观比较”:置信度 high;与具体仓库无关,可复现且易落地。

Next Steps

  • 明确“原版 clawdbot”指向的具体链接/版本,以及你必须保留的 3 项能力(例如:长期记忆、RAG 引用、工具调用)。
  • 补齐 OpenClaw 的一手信息:在 GitHub 搜索项目主页、记录许可证/语言/最近提交;如果只有二手文章,先谨慎评估。
  • 按 Playbook 做一次 PoC:用你自己的 Obsidian 子集(20–50 篇)做索引,测 RAG 质量与引用回溯;并记录对话延迟与成本。
  • 根据缺口定路线:缺持久化与监控就先补 SQLite + 结构化日志/trace;缺权限与多用户就考虑接入成熟框架或直接选更完整的原版。

Details (Optional)

Details

TL;DR

  • 定义:本文将“clawdbot”视为带工具调用与记忆的 LLM 对话式 Agent;非爬虫 Bot(另一种定义见 Options)。
  • “纳米级/极简替代品”通常保留核心 agent loop(对话→调用工具→写回上下文→生成回答),删除 UI、账号、插件生态等外围。
  • 判断与原版差距最可靠的方法:做能力矩阵 + 3 个标准化场景 PoC(纯聊天/工具任务/RAG)。
  • 如果你要个人本地可控与易改代码,优先从 nanobot/OpenClaw 这类极简内核入手;要上生产则需补齐持久化、鉴权、监控等。

Key Insights

  • “最小复刻”往往不是“阉割”,而是把系统拆成:LLM 客户端、提示词/策略、工具适配器、(可选)记忆存储四块;其余全部外置。
  • 记忆可分三层:对话历史(短期)、长期知识库(向量检索/全文检索)、任务状态(plan/step/scratchpad);极简实现常只保留前两者的最小版本。
  • “快”主要来自更少抽象层、并发与流式输出、缓存(embedding/检索结果/工具调用)以及更轻的 Web/CLI 框架;需端到端实测。
  • 选型的关键不是“像不像”,而是你的优先级:可改性/可审计/本地运行 vs 多用户/稳定性/生态与可观测性。

Playbook

  • 统一基线:拉取原版 clawdbot、HKUDS/nanobot、OpenClaw(若有 GitHub 仓库)并锁定 commit hash;记录语言、依赖与启动命令。
  • 做能力矩阵:对话、多轮会话管理、工具调用协议、RAG/索引、长期记忆持久化、UI/API、鉴权、日志与 tracing、部署(Docker/单文件)逐项对照。
  • 代码快速定位:用 ripgrep 搜索关键词 tool/function_call/agent loop/embed/vector/sqlite/qdrant/chroma/FAISS;看是否有会话表、向量库 schema、重试/超时逻辑。
  • 3 场景 PoC:a) 10 轮纯聊天;b) 一个“需要工具”的任务(如读写文件/搜索);c) 导入 20–50 篇 markdown 做 RAG 问答;固定同一模型与参数,记录成功率、平均延迟与成本。

Expert Views

  • 开源数据工程师(paraphrase):极简仓库的价值在“可读、可改、可审计”;但要长期可用必须补持久化(SQLite/对象存储)与可观测性(结构化日志/trace)。
  • LLM 应用工程师(paraphrase):核心看 agent loop 是否可控:工具调用的输入输出 schema、错误恢复、最大迭代次数、以及工具结果如何压缩进上下文,决定稳定性与 token 成本。
  • 产品经理(paraphrase):个人场景里“启动快、少配置、能嵌入现有工作流(如 Obsidian)”最重要;团队场景会迅速需要权限、共享与审计。
  • 隐私与安全顾问(paraphrase):一旦引入“记忆”,就要明确哪些内容会发给第三方模型、是否脱敏、API key 如何最小权限与轮换;否则替代品再轻也会变成风险点。

Options

  • 方案 A(极简内核路线):以 nanobot 类项目为基础,按需增加模块:会话与记忆落盘(SQLite/JSONL)、检索(Chroma/Qdrant/FAISS 或 SQLite FTS)、工具插件目录、OpenTelemetry tracing。
  • 方案 B(成熟框架路线):用 LangChain/LlamaIndex/Haystack 复现原版能力,优先得到稳定的 memory、retriever、tool calling 与生态;代价是抽象层更重、性能与可调试性需额外优化。
  • 方案 C(性能优先路线):若 OpenClaw 主打“快”,重点验证:是否支持流式、并发工具调用、embedding/检索缓存、以及是否减少中间层;当前无法在线核验其实现细节。
  • 分支(若 clawdbot=爬虫/采集 Bot):对比维度改为抓取协议(HTTP/JS 渲染)、反爬、队列与去重、断点续跑与存储;此时“记忆”更多是状态管理而非对话记忆。

Evidence & Confidence

  • “极简替代品通常保留 agent loop、移除外围集成”:置信度 medium;符合常见开源复刻模式,但未能在线核验 nanobot/OpenClaw 的具体代码结构。
  • “记忆=短期对话历史 + 长期知识库 + 任务状态”的分层:置信度 high;属于通用架构划分,多框架文档与实践一致。
  • “快主要来自并发/流式/缓存与更少抽象层”:置信度 medium;工程上常见,但需要在同一模型基线下做端到端 benchmark。
  • “用能力矩阵 + 3 场景 PoC 最能客观比较”:置信度 high;与具体仓库无关,可复现且易落地。

Next Steps

  • 明确“原版 clawdbot”指向的具体链接/版本,以及你必须保留的 3 项能力(例如:长期记忆、RAG 引用、工具调用)。
  • 补齐 OpenClaw 的一手信息:在 GitHub 搜索项目主页、记录许可证/语言/最近提交;如果只有二手文章,先谨慎评估。
  • 按 Playbook 做一次 PoC:用你自己的 Obsidian 子集(20–50 篇)做索引,测 RAG 质量与引用回溯;并记录对话延迟与成本。
  • 根据缺口定路线:缺持久化与监控就先补 SQLite + 结构化日志/trace;缺权限与多用户就考虑接入成熟框架或直接选更完整的原版。

Sources

Sources

Closing Summary

  • 结论:纳米级 clawdbot:对比 nanobot/OpenClaw 与原版差异
  • 下一步:先补齐“原版 clawdbot”的准确链接与需求优先级,再按文中矩阵+PoC对比;你给出跑测结果后可进一步输出最终选型与改造清单。

One next action

先补齐“原版 clawdbot”的准确链接与需求优先级,再按文中矩阵+PoC对比;你给出跑测结果后可进一步输出最终选型与改造清单。