VibePaper · 子专题 Plugin Loop / Verify Protocol

Autoresearch / ARIS
解构

如果说 DeepScientist 更像把自动科研做成一个本地研究工作台,
那么 Autoresearch / ARIS 走的是更轻的一条路:把 goal、metric、scope、verify、rollback、git memory 收成一个 plugin-style 的研究循环协议。

5层结构
9子命令
5loop 要素
1研究协议
goal metric scope verify rollback
Loop Contract 把改进愿望压成可验证循环
Command Surface plan / debug / ship / learn
Git Memory 小步改动、验证、保留或回滚
CONTROL 控制面不是 UI,是 loop contract

goal、metric、scope、verify、rollback 决定这一轮能不能继续。

SURFACE 子命令是协议分叉,不是功能菜单

debug / ship / learn / reason 都是在同一回路上换任务语境。

STATE git memory 负责留下可追溯的进展

验证通过就沉淀,验证失败就回滚,避免研究漂移。

参考来源与版本锚定

本页目标不是重复 README 的安装说明,而是把 Autoresearch / ARIS 拆成适合站内教学的结构图:它到底把哪些研究控制点做成了协议,哪些部分仍依赖 Claude Code 的宿主能力。

官方来源uditgoenka/autoresearch、README、COMPARISON,以及 Karpathy autoresearch 的方法源头;当前也补充对照 wanshuiyin/Auto-claude-code-research-in-sleep,作为 ARIS(Auto-Research In Sleep) 这条延伸分支。

本地锚点reference/reference_agent/autoresearch/README.mdCOMPARISON.mdclaude-plugin/.claude-plugin/plugin.jsonclaude-plugin/skills/autoresearch/SKILL.mdclaude-plugin/commands/autoresearch/guide/,以及 reference/reference_agent/aris/README.mdskills/docs/templates/

01 · 为什么 Autoresearch / ARIS 值得单独拆

Autoresearch / ARIS 最值得讲的,不是“它有很多子命令”,而是它把一个原本很散的研究 / 改进过程,压缩成了一套很清晰的 loop 协议:先定义 goal、metric、scope、verify,再让系统在小步修改、机械验证、自动回滚和 git memory 之间持续迭代。

这使它更像一个研究循环协议层,而不是厚重工作台。它依赖 Claude Code 作为宿主,但在宿主之上补了一层“如何定义研究改进问题并持续迭代”的方法面。

02 · 先拆成五层:Autoresearch 到底在拼什么

05 Guide / Comparison 知识与文档层
04 plan · debug · ship · learn · reason 子命令协议面
03 /autoresearch main loop one change → verify → keep / rollback
02 goal · metric · scope · verify · rollback loop contract
01 Claude Code host 会话、文件、命令、git 能力
层次关键锚点解决的问题
宿主层Claude Code / plugin 安装路径循环并不是自己凭空运行,而是借宿主的会话、文件与命令能力
协议层README 的 goal / metric / scope / verify / rollback / git memory如何把“改进”定义成可机械验证的任务
主循环层/autoresearch 主命令与 guide/autoresearch.md如何做 one change per iteration、验证、保留或回滚
子命令面plan / security / ship / debug / fix / scenario / predict / learn / reason把不同研究或发货动作拆成可复用 protocol
知识与文档层guide/、references、COMPARISON让这个 loop 不只是 prompt,而是一套可教学、可演化的方法系统

所以 Autoresearch / ARIS 更像一个 plugin-style research loop protocol,而不是完整 studio。

[插图提示词]

用途:画出 Autoresearch 的五层总图,让读者先分清宿主、协议、主循环、子命令面和知识层。

形式:分层结构图;优先 Mermaid。

提示词:画一个 Autoresearch 五层架构图,底部是 Claude Code 宿主能力,中间是 goal/metric/scope/verify/rollback/git memory 协议层,再上面是 /autoresearch 主循环,右侧展开 plan/security/ship/debug/fix/scenario/predict/learn/reason 子命令面,顶部是 guide 和 comparison 文档层,箭头标出配置、迭代、验证、回滚和日志沉淀。

Mermaid 更适合:是。

03 · 它的控制面到底在哪:不是界面,而是那套 loop contract

Autoresearch / ARIS 的主脑不在某个页面,也不在某个 dashboard,而在那套很明确的 contract:goal、metric、scope、verify、guard、rollback、git memory。只要这些条件定义清楚,它就能把“一个模糊的改进愿望”转成连续迭代的问题。

也正因为这样,它特别适合做方法教学。和厚重 studio 相比,Autoresearch / ARIS 的优点是:你更容易一眼看清“系统到底靠什么在继续迭代”。它的控制点非常显式,没有太多 UI 壳层把真正逻辑藏起来。

04 · 九条子命令不是散功能,而是扩展协议面

README 列出的 plansecurityshipdebugfixscenariopredictlearnreason,表面看像工具箱,实际更像围绕同一套 loop contract 做的不同子协议。

子命令它扩展的是哪一面更像什么
plan把目标转成可验证配置配置向导
debug / fix把循环转到 bug hunting / repair问题追猎协议
security把循环转到 STRIDE / OWASP / red team安全审计协议
ship把循环转到发货与上线shipping protocol
scenario / predict / reason把循环扩到边界场景、多视角预测和主观辩论探索与论证协议
learn把循环转到文档与知识沉淀知识维护协议

所以它的“命令很多”并不等于功能堆砌,反而说明它试图把同一种研究 loop 扩展到多个高频任务域里。ARIS 这条分支则进一步把这种方法包装成更强调“睡觉时持续推进”的叙事和更广的跨代理适配层。

05 · 它和 DeepScientist 的根本差异:研究协议 vs 研究工作台

下方为讲解型步进演示(数据来自 site/data/aris-loop-steps.json):可点步骤标签、播放/暂停、倍速与键盘 Space。步骤条下方彩色细条为下一帧倒计时;末步点播放会先回到第 1 步再自动翻页。真实运行时遥测。

维度Autoresearch / ARISDeepScientist
主隐喻plugin / command surface / loop contractquest repo / local-first research studio
控制面goal + metric + verify + rollbackquest + stage workflow + visible workspace
持久状态更偏 git history、logs、机械验证结果更偏 repo、memory、artifact、paper outputs
适合学什么怎么把研究问题定义成可迭代协议怎么把整条研究链做成工作台

这也是为什么 `VibePaper` 需要同时保留两条线。Autoresearch / ARIS 适合拿来教“研究 loop 的 contract 是什么”,DeepScientist 则适合拿来教“如果把这套 contract 做成真正的工作台,会多出哪些层”。

06 · 对我们自己的站点和值得学什么

第一,自动科研系统不一定都要先做厚 UI。Autoresearch / ARIS 证明,先把 loop contract 讲清楚,也能形成非常强的方法系统。

第二,站内教程可以直接借它的结构:goal、metric、scope、verify、rollback、git memory 这些概念很适合做成教学骨架。

第三,后续 VibePaper 的比较页应该继续围绕“控制面在哪里、持久状态是什么、是否需要厚工作台”来写,而不是只比 feature list。

参考与原始链接

  • uditgoenka/autoresearch
  • wanshuiyin/Auto-claude-code-research-in-sleep (ARIS)
  • Karpathy autoresearch
  • reference/reference_agent/autoresearch/README.md
  • reference/reference_agent/autoresearch/COMPARISON.md
  • reference/reference_agent/autoresearch/claude-plugin/.claude-plugin/plugin.json
  • reference/reference_agent/autoresearch/claude-plugin/skills/autoresearch/SKILL.md
  • reference/reference_agent/autoresearch/claude-plugin/commands/autoresearch/
  • reference/reference_agent/autoresearch/guide/
  • reference/reference_agent/aris/README.md
  • reference/reference_agent/aris/skills/
  • reference/reference_agent/aris/docs/