Auto-Research In Sleep 更像面向科研的 in-sleep system,
而 codex-loop 已经长成面向工程、站点、内容和发布的 通用长循环壳。
这一页不只是比较谁更强,而是要讲清:我们已经有哪些 sleep 能力,以及 还该从 ARIS 借哪几层。
| 能力层 | ARIS / Auto-Research In Sleep | 对 codex-loop 的启发 |
|---|---|---|
| workflow family | idea-discovery、experiment-bridge、auto-review-loop、paper-writing、rebuttal |
不只保留一个 loop 壳,而是继续长出 site-growth、publish-loop、reference-mining 等专门 workflow。 |
| persistent wiki | research-wiki 会沉淀 paper、idea、negative results 和 anti-repeat memory |
从 plan/evolution 再往外长一层 project wiki / topic memory / failed-attempt memory。 |
| meta optimize | meta-optimize 会根据技能调用、失败日志和覆盖情况反向改技能 |
让运行日志不只是记录,而是反过来推动 prompt、skill、plan 的外层自优化。 |
| watchdog health layer | 单独的 watchdog.py 负责 session / download / GPU / idle 健康监控 |
把执行 daemon 与健康 watchdog 拆开,避免所有监控都挤在主循环里。 |
| cross-model review | 明确强调 executor / reviewer 可以来自不同模型族 | 后面可以把 codex-loop 长成 executor、critic、publish reviewer 三种角色分工。 |
[插图提示词]
用途:画 ARIS 到 codex-loop 的“可借鉴能力梯子”。
形式:五层能力梯子图;Mermaid 适合。
提示词:左列放 ARIS,右列放 codex-loop,中间用五条横向梯子连接:workflow family、persistent wiki、meta optimize、watchdog health layer、cross-model review。ARIS 一侧标出对应模块名,codex-loop 一侧标出当前状态(已有 / 部分已有 / 缺失 / 待建设)。
Mermaid 更适合:是。
| 层 | 当前状态 | 缺口 | 这次的最小回写 |
|---|---|---|---|
| logs | 已有 tick logs、evolution notes、handoff | 记录很多,但没有把重复低效点收敛成固定候选规则 | 要求每轮只提炼一条 loop improvement candidate |
| prompt | 主 prompt 已经能约束 task selection 和 publishing window | prompt 变更更多是人工临时补充,缺少“何时允许写回 prompt”的门槛 | 增加“重复出现或能改善下一 tick 才能升级到 prompt”的规则 |
| skill / plan | 会按 skill 执行,也会更新 active plan | 缺少把 loop-level 经验沉淀成可复用操作约束的薄层 | 先把 meta-opt 定位成短规则回写,而不是大而全的新系统 |
| 层 | 当前承载 | 角色 | 为什么先这样定 |
|---|---|---|---|
| topic wiki | site/md/topic-*.md + site/topic-*.html |
对外稳定知识面 | 每个长期子专题已经有稳定 URL、结构和读者语义 |
| working memory | .claude/plans/loloop/active-*.md |
当前线程的执行上下文 | 最适合放 active focus、checklist、scope 和 routing rule |
| failed-attempt memory | .claude/plans/loloop/evolution-*.md |
anti-repeat memory | bounded pass 的 failed / deferred / decision 已经是“别重复踩坑”的最小单元 |
| 层 | 主要职责 | 不该承担什么 | 当前 codex-loop 对应物 |
|---|---|---|---|
| daemon | 驱动 tick、选任务、推进 handoff、维护主循环节奏 | 不该把所有健康探测和人工操作入口都塞进自己 | .codex-loop/prompt.md + daemon tick / thread resume 约束 |
| workspace | 给操作者看状态、改计划、写 evolution、做局部控制 | 不该替代主循环做全局调度,也不该自己判断长期健康 | site/app-likecode-workspace.html + relay shell |
| watchdog | 低频、独立、面向异常的健康检查与告警 | 不该承担内容生产、任务选择或富交互工作台职责 | 目前还没有独立层,只是一个明确缺口 |