DeepScientist 解构 - VibePaper 专题

参考来源与版本锚定

本页目标不是做产品安利，而是拆清 DeepScientist 的研究控制面：它把哪些科研控制点做成了正式层。

官方来源：ResearAI/DeepScientist、deepscientist.cc、OpenReview paper、中英文 README 与 docs。

本地锚点：reference/reference_agent/DeepScientist/README.md、README_ZH.md、docs/en/12_GUIDED_WORKFLOW_TOUR.md、docs/en/02_START_RESEARCH_GUIDE.md、src/、tests/test_init_and_quest.py、tests/test_memory_and_artifact.py、tests/test_connector_bridges.py。

读法提醒先抓 "quest repo + stage workflow"，再看 connectors 和 UI。不要把它当纯聊天式 research bot。

01 · 为什么 DeepScientist 值得单独拆

它不是"会读 paper 的聊天机器人"，也不只是"自动跑实验的脚本集合"。从 README 和文档看，DeepScientist 真正想做的是一个本地优先的自动科研工作台：每个 quest 都是真实仓库，baseline/experiment/paper output 都落在同一套工程状态里，而且人类可以随时 takeover。

这使它和一般的 research agent 拉开差距。很多系统只负责前半段，例如读论文、提 idea、给 checklist；DeepScientist 则试图把 启动课题、修 baseline、持续试验、整理结果、出图出稿、跨界面跟进 一起做进同一条主流程里。

一句话结论

DeepScientist 是 "研究工作台 + Quest OS"，不是 prompt 框。

02 · 六层结构：它到底在拼什么

01

课题入口层

README 的 paper / repo / natural-language quest 启动方式，定义输入如何变成可执行 quest。

02

Quest 仓库层

one repo per quest；相关 init / git 测试，把研究过程沉淀成真实仓库。

03

研究控制面

src/ 主流程、guided workflow tour、baseline / experiment / write 阶段文档。

04

持久状态层

Findings Memory 与 artifact 相关测试，把实验结论变成 durable state。

05

可见工作区层

Web workspace、Canvas、Studio + Details，确保过程可见。

06

协作与 connector 层

Weixin / QQ / Telegram / Feishu 等 connector 文档与测试，连接外部协作面。

所以 DeepScientist 更像一个 research studio / quest operating system，而不是单纯的研究 prompt 包。

六层架构图

研究循环总览

六层架构 Treemap（可交互下钻）

Treemap 按系统职能分层：大块 = 架构层，叶子 = 层内核心组件；可单击下钻、顶部面包屑返回。数据来自 README 与文档的结构化拆解。

六层架构知识图谱（层间联系）

Treemap 适合看规模，知识图谱更适合看关系。这里把六层分成两种阅读方式：块内结构看每个架构层下面挂了哪些组件；块间联系看各层之间如何互相牵动。

图谱中块内结构来自文档拆解；块间联系是教学向归纳，不是静态 import 图。它的作用是帮助你判断"先看哪里、再看哪里、哪些层要一起读"。

03 · 控制面在哪：不是聊天框，而是 quest + stage workflow

DeepScientist 最关键的判断，是不要把它理解成"一个长上下文聊天窗口"。从 README、Quick Start 和 Guided Workflow Tour 来看，真正的控制面更像是quest 驱动的阶段流程：问题被转成 quest，quest 绑定真实仓库，然后再沿 baseline、experiment、analysis、write 这些阶段往前推进。

也就是说，它的主脑不在某个聊天 UI，而在"研究阶段 + 仓库状态 + 记忆沉淀"这三者的组合里。聊天只是入口之一，真正的系统边界落在 quest repo 和 stage workflow 上。

Stage Flow 速览

Quest 初始化

Baseline 复现

Experiment 轮次

Analysis / Write

Quest 初始化

输入可以是 paper、repo URL 或自然语言描述。系统将其转为一个独立 quest 仓库，包含初始目录结构、依赖配置和阶段标记。

输入类型：arXiv URL / GitHub repo / 自然语言 goal
输出产物：quest/ 目录、README.quest.md、初始状态文件
关键控制点：one repo per quest，确保隔离与版本化

Baseline 复现

复现基准结果，建立可比较的实验起点。失败 here 比失败 later 成本低得多。

核心动作：运行 baseline 代码、记录指标、确认可复现
输出产物：baseline/ 目录、指标日志、依赖锁定
关键控制点：baseline 必须可复现，否则后续实验无意义

Experiment 轮次

在 baseline 基础上做可控改动，每轮只改一处，记录 delta 与观察。

核心动作：设计变量、执行实验、收集结果、对比 baseline
输出产物：experiments/ 目录、每轮参数与结果、失败记录
关键控制点：Findings Memory 自动沉淀，失败也写回去

Analysis / Write

从实验结论中提取可发表的论证链，生成图表、报告与 paper draft。

核心动作：分析实验数据、生成可视化、撰写章节
输出产物：figures/、reports/、paper_draft.md
关键控制点：human takeover anytime，人类随时可介入修改

1 / 4

03B · 研究阶段步进：从 Quest 到 Paper 的 4 个阶段

DeepScientist 的核心控制面不是聊天框，而是这条 quest → baseline → experiment → write 的阶段流水线。点击下方步骤标签，或按 ← → Space 键盘操作，播放自动步进。

04 · 核心资产：Quest repo + Findings Memory + Paper outputs

README 里最值得抓的一句是 one repo per quest。这意味着它没有把研究过程存在抽象数据库里，而是尽量让分支、worktree、文件、artifact 自己表达研究结构。再叠加 Findings Memory 和 artifact 相关测试，可以看出它在努力做一件很重要的事：把"失败了什么、修好了什么、哪个实验值得保留、哪段论证已经成型"都变成下一轮可复用输入。

真正难的不是把摘要扩成 introduction，而是让 baseline、实验、分析、图表和文稿共享同一份上下文主线。DeepScientist 的价值，就在于它试图把这些资产收拢回 quest repo 内部。

资产闭环

Quest repo 是载体，Findings Memory 与 Paper outputs 是可复用资产。

04B · Stage 与资产映射表

每个研究阶段对应的核心资产与参考文档。点击文档链接可查看 DeepScientist 官方指南。

阶段	核心资产	参考文档	关键控制点
Quest 初始化	`quest/`、`README.quest.md`、初始状态文件	02_START_RESEARCH_GUIDE、00_QUICK_START	one repo per quest，确保隔离与版本化
Baseline 复现	`baseline/`、指标日志、依赖锁定	12_GUIDED_WORKFLOW_TOUR、13_CORE_ARCHITECTURE	baseline 必须可复现，否则后续实验无意义
Experiment 轮次	`experiments/`、每轮参数与结果、失败记录	12_GUIDED_WORKFLOW_TOUR、06_RUNTIME_AND_CANVAS、07_MEMORY_AND_MCP	Findings Memory 自动沉淀，失败也写回去
Analysis / Write	`figures/`、`reports/`、`paper_draft.md`	12_GUIDED_WORKFLOW_TOUR、08_FIGURE_STYLE_GUIDE、26_CITATION	human takeover anytime，人类随时可介入修改

05 · Web、Canvas、TUI、Connectors：它为什么不像黑盒

很多自动科研系统一旦跑起来，最大的心理阻力就是"我不知道它在干嘛"。DeepScientist 在产品叙事上刻意回避这一点：README 反复强调 visible research progress、web workspace、canvas、studio details、human takeover anytime，说明它把"过程可见"本身当成产品基线。

再加上 Weixin、QQ、Telegram、Feishu 等 connector 文档与测试，可以看出它不是只考虑单机 UI，而是在设计"研究工作如何被外部协作面持续看到"。

可见工作区清单

Web workspace / Canvas
Studio + Details
Connector feeds
Human takeover anytime

核心系统组件（分组地图）

DeepScientist 的核心不是单一聊天框，而是一套由 Quest OS、持久状态、可见工作区、连接器 拼成的研究操作系统。下列组件按职能分组，便于对照官方文档与源码阅读。

05B · Connector 与 Tool Catalog

DeepScientist 不是单一入口的黑盒，而是多面协作系统。下图按外部连接器、界面层、核心系统、研究阶段四类整理其组件目录。颜色区分职能，悬停可查看职责标签。

图集 · 研究产品的可视证据

下面这些截图来自 DeepScientist 官方素材与 README 资源，用来直观看到"可见工作区"与"研究过程可视化"到底长什么样。

DeepScientist 主页与工作区入口 — 主页与工作区入口，强调 quest 驱动与本地研究流程。

Start Research 引导界面 — 研究启动向导，展示 quest 初始化的核心步骤。

Studio Details 视图 — Studio + Details 强调"阶段与资产"而非单次对话。

06 · 研究循环：从 Quest 到 Paper 再到新 Quest

DeepScientist 的核心不是一次性跑完实验出图，而是把 quest → baseline → experiment → write → feedback 做成可持续循环。下面为讲解型步进演示，可点步骤标签、播放/暂停、倍速与键盘 ← →、Space。

末步点播放会先回到第 1 步再自动翻页。meta.loop_autoplay 为 true 时会在末步后接回第 1 步。系统开启减少动态效果时会拉长间隔并弱化动效。非真实运行时遥测。

它和 Autoresearch 的根本差异

维度	Autoresearch	DeepScientist
主隐喻	plugin / command surface / verify loop	local-first research studio / quest repo
控制面	命令协议与机械验证链	quest + stage workflow + visible workspace
持久状态	更偏 checklist、log、improvement protocol	更偏 repo、memory、artifact、paper-facing outputs
适合学什么	怎么把研究动作拆成可验证循环	怎么把整条研究链做成可长期运行的工作台

所以 VibePaper 这条线不能只写一个总评。Autoresearch 和 DeepScientist 看的是同一个问题，但把问题切开的方式完全不同：一个更像"研究循环协议"，一个更像"研究工作台操作层"。

07 · 对我们自己的站点和值得学什么

第一，如果要讲自动科研，不能只讲模型和 prompt，要讲 quest repo、artifact、memory 和人类 takeover 这些 durable state。

第二，专题页不能只做项目清单，更应该拆"控制面在哪里、持久状态是什么、哪些值得变成教程"。

第三，VibePaper 后续可以沿两条线继续长：一条是像 Autoresearch 这样的 research loop 协议；另一条是像 DeepScientist 这样的 research studio。

第四，对我们自己的 codex-loop 来说，最值得学的不是整套产品壳，而是"如何把 loop 的结果沉淀回 durable research assets，而不是只停在 chat transcript 里"。

08 · 实验与代码中存在的未来能力

DeepScientist 仓库内存在特性开关、扩展接口或未默认开启的能力。下列卡片按「代码中已有痕迹 / 架构已预留」的标准筛选。是否在你使用的版本中可用，请以官方发布说明为准；此处仅帮助读源码时「知道该搜什么关键词」。

阅读时配合官方 CHANGELOG，避免把实验实现当成稳定契约。
连接器扩展见 tests/ 与 connector 相关测试文件。

参考与原始链接

ResearAI/DeepScientist
DeepScientist 官网
OpenReview 论文
reference/reference_agent/DeepScientist/README.md
reference/reference_agent/DeepScientist/README_ZH.md
reference/reference_agent/DeepScientist/docs/en/12_GUIDED_WORKFLOW_TOUR.md
reference/reference_agent/DeepScientist/docs/en/02_START_RESEARCH_GUIDE.md
reference/reference_agent/DeepScientist/src/
reference/reference_agent/DeepScientist/tests/test_init_and_quest.py
reference/reference_agent/DeepScientist/tests/test_memory_and_artifact.py

下一步建议：把六层架构图补齐，让"研究工作台"结构一眼可见。

DeepScientist
解构

核心判断

关键资产

最值得学

参考来源与版本锚定

01 · 为什么 DeepScientist 值得单独拆

一句话结论

02 · 六层结构：它到底在拼什么

课题入口层

Quest 仓库层

研究控制面

持久状态层

可见工作区层

协作与 connector 层

六层架构图

研究循环总览

六层架构 Treemap（可交互下钻）

六层架构知识图谱（层间联系）

03 · 控制面在哪：不是聊天框，而是 quest + stage workflow

Stage Flow 速览

Quest 初始化

Baseline 复现

Experiment 轮次

Analysis / Write

03B · 研究阶段步进：从 Quest 到 Paper 的 4 个阶段

04 · 核心资产：Quest repo + Findings Memory + Paper outputs

资产闭环

04B · Stage 与资产映射表

05 · Web、Canvas、TUI、Connectors：它为什么不像黑盒

可见工作区清单

核心系统组件（分组地图）

05B · Connector 与 Tool Catalog

图集 · 研究产品的可视证据

06 · 研究循环：从 Quest 到 Paper 再到新 Quest

它和 Autoresearch 的根本差异

07 · 对我们自己的站点和值得学什么

08 · 实验与代码中存在的未来能力

参考与原始链接