gstack 深度研究：YC CEO 的 Claude Code 工作流——把一个 AI 变成一支团队

> 来源: https://github.com/garrytan/gstack

> 作者: Garry Tan（Y Combinator President & CEO）

> 参考: https://medium.com/coding-nexus/the-y-combinator-ceo-crushed-100-prs-in-7-days-with-claude-code-heres-his-exact-setup-42231b8dcf2b

> 配套工具: https://conductor.build （并行多 Agent 编排器）

> 研究时间: 2026-03-17

🎯 一句话版本

YC 的 CEO Garry Tan 把 Claude Code 从"一个通用助手"变成了"一支虚拟团队"——13 个 slash 命令让你按需召唤 CEO（产品直觉）、工程经理（架构设计）、Staff 工程师（代码审查）、QA 工程师（自动测试）、发布经理（一键发布）等不同角色。他用这套系统 7 天提交了 100 个 PR。

🏗️ 核心理念：认知模式切换

gstack 的核心洞见很简单：

> Planning 不是 Review。Review 不是 Shipping。Founder taste 不是 engineering rigor。如果把这些模糊在一起，你通常会得到一个四不像。

所以他给 Claude Code 设计了"显式的档位"——不同任务切换不同的"大脑模式"。

📋 13 个 Skills 详解

规划阶段（Plan Mode）

Skill	角色	做什么
`/plan-ceo-review`	创始人/CEO	重新思考问题本身。不接受字面需求，找到"10 星版本"的产品。Brian Chesky 模式。
`/plan-eng-review`	工程经理/Tech Lead	锁定架构、数据流、状态机图、边界情况、测试矩阵
`/plan-design-review`	高级产品设计师	80 项检查清单、字母评级、AI Slop 检测、DESIGN.md 推断。只报告不改代码。
`/design-consultation`	设计顾问	从零构建完整设计系统——研究竞品、提出美学/排版/颜色/间距/动效方案、生成预览页、写 DESIGN.md

开发阶段

Skill	角色	做什么
`/review`	偏执的 Staff 工程师	找到通过 CI 但在生产环境爆炸的 bug。分诊 Greptile review 评论。
`/ship`	发布工程师	同步 main、跑测试、解决 review、push、开 PR。6 个工具调用搞定。

QA 阶段

Skill	角色	做什么
`/browse`	QA 工程师	给 Agent 装上眼睛——登录、点击、截图、抓 breakage。60 秒完成完整 QA。
`/qa`	QA + 修复工程师	测试 → 发现 bug → 修复（原子 commit）→ 重新验证。三档：Quick/Standard/Exhaustive。
`/qa-only`	QA 报告员	只报告不修复。纯 bug 报告。
`/qa-design-review`	设计师 + 前端工程师	设计审计 + 自动修复。原子 `style(design):` commits，前后截图对比。
`/setup-browser-cookies`	Session 管理	从真实浏览器（Chrome/Arc/Brave/Edge）导入 cookies 到 headless session

收尾阶段

Skill	角色	做什么
`/retro`	工程经理	团队复盘：深度分析 + 每个贡献者的表扬和成长建议
`/document-release`	技术作家	更新 README/ARCHITECTURE/CONTRIBUTING 等文档

🔥 亮点分析

1. "AI Slop 检测"

/plan-design-review 里有一个我没见过的概念——AI Slop Score。它专门检测 AI 生成的设计是否有"AI 味"：

> 评级示例：

> - Design Score: B

> - AI Slop Score: C

> - "我注意到三列图标网格、紫色渐变、千篇一律的 CTA——如果用一个词描述这个网站：template。"

这是对抗 AI 生成物同质化的一个有趣方向。

2. /plan-ceo-review 的"10 星产品"思维

来自 Brian Chesky（Airbnb CEO）的方法论——不是实现字面需求，而是问"真正的产品是什么"：


你说：让卖家上传一张商品照片
普通 AI：加一个文件选择器，保存图片
/plan-ceo-review：照片上传不是功能。真正的工作是帮卖家创建能卖出去的 listing。
→ 自动识别产品 → 拉取规格和价格对比 → 起草标题和描述 → 建议最佳主图

3. Conductor：一人十 Agent

gstack 配合 Conductor（Mac app）可以同时运行 10 个 Claude Code session，每个在独立 workspace：

Session 1: /qa 测试 staging
Session 2: /review 审查 PR
Session 3: 实现新功能
Session 4-10: 其他分支上的任务

每个 workspace 有独立的 Chromium 实例——独立进程、cookies、标签页、日志，互不干扰。

4. 安装的巧妙设计


~/.claude/skills/gstack/   ← 全局安装
.claude/skills/gstack/     ← 项目级安装（提交到 repo，团队共享）

项目级安装用 cp -Rf 而不是 git submodule——git clone 直接就能用，不需要额外步骤。二进制和 node_modules 被 gitignore。

🤔 深度分析

gstack vs OpenClaw Skills

	gstack	OpenClaw Skills
目标	Claude Code slash commands	OpenClaw 工作流
运行环境	本地 Claude Code CLI	远程/本地 OpenClaw Gateway
认知模式	预定义 13 种角色	自定义 Skill 文件
浏览器	内建 Playwright 二进制	OpenClaw 内建 browser 工具
并行	Conductor（Mac app）	OpenClaw sub-agents
持久化	无（session 结束就没了）	有（MEMORY.md + 文件系统）
适合	编码为主的开发者	全能 Agent（编码 + 研究 + 运维 + 通信）

关键区别：gstack 是为"编码→审查→发布"这个循环优化的。OpenClaw 是更通用的 Agent 平台。两者不冲突。

可借鉴的设计

1. 认知模式分离 — 我们的 AGENTS.md 可以考虑类似设计，不同任务用不同的 system prompt 指导

2. AI Slop 检测 — 对我们生成的报告也适用，可以加一个"模板化检测"

3. Atomic commits — /qa 每修一个 bug 一个独立 commit，审计友好

4. 前后对比截图 — /qa-design-review 修改前后截图对比，直观

局限性

仅限 Claude Code — 不支持 Codex、OpenCode 或其他 Agent
重编码轻研究 — 13 个 skill 全是编码流程，没有研究/分析/写作相关
Conductor 闭源 — 核心的并行编排器是商业产品（Mac app）
Bun 依赖 — 需要 Bun v1.0+，不是所有环境都有
无记忆 — session 之间没有持久记忆（vs OpenClaw 的 MEMORY.md）

💡 与我们的关联

1. "认知模式"可以借鉴

我们的 OpenClaw Agent 现在是"一个大脑做所有事"。可以考虑 gstack 的思路——给不同任务定义不同的认知模式：


/research-deep   → 深度研究模式（当前默认）
/research-quick  → 快速摘要模式
/review-code     → 代码审查模式
/review-design   → 设计审查模式

2. AI Slop 检测值得做

我们生成大量报告，确实可能出现"模板化"问题。可以借鉴 gstack 的 AI Slop Score，定期检查报告质量。

3. Conductor 的理念我们已经有了

OpenClaw 的 sub-agent 系统 + ACP 就是 Conductor 的等价物——多个 Agent 并行在独立 workspace。而且我们的更灵活（不限 Mac，支持多种 Agent 后端）。

4. 安装方式值得参考

gstack 的"复制到项目目录 + gitignore 二进制"模式比 git submodule 更友好，我们的 Skills 安装可以学习这个设计。

📊 评分

维度	评分（/10）
实用性	9.0 — 即装即用，真实场景验证（YC CEO 日常使用）
创新度	7.5 — "认知模式切换"是好洞见，但本质是精心设计的 prompt
开源程度	8.0 — Skills 全开源，Conductor 闭源
生态影响	8.5 — YC CEO 背书 + 已有第三方文章/介绍站，社区增长快
与我们的关联	7.0 — 理念可借鉴，但我们用 OpenClaw 不用 Claude Code CLI
综合	8.0

报告由深度研究助手自动生成 | 2026-03-17

来源: https://github.com/garrytan/gstack

评分

维度	分数	说明
创意	?/10
技术深度	?/10
实用性	?/10
影响力	?/10
数据支撑	?/10
与我们的相关性	?/10
综合	?/10	需要后续评估

> 一句话总结：（报告的核心价值与我们的关联）

评分

维度	分数	说明
创意	?/10
技术深度	?/10
实用性	?/10
影响力	?/10
数据支撑	?/10
与我们的相关性	?/10
综合	?/10	需要后续评估

> 一句话总结：（报告的核心价值与我们的关联）