gstack 深度研究:YC CEO 的 Claude Code 工作流——把一个 AI 变成一支团队

> 来源: https://github.com/garrytan/gstack

> 作者: Garry Tan(Y Combinator President & CEO)

> 参考: https://medium.com/coding-nexus/the-y-combinator-ceo-crushed-100-prs-in-7-days-with-claude-code-heres-his-exact-setup-42231b8dcf2b

> 配套工具: https://conductor.build (并行多 Agent 编排器)

> 研究时间: 2026-03-17

🎯 一句话版本

YC 的 CEO Garry Tan 把 Claude Code 从"一个通用助手"变成了"一支虚拟团队"——13 个 slash 命令让你按需召唤 CEO(产品直觉)、工程经理(架构设计)、Staff 工程师(代码审查)、QA 工程师(自动测试)、发布经理(一键发布)等不同角色。他用这套系统 7 天提交了 100 个 PR。

🏗️ 核心理念:认知模式切换

gstack 的核心洞见很简单:

> Planning 不是 Review。Review 不是 Shipping。Founder taste 不是 engineering rigor。如果把这些模糊在一起,你通常会得到一个四不像。

所以他给 Claude Code 设计了"显式的档位"——不同任务切换不同的"大脑模式"。

📋 13 个 Skills 详解

规划阶段(Plan Mode)

Skill角色做什么
`/plan-ceo-review`创始人/CEO**重新思考问题本身**。不接受字面需求,找到"10 星版本"的产品。Brian Chesky 模式。
`/plan-eng-review`工程经理/Tech Lead锁定架构、数据流、状态机图、边界情况、测试矩阵
`/plan-design-review`高级产品设计师80 项检查清单、字母评级、**AI Slop 检测**、DESIGN.md 推断。只报告不改代码。
`/design-consultation`设计顾问从零构建完整设计系统——研究竞品、提出美学/排版/颜色/间距/动效方案、生成预览页、写 DESIGN.md

开发阶段

Skill角色做什么
`/review`偏执的 Staff 工程师找到通过 CI 但在生产环境爆炸的 bug。分诊 Greptile review 评论。
`/ship`发布工程师同步 main、跑测试、解决 review、push、开 PR。6 个工具调用搞定。

QA 阶段

Skill角色做什么
`/browse`QA 工程师**给 Agent 装上眼睛**——登录、点击、截图、抓 breakage。60 秒完成完整 QA。
`/qa`QA + 修复工程师测试 → 发现 bug → 修复(原子 commit)→ 重新验证。三档:Quick/Standard/Exhaustive。
`/qa-only`QA 报告员只报告不修复。纯 bug 报告。
`/qa-design-review`设计师 + 前端工程师设计审计 + 自动修复。原子 `style(design):` commits,前后截图对比。
`/setup-browser-cookies`Session 管理从真实浏览器(Chrome/Arc/Brave/Edge)导入 cookies 到 headless session

收尾阶段

Skill角色做什么
`/retro`工程经理团队复盘:深度分析 + 每个贡献者的表扬和成长建议
`/document-release`技术作家更新 README/ARCHITECTURE/CONTRIBUTING 等文档

🔥 亮点分析

1. "AI Slop 检测"

/plan-design-review 里有一个我没见过的概念——AI Slop Score。它专门检测 AI 生成的设计是否有"AI 味":

> 评级示例:

> - Design Score: B

> - AI Slop Score: C

> - "我注意到三列图标网格、紫色渐变、千篇一律的 CTA——如果用一个词描述这个网站:template。"

这是对抗 AI 生成物同质化的一个有趣方向。

2. /plan-ceo-review 的"10 星产品"思维

来自 Brian Chesky(Airbnb CEO)的方法论——不是实现字面需求,而是问"真正的产品是什么":


你说:让卖家上传一张商品照片
普通 AI:加一个文件选择器,保存图片
/plan-ceo-review:照片上传不是功能。真正的工作是帮卖家创建能卖出去的 listing。
→ 自动识别产品 → 拉取规格和价格对比 → 起草标题和描述 → 建议最佳主图

3. Conductor:一人十 Agent

gstack 配合 Conductor(Mac app)可以同时运行 10 个 Claude Code session,每个在独立 workspace:

每个 workspace 有独立的 Chromium 实例——独立进程、cookies、标签页、日志,互不干扰。

4. 安装的巧妙设计


~/.claude/skills/gstack/   ← 全局安装
.claude/skills/gstack/     ← 项目级安装(提交到 repo,团队共享)

项目级安装用 cp -Rf 而不是 git submodule——git clone 直接就能用,不需要额外步骤。二进制和 node_modules 被 gitignore。

🤔 深度分析

gstack vs OpenClaw Skills

gstackOpenClaw Skills
**目标**Claude Code slash commandsOpenClaw 工作流
**运行环境**本地 Claude Code CLI远程/本地 OpenClaw Gateway
**认知模式**预定义 13 种角色自定义 Skill 文件
**浏览器**内建 Playwright 二进制OpenClaw 内建 browser 工具
**并行**Conductor(Mac app)OpenClaw sub-agents
**持久化**无(session 结束就没了)有(MEMORY.md + 文件系统)
**适合**编码为主的开发者全能 Agent(编码 + 研究 + 运维 + 通信)

关键区别:gstack 是为"编码→审查→发布"这个循环优化的。OpenClaw 是更通用的 Agent 平台。两者不冲突。

可借鉴的设计

1. 认知模式分离 — 我们的 AGENTS.md 可以考虑类似设计,不同任务用不同的 system prompt 指导

2. AI Slop 检测 — 对我们生成的报告也适用,可以加一个"模板化检测"

3. Atomic commits/qa 每修一个 bug 一个独立 commit,审计友好

4. 前后对比截图/qa-design-review 修改前后截图对比,直观

局限性

💡 与我们的关联

1. "认知模式"可以借鉴

我们的 OpenClaw Agent 现在是"一个大脑做所有事"。可以考虑 gstack 的思路——给不同任务定义不同的认知模式:


/research-deep   → 深度研究模式(当前默认)
/research-quick  → 快速摘要模式
/review-code     → 代码审查模式
/review-design   → 设计审查模式

2. AI Slop 检测值得做

我们生成大量报告,确实可能出现"模板化"问题。可以借鉴 gstack 的 AI Slop Score,定期检查报告质量。

3. Conductor 的理念我们已经有了

OpenClaw 的 sub-agent 系统 + ACP 就是 Conductor 的等价物——多个 Agent 并行在独立 workspace。而且我们的更灵活(不限 Mac,支持多种 Agent 后端)。

4. 安装方式值得参考

gstack 的"复制到项目目录 + gitignore 二进制"模式比 git submodule 更友好,我们的 Skills 安装可以学习这个设计。

📊 评分

维度评分(/10)
实用性9.0 — 即装即用,真实场景验证(YC CEO 日常使用)
创新度7.5 — "认知模式切换"是好洞见,但本质是精心设计的 prompt
开源程度8.0 — Skills 全开源,Conductor 闭源
生态影响8.5 — YC CEO 背书 + 已有第三方文章/介绍站,社区增长快
与我们的关联7.0 — 理念可借鉴,但我们用 OpenClaw 不用 Claude Code CLI
**综合****8.0**

报告由深度研究助手自动生成 | 2026-03-17

来源: https://github.com/garrytan/gstack