Daytona — AI Agent 的安全代码执行基础设施
> 一句话版本:给 AI Agent 用的"云端虚拟机"——90ms 内创建隔离沙箱,Agent 可以在里面执行代码、操作文件、控制桌面,而且安全隔离不会搞坏你的主系统。72K Stars,$3100 万融资。
| 项目 | 信息 | |
|---|---|---|
| 来源 | https://github.com/daytonaio/daytona | |
| 官网 | https://www.daytona.io | |
| 创建时间 | 2024-02-06 | |
| Stars | 72,331 | Forks 5,549 |
| 语言 | TypeScript | |
| 许可证 | AGPL-3.0 | |
| 融资 | $3100 万(3 轮,最新 2026-02 Series A $2400 万) | |
| 领投 | FirstMark Capital | |
| 最新推送 | 2026-04-14(持续活跃) | |
| 客户 | CoreWeave、Parabola |
核心内容
一、Daytona 是什么?
Daytona 是一个AI Agent 的安全代码执行沙箱平台。核心能力:让 AI Agent(如 Claude Code、Codex、GPT-5)生成的代码在一个隔离的、有状态的、可编程控制的环境中运行。
一句话理解:如果 AI Agent 是"大脑",Daytona 就是"手脚 + 工作台"——大脑想好代码,Daytona 提供安全的场地来执行。
二、核心能力
1. 沙箱创建(< 90ms 冷启动)
每个沙箱是一个完整的隔离环境:
- 独立内核、文件系统、网络栈
- 分配的 vCPU、RAM、磁盘
- 支持 Linux / macOS / Windows 三种桌面
2. 编程式 API 控制
// 创建沙箱
const sandbox = await daytona.create({ image: "ubuntu" });
// 执行代码(实时输出流)
await sandbox.process.start("python3 train.py", { onOutput: (data) => ... });
// 文件操作
await sandbox.file.write("/app/main.py", code);
const content = await sandbox.file.read("/app/output.json");
// Git 操作
await sandbox.git.clone("https://github.com/...");
await sandbox.git.commit("fix bug");
// LSP 支持(代码补全、诊断)
await sandbox.lsp.start("python");
3. Computer Use(桌面控制)
- Linux/Windows/macOS 虚拟桌面
- Agent 可以通过代码控制桌面(点击、输入、截图)
- 适合 UI 自动化测试、iOS 开发
4. Human in the Loop
- SSH 访问任意沙箱
- VS Code Browser 一键打开
- Web Terminal 浏览器内终端
- 不打断 Agent 自治性
5. 有状态快照
- Agent 的操作状态可以持久化
- 跨多轮对话保持环境一致性
- 这是和 E2B(无状态)的核心区别
三、架构
┌─────────────────────────────────────────────┐
│ Daytona Control Plane(你部署或用 SaaS) │
│ ├── 沙箱生命周期管理(CRUD) │
│ ├── 镜像构建(声明式,SDK 驱动) │
│ ├── 权限控制(细粒度) │
│ └── API Server(REST + WebSocket 流式输出) │
├─────────────────────────────────────────────┤
│ 沙箱运行时(每个沙箱独立) │
│ ├── 独立内核 + 文件系统 + 网络栈 │
│ ├── vCPU / RAM / Disk 配额 │
│ ├── File API(读写操作) │
│ ├── Process API(代码执行 + 实时输出) │
│ ├── Git API(clone/commit/push) │
│ ├── LSP Server(语言服务协议) │
│ └── Desktop(Linux/macOS/Windows) │
├─────────────────────────────────────────────┤
│ 部署模式 │
│ ├── Daytona Cloud(SaaS,他们管) │
│ ├── Self-Hosted(你的云/机房) │
│ └── BYOC(Bring Your Own Cloud) │
└─────────────────────────────────────────────┘
四、竞品对比
| 维度 | Daytona | E2B | Modal | Fly.io |
|---|---|---|---|---|
| 定位 | 有状态 AI 沙箱 | 无状态代码执行 | GPU 云函数 | 边缘容器 |
| 冷启动 | ~90-150ms | ~90-150ms | ~1-2s | ~300ms |
| 状态持久化 | ✅ 快照 | ❌ 每次全新 | ❌ | 部分 |
| 桌面控制 | ✅ 三系统 | ❌ | ❌ | ❌ |
| GPU 支持 | ❌ | 部分 | ✅ 强项 | ✅ |
| 自托管 | ✅ AGPL-3.0 | ❌ | ❌ | ✅ |
| 网络(免费计划) | ❌ 需 $500+ | ✅ | ✅ | ✅ |
| SDK | Python + TypeScript | Python + JS | Python | Go |
| 价格 | $0-500+/月 | $0-500+/月 | 按用量 | 按用量 |
Daytona 的独特定位:
- 有状态:Agent 需要在多轮对话中保持环境(装包、下载数据、编译)
- 桌面控制:唯一支持 Linux/macOS/Windows 三系统桌面自动化的沙箱
- 自托管:AGPL-3.0,可以部署在自己的基础设施上
- Human in the Loop:SSH + VS Code + Web Terminal,方便人类介入调试
五、典型使用场景
1. AI Coding Agent 基础设施:Claude Code、Codex 等需要安全的代码执行环境
2. 自动化测试:Agent 在隔离环境中运行测试套件
3. 数据科学流水线:Agent 执行数据清洗、训练、评估
4. 桌面自动化:Agent 控制 macOS/Windows 桌面完成 UI 操作
5. 代码面试平台:安全执行候选人代码
6. CI/CD:隔离的构建和测试环境
六、定价(Daytona Cloud SaaS)
| 计划 | 价格 | 核心限制 |
|---|---|---|
| Free | $0 | 有限沙箱,无网络访问 |
| Pro | $500/月 | 网络访问 + 更大配额 |
| Enterprise | 定制 | HIPAA/SOC2/GDPR 合规 |
注意:免费计划不支持互联网访问(社区反馈的痛点)。自托管无此限制。
分析
优势
1. 72K Stars 增长极快:2024 年 2 月创建,两年内从 0 到 72K
2. 有状态是杀手锏:AI Agent 的真实场景需要持久化环境,E2B 的无状态模型不适合
3. 桌面控制独特:唯一支持三系统桌面的沙箱平台
4. AGPL-3.0 真开源:可以自托管,不锁定
5. 冷启动快:~90ms,接近 E2B
6. 融资充足:$3100 万,FirstMark 领投
7. 大客户:CoreWeave(GPU 云)作为客户背书
劣势与风险
1. 免费计划无网络:对开发者不友好,$500/月门槛高
2. 无 GPU 支持:AI 训练/推理场景不如 Modal
3. AGPL-3.0 对商业产品有传染性:集成到闭源产品需要考虑
4. 竞品激烈:E2B、Modal、Fly.io 都在抢 AI 沙箱市场
5. TypeScript 实现:性能敏感场景不如 Rust/Go 实现(如 Firecracker microVM)
6. 自托管复杂度:生产级部署需要 K8s 或 Nomad 等编排器
7. 商业模式待验证:$500/月的 Pro 计划能否支撑公司估值?
与 Jay 的关联
- OpenClaw 的代码执行:目前 OpenClaw 用 shell exec 直接在本机执行,Daytona 可以作为安全的远程执行后端
- Hermes Agent 集成:Hermes Agent 的
terminal工具支持modal和daytona作为执行环境——说明两者已经在生态上对接 - Coding Agent 场景:Jay 经常 spawn Codex/Claude Code 子 Agent,Daytona 可以作为这些 Agent 的安全执行环境
- 当前不需要:Jay 的 VPS 单机场景用 Docker 就够了,Daytona 的价值在多 Agent 并发场景
- 长期价值:如果 Jay 做 AI Agent 产品,Daytona 是最成熟的代码执行基础设施之一
评分
| 维度 | 评分 (1-10) | 说明 |
|---|---|---|
| 创新性 | 8 | 有状态沙箱 + 桌面控制,填补了 AI Agent 基础设施空白 |
| 技术质量 | 7 | 90ms 冷启动优秀,但 TypeScript 实现有性能天花板 |
| 实用价值 | 8 | AI Agent 编码场景刚需,有状态是核心差异化 |
| 生态系统 | 7 | SDK 完善,但免费计划限制多 |
| 市场时机 | 9 | AI Agent 爆发期,代码执行是核心基础设施 |
| 竞争力 | 7 | 有状态 + 桌面是优势,但无 GPU、免费无网络是短板 |
| 可扩展性 | 7 | 自托管 + BYOC 模式灵活,但需要编排器支持 |
| 与 Jay 的关联 | 6 | 潜在的代码执行后端,但当前场景不急迫 |
| **总分** | **7.4** | AI Agent 基础设施的关键拼图,有状态沙箱的领跑者 |