Daytona — AI Agent 的安全代码执行基础设施

> 一句话版本：给 AI Agent 用的"云端虚拟机"——90ms 内创建隔离沙箱，Agent 可以在里面执行代码、操作文件、控制桌面，而且安全隔离不会搞坏你的主系统。72K Stars，$3100 万融资。

项目	信息
来源	https://github.com/daytonaio/daytona
官网	https://www.daytona.io
创建时间	2024-02-06
Stars	72,331	Forks 5,549
语言	TypeScript
许可证	AGPL-3.0
融资	$3100 万（3 轮，最新 2026-02 Series A $2400 万）
领投	FirstMark Capital
最新推送	2026-04-14（持续活跃）
客户	CoreWeave、Parabola

核心内容

一、Daytona 是什么？

Daytona 是一个AI Agent 的安全代码执行沙箱平台。核心能力：让 AI Agent（如 Claude Code、Codex、GPT-5）生成的代码在一个隔离的、有状态的、可编程控制的环境中运行。

一句话理解：如果 AI Agent 是"大脑"，Daytona 就是"手脚 + 工作台"——大脑想好代码，Daytona 提供安全的场地来执行。

二、核心能力

1. 沙箱创建（< 90ms 冷启动）

每个沙箱是一个完整的隔离环境：

独立内核、文件系统、网络栈
分配的 vCPU、RAM、磁盘
支持 Linux / macOS / Windows 三种桌面

2. 编程式 API 控制


// 创建沙箱
const sandbox = await daytona.create({ image: "ubuntu" });

// 执行代码（实时输出流）
await sandbox.process.start("python3 train.py", { onOutput: (data) => ... });

// 文件操作
await sandbox.file.write("/app/main.py", code);
const content = await sandbox.file.read("/app/output.json");

// Git 操作
await sandbox.git.clone("https://github.com/...");
await sandbox.git.commit("fix bug");

// LSP 支持（代码补全、诊断）
await sandbox.lsp.start("python");

3. Computer Use（桌面控制）

Linux/Windows/macOS 虚拟桌面
Agent 可以通过代码控制桌面（点击、输入、截图）
适合 UI 自动化测试、iOS 开发

4. Human in the Loop

SSH 访问任意沙箱
VS Code Browser 一键打开
Web Terminal 浏览器内终端
不打断 Agent 自治性

5. 有状态快照

Agent 的操作状态可以持久化
跨多轮对话保持环境一致性
这是和 E2B（无状态）的核心区别

三、架构


┌─────────────────────────────────────────────┐
│ Daytona Control Plane（你部署或用 SaaS）     │
│ ├── 沙箱生命周期管理（CRUD）                 │
│ ├── 镜像构建（声明式，SDK 驱动）              │
│ ├── 权限控制（细粒度）                       │
│ └── API Server（REST + WebSocket 流式输出）  │
├─────────────────────────────────────────────┤
│ 沙箱运行时（每个沙箱独立）                   │
│ ├── 独立内核 + 文件系统 + 网络栈             │
│ ├── vCPU / RAM / Disk 配额                  │
│ ├── File API（读写操作）                     │
│ ├── Process API（代码执行 + 实时输出）        │
│ ├── Git API（clone/commit/push）             │
│ ├── LSP Server（语言服务协议）               │
│ └── Desktop（Linux/macOS/Windows）           │
├─────────────────────────────────────────────┤
│ 部署模式                                     │
│ ├── Daytona Cloud（SaaS，他们管）            │
│ ├── Self-Hosted（你的云/机房）               │
│ └── BYOC（Bring Your Own Cloud）             │
└─────────────────────────────────────────────┘

四、竞品对比

维度	Daytona	E2B	Modal	Fly.io
定位	有状态 AI 沙箱	无状态代码执行	GPU 云函数	边缘容器
冷启动	~90-150ms	~90-150ms	~1-2s	~300ms
状态持久化	✅ 快照	❌ 每次全新	❌	部分
桌面控制	✅ 三系统	❌	❌	❌
GPU 支持	❌	部分	✅ 强项	✅
自托管	✅ AGPL-3.0	❌	❌	✅
网络（免费计划）	❌ 需 $500+	✅	✅	✅
SDK	Python + TypeScript	Python + JS	Python	Go
价格	$0-500+/月	$0-500+/月	按用量	按用量

Daytona 的独特定位：

有状态：Agent 需要在多轮对话中保持环境（装包、下载数据、编译）
桌面控制：唯一支持 Linux/macOS/Windows 三系统桌面自动化的沙箱
自托管：AGPL-3.0，可以部署在自己的基础设施上
Human in the Loop：SSH + VS Code + Web Terminal，方便人类介入调试

五、典型使用场景

1. AI Coding Agent 基础设施：Claude Code、Codex 等需要安全的代码执行环境

2. 自动化测试：Agent 在隔离环境中运行测试套件

3. 数据科学流水线：Agent 执行数据清洗、训练、评估

4. 桌面自动化：Agent 控制 macOS/Windows 桌面完成 UI 操作

5. 代码面试平台：安全执行候选人代码

6. CI/CD：隔离的构建和测试环境

六、定价（Daytona Cloud SaaS）

计划	价格	核心限制
Free	$0	有限沙箱，无网络访问
Pro	$500/月	网络访问 + 更大配额
Enterprise	定制	HIPAA/SOC2/GDPR 合规

注意：免费计划不支持互联网访问（社区反馈的痛点）。自托管无此限制。

分析

优势

1. 72K Stars 增长极快：2024 年 2 月创建，两年内从 0 到 72K

2. 有状态是杀手锏：AI Agent 的真实场景需要持久化环境，E2B 的无状态模型不适合

3. 桌面控制独特：唯一支持三系统桌面的沙箱平台

4. AGPL-3.0 真开源：可以自托管，不锁定

5. 冷启动快：~90ms，接近 E2B

6. 融资充足：$3100 万，FirstMark 领投

7. 大客户：CoreWeave（GPU 云）作为客户背书

劣势与风险

1. 免费计划无网络：对开发者不友好，$500/月门槛高

2. 无 GPU 支持：AI 训练/推理场景不如 Modal

3. AGPL-3.0 对商业产品有传染性：集成到闭源产品需要考虑

4. 竞品激烈：E2B、Modal、Fly.io 都在抢 AI 沙箱市场

5. TypeScript 实现：性能敏感场景不如 Rust/Go 实现（如 Firecracker microVM）

6. 自托管复杂度：生产级部署需要 K8s 或 Nomad 等编排器

7. 商业模式待验证：$500/月的 Pro 计划能否支撑公司估值？

与 Jay 的关联

OpenClaw 的代码执行：目前 OpenClaw 用 shell exec 直接在本机执行，Daytona 可以作为安全的远程执行后端
Hermes Agent 集成：Hermes Agent 的 terminal 工具支持 modal 和 daytona 作为执行环境——说明两者已经在生态上对接
Coding Agent 场景：Jay 经常 spawn Codex/Claude Code 子 Agent，Daytona 可以作为这些 Agent 的安全执行环境
当前不需要：Jay 的 VPS 单机场景用 Docker 就够了，Daytona 的价值在多 Agent 并发场景
长期价值：如果 Jay 做 AI Agent 产品，Daytona 是最成熟的代码执行基础设施之一

评分

维度	评分 (1-10)	说明
创新性	8	有状态沙箱 + 桌面控制，填补了 AI Agent 基础设施空白
技术质量	7	90ms 冷启动优秀，但 TypeScript 实现有性能天花板
实用价值	8	AI Agent 编码场景刚需，有状态是核心差异化
生态系统	7	SDK 完善，但免费计划限制多
市场时机	9	AI Agent 爆发期，代码执行是核心基础设施
竞争力	7	有状态 + 桌面是优势，但无 GPU、免费无网络是短板
可扩展性	7	自托管 + BYOC 模式灵活，但需要编排器支持
与 Jay 的关联	6	潜在的代码执行后端，但当前场景不急迫
总分	7.4	AI Agent 基础设施的关键拼图，有状态沙箱的领跑者