OpenClaw 托管服务可行性方案
作者: Tony | 日期: 2026-03-09
一、产品定义
一句话:让任何人 5 分钟内拥有自己的 AI 助手,无需 VPS、无需命令行。
目标用户:
- 想用 OpenClaw 但不会/不想搞服务器的人
- 已经在用但受限于本地机器性能的用户
- 团队用户(给家人/同事各配一个 agent)
核心价值:OpenClaw 的能力 + 零运维
二、技术架构
2.1 整体架构
用户浏览器/App
│
▼
┌─────────────────────────────┐
│ 入口层 (Cloudflare) │
│ - CDN + WAF + DDoS 防护 │
│ - SSL 终止 │
│ - WebSocket 路由 │
└─────────┬───────────────────┘
│
▼
┌─────────────────────────────┐
│ 控制面 (Control Plane) │
│ - 用户注册/登录 (OAuth) │
│ - 计费系统 │
│ - 实例管理 API │
│ - 监控告警 │
└─────────┬───────────────────┘
│
▼
┌─────────────────────────────┐
│ 数据面 (Data Plane) │
│ ┌─────┐ ┌─────┐ ┌─────┐ │
│ │User1│ │User2│ │User3│ │
│ │Docker│ │Docker│ │Docker│ │
│ └─────┘ └─────┘ └─────┘ │
│ 每用户独立容器 + volume │
└─────────────────────────────┘
2.2 单用户容器架构
每个用户 = 1 个 OpenClaw Docker 容器 + 持久化存储
Docker Container (openclaw:latest)
├── /home/node/.openclaw/ # 配置 (持久化 volume)
│ ├── openclaw.json # 用户配置
│ ├── agents/ # session 数据
│ └── cron/ # 定时任务
├── /home/node/.openclaw/workspace/ # 工作区 (持久化 volume)
│ ├── SOUL.md
│ ├── MEMORY.md
│ ├── memory/
│ └── skills/
└── Gateway: 内部端口 18789
2.3 网络拓扑
Internet
│
Cloudflare (Reverse Proxy + WebSocket)
│
├── dashboard.runclaw.dev → 控制面 Web UI
├── api.runclaw.dev → 控制面 API
└── gw-{user_id}.runclaw.dev → 用户 Gateway (WebSocket)
│
Traefik / Caddy (内部反向代理)
│
├── :18789 (user_1 container)
├── :18790 (user_2 container)
└── :18791 (user_3 container)
关键设计:
- 每用户一个子域名或路径,Traefik 自动路由
- WebSocket 长连接直通到用户容器
- Cloudflare 只做 L7 代理,不缓存 WebSocket
2.4 渠道集成方案
这是核心难点——用户的 Telegram/Discord/WhatsApp bot 怎么连接。
方案 A: 用户自带 Bot Token(MVP 推荐)
- 用户自己创建 Telegram Bot / Discord Bot
- 在托管面板里填入 token
- 平台注入到用户容器的 openclaw.json
- ✅ 简单、无需平台 bot 帐号
- ❌ 用户需要自己创建 bot(有门槛)
方案 B: 平台统一 Bot + 路由
- 平台运营一个 Telegram/Discord Bot
- 用户通过 /start 或 /register 绑定
- 平台按用户 ID 路由到对应容器
- ✅ 用户零配置
- ❌ 需要开发路由层;单 bot 有 rate limit 风险
- ❌ 不支持 WhatsApp(需要 Business API)
建议: MVP 用方案 A,后续加方案 B 作为增值服务。
2.5 LLM API Key 方案
方案 1: 用户自带 Key(BYOK)
- 用户填入自己的 Anthropic/OpenAI key
- 平台不碰 token 费用
- ✅ 简单、无财务风险
- ❌ 用户需要自己买 API
方案 2: 平台统一 Key + 转售
- 平台用统一 API key
- 按 token 用量加价转售
- ✅ 用户体验好
- ❌ 财务风险大、需要预付大量 API 费用
方案 3: 混合模式(推荐)
- 默认 BYOK
- 平台提供"充值余额"选项,用平台 key,按量计费
- 用 LiteLLM/NadirClaw 做统一路由和用量计量
三、成本分析
3.1 单用户资源需求
| 资源 | 空闲时 | 活跃时 | 说明 |
|---|---|---|---|
| CPU | ~0.01 核 | 0.1-0.5 核 | 主要是 Node.js 事件循环 |
| 内存 | ~150MB | 300-500MB | OpenClaw Gateway + 工具 |
| 磁盘 | 500MB | 1-5GB | 配置 + workspace + sessions |
| 带宽 | ~0 | 低 | WebSocket + API 调用 |
3.2 服务器成本估算
单台 VPS 承载能力(以 Hetzner CAX31 为例):
| 配置 | 价格 | 可承载用户 |
|---|---|---|
| 8 vCPU ARM, 16GB RAM, 160GB | €15.90/月 | ~30-50 用户 |
| 16 vCPU ARM, 32GB RAM, 320GB | €28.90/月 | ~60-100 用户 |
假设:
- 空闲用户 150MB,活跃用户 400MB
- 同时在线率 ~30%
- 每用户平均 2GB 磁盘
3.3 成本结构(100 用户规模)
| 项目 | 月费 | 说明 |
|---|---|---|
| 服务器 (Hetzner) | ~€30 | 2 台 CAX31(主 + 备) |
| Cloudflare | $0 | Free plan 够用 |
| 域名 | ~$1 | runclaw.dev $10/年 |
| 监控 (Uptime Robot) | $0 | Free tier |
| 备份 (Hetzner Snapshot) | ~€5 | 每日快照 |
| **合计** | **~$40/月** | **$0.40/用户/月** |
3.4 定价模型
| 方案 | 价格 | 包含 |
|---|---|---|
| **Free** | $0 | 1 个 agent, 1 个渠道, 1GB 存储, 社区模型 |
| **Pro** | $5/月 | 3 个 agent, 所有渠道, 5GB 存储, BYOK |
| **Team** | $15/月 | 10 个 agent, 优先支持, 20GB, 自定义域名 |
毛利分析(Pro 方案):
- 收入: $5/用户/月
- 成本: ~$0.40/用户/月
- 毛利率: 92%(不含人力)
四、MVP 范围
4.1 Phase 1: 核心功能(2-3 周)
- [ ] 用户注册/登录 — OAuth (GitHub/Google) 或邮箱
- [ ] 一键创建实例 — Docker 容器自动创建 + 启动
- [ ] 配置面板 — 填入 Bot Token + API Key
- [ ] 渠道连接 — Telegram / Discord 最先支持
- [ ] 实例管理 — 启动/停止/重启/删除
- [ ] 基础监控 — 容器状态、内存/CPU
4.2 Phase 2: 体验优化(2-3 周)
- [ ] Web Terminal — 浏览器内直接与 agent 对话
- [ ] 文件管理器 — 在线编辑 SOUL.md / MEMORY.md
- [ ] Skill 商店 — 一键安装社区 skill
- [ ] 自动备份 — 每日备份 workspace 到 R2
- [ ] 用量统计 — token 消耗、消息数、存储用量
4.3 Phase 3: 增长(后续)
- [ ] 平台 Bot 模式 — 用户零配置直接用
- [ ] LLM 余额充值 — 平台代理 API 调用
- [ ] 自定义域名 — 用户的 gateway 绑定自有域名
- [ ] 团队协作 — 共享 workspace + 权限管理
- [ ] 模板市场 — 预配置的 agent 模板(客服、写作助手等)
五、技术实现要点
5.1 控制面技术栈
前端: Next.js / Remix (部署到 Cloudflare Pages)
后端: Hono / Fastify (运行在 VPS)
数据库: SQLite (Turso) 或 PostgreSQL
队列: BullMQ (Redis)
容器编排: Docker API (直接调用,不用 K8s)
为什么不用 Kubernetes:
- 100 用户规模用 K8s 是杀鸡用牛刀
- Docker API + Traefik 足够
- 运维复杂度低 10 倍
- 等到 1000+ 用户再考虑迁移
5.2 容器生命周期管理
# 伪代码
def create_instance(user_id, config):
# 1. 创建持久化 volume
volume_config = docker.volumes.create(f"oc-config-{user_id}")
volume_workspace = docker.volumes.create(f"oc-workspace-{user_id}")
# 2. 写入用户配置
write_openclaw_config(volume_config, config)
# 3. 启动容器
container = docker.containers.run(
image="ghcr.io/openclaw/openclaw:latest",
name=f"oc-{user_id}",
volumes={
volume_config: "/home/node/.openclaw",
volume_workspace: "/home/node/.openclaw/workspace",
},
mem_limit="512m",
cpu_quota=50000, # 0.5 CPU
restart_policy={"Name": "unless-stopped"},
labels={"user": user_id, "service": "openclaw"},
)
# 4. 注册 Traefik 路由 (通过 Docker label)
# Traefik 自动发现带 label 的容器
return container.id
def hibernate_instance(user_id):
"""空闲超过 24h 的实例休眠(停止容器但保留 volume)"""
container = docker.containers.get(f"oc-{user_id}")
container.stop()
# volume 保留,下次访问时自动唤醒
def wake_instance(user_id):
"""收到消息时自动唤醒"""
container = docker.containers.get(f"oc-{user_id}")
container.start()
# 冷启动 ~3-5 秒
5.3 休眠策略(降本关键)
大部分用户不会 24h 活跃。通过休眠可以大幅降低资源占用:
| 状态 | 触发条件 | 资源占用 | 恢复时间 |
|---|---|---|---|
| 活跃 | 有消息/心跳 | 150-500MB | - |
| 休眠 | 空闲 >1h | 0 (仅磁盘) | ~3-5s |
| 归档 | 空闲 >30天 | 压缩备份到 R2 | ~30s |
唤醒机制:
- Telegram/Discord webhook 到达时 → 控制面检查容器状态 → 不在运行则启动 → 转发消息
- 首条消息可能延迟 3-5 秒(冷启动),后续正常
有了休眠,单台 16GB 服务器可以注册 500+ 用户(同时活跃 50-80 个)。
5.4 安全隔离
| 层面 | 措施 |
|---|---|
| 容器隔离 | 每用户独立容器,non-root 运行 |
| 网络隔离 | 用户间容器无法互通(Docker network per user) |
| 资源限制 | CPU/内存/磁盘配额 |
| 密钥安全 | API key 加密存储,不明文记录日志 |
| 数据隔离 | 独立 volume,用户只能访问自己的数据 |
| 备份 | 每日自动备份到 R2,用户可手动导出 |
六、竞品分析
| 竞品 | 模式 | 价格 | 差异 |
|---|---|---|---|
| **ClawRouter/BlockRun** | LLM 路由 + 支付 | 按 token | 不托管 OpenClaw 本身 |
| **Railway / Render** | 通用 PaaS | $5-20/月 | 通用平台,不懂 OpenClaw |
| **Replit** | 在线 IDE + 托管 | $25/月 | 面向开发者,太贵 |
| **直接自建 VPS** | DIY | $5-12/月 | 需要技术能力 |
我们的差异化:
1. OpenClaw 原生 — 不是通用 PaaS,是专门为 OpenClaw 优化的托管
2. 零配置 — 不需要懂 Docker/Linux/命令行
3. 预装生态 — Skill 商店、模板、社区集成
4. 社区效应 — 用户互相分享 SOUL.md / Skill / 模板
七、风险与应对
| 风险 | 等级 | 应对 |
|---|---|---|
| OpenClaw 官方推出托管服务 | 🔴 高 | 先发优势 + 差异化(中文社区、本地化) |
| 用户滥用(挖矿/攻击) | 🟡 中 | 资源限额 + 行为监控 + ToS |
| LLM API 变动 | 🟡 中 | BYOK 模式转嫁风险给用户 |
| 容器逃逸安全风险 | 🟡 中 | non-root + seccomp + 定期更新 |
| 规模扩展瓶颈 | 🟢 低 | Docker → K8s 迁移路径清晰 |
八、时间线
| 阶段 | 时间 | 里程碑 |
|---|---|---|
| Week 1-2 | 3月中 | 控制面 MVP(注册 + 创建实例 + Telegram 连接) |
| Week 3-4 | 3月底 | Web UI + 文件管理 + 基础计费 |
| Week 5-6 | 4月中 | 公测(邀请制,20-50 用户) |
| Week 7-8 | 4月底 | 修 bug + 优化 + Skill 商店 |
| Month 3 | 5月 | 正式上线 + 定价 |
九、行动项
立即可做
1. 注册域名 — runclaw.dev ($10.18/年)
2. 开一台 Hetzner CAX31 — €15.90/月,装 Docker + Traefik
3. 写控制面 API — 用户 CRUD + 容器生命周期
4. 测试 Docker 部署 — 用官方镜像跑通单用户流程
需要决策
- [ ] 域名选择:runclaw.dev / clawnest.dev / clawcloud.dev?
- [ ] 先支持 Telegram 还是 Discord?
- [ ] Free tier 给不给?(引流 vs 成本)
- [ ] 一个人做还是找人合作?
十、总结
可行性:高 ✅
- 技术上:OpenClaw 官方已有完整 Docker 支持,容器化是现成的
- 成本上:$0.40/用户/月的底层成本,$5/月定价有 92% 毛利
- 市场上:OpenClaw 社区增长快(GitHub Trending、深圳龙岗政策),但官方没有托管服务
- 门槛上:MVP 2-3 周可上线,不需要大团队
最大风险:OpenClaw 官方自己做托管。应对策略是快速上线 + 中文社区深耕 + 差异化功能。
一句话:这是一个低成本启动、高毛利、有真实需求的项目。值得做。