OpenClaw 托管服务可行性方案

作者: Tony | 日期: 2026-03-09

一、产品定义

一句话:让任何人 5 分钟内拥有自己的 AI 助手,无需 VPS、无需命令行。

目标用户

核心价值:OpenClaw 的能力 + 零运维

二、技术架构

2.1 整体架构


用户浏览器/App
    │
    ▼
┌─────────────────────────────┐
│  入口层 (Cloudflare)         │
│  - CDN + WAF + DDoS 防护     │
│  - SSL 终止                  │
│  - WebSocket 路由             │
└─────────┬───────────────────┘
          │
          ▼
┌─────────────────────────────┐
│  控制面 (Control Plane)      │
│  - 用户注册/登录 (OAuth)      │
│  - 计费系统                   │
│  - 实例管理 API               │
│  - 监控告警                   │
└─────────┬───────────────────┘
          │
          ▼
┌─────────────────────────────┐
│  数据面 (Data Plane)         │
│  ┌─────┐ ┌─────┐ ┌─────┐   │
│  │User1│ │User2│ │User3│   │
│  │Docker│ │Docker│ │Docker│  │
│  └─────┘ └─────┘ └─────┘   │
│  每用户独立容器 + volume      │
└─────────────────────────────┘

2.2 单用户容器架构

每个用户 = 1 个 OpenClaw Docker 容器 + 持久化存储


Docker Container (openclaw:latest)
├── /home/node/.openclaw/          # 配置 (持久化 volume)
│   ├── openclaw.json              # 用户配置
│   ├── agents/                    # session 数据
│   └── cron/                      # 定时任务
├── /home/node/.openclaw/workspace/ # 工作区 (持久化 volume)
│   ├── SOUL.md
│   ├── MEMORY.md
│   ├── memory/
│   └── skills/
└── Gateway: 内部端口 18789

2.3 网络拓扑


Internet
    │
Cloudflare (Reverse Proxy + WebSocket)
    │
    ├── dashboard.runclaw.dev          → 控制面 Web UI
    ├── api.runclaw.dev                → 控制面 API
    └── gw-{user_id}.runclaw.dev      → 用户 Gateway (WebSocket)
    │
Traefik / Caddy (内部反向代理)
    │
    ├── :18789 (user_1 container)
    ├── :18790 (user_2 container)
    └── :18791 (user_3 container)

关键设计

2.4 渠道集成方案

这是核心难点——用户的 Telegram/Discord/WhatsApp bot 怎么连接。

方案 A: 用户自带 Bot Token(MVP 推荐)

方案 B: 平台统一 Bot + 路由

建议: MVP 用方案 A,后续加方案 B 作为增值服务。

2.5 LLM API Key 方案

方案 1: 用户自带 Key(BYOK)

方案 2: 平台统一 Key + 转售

方案 3: 混合模式(推荐)

三、成本分析

3.1 单用户资源需求

资源空闲时活跃时说明
CPU~0.01 核0.1-0.5 核主要是 Node.js 事件循环
内存~150MB300-500MBOpenClaw Gateway + 工具
磁盘500MB1-5GB配置 + workspace + sessions
带宽~0WebSocket + API 调用

3.2 服务器成本估算

单台 VPS 承载能力(以 Hetzner CAX31 为例):

配置价格可承载用户
8 vCPU ARM, 16GB RAM, 160GB€15.90/月~30-50 用户
16 vCPU ARM, 32GB RAM, 320GB€28.90/月~60-100 用户

假设:

3.3 成本结构(100 用户规模)

项目月费说明
服务器 (Hetzner)~€302 台 CAX31(主 + 备)
Cloudflare$0Free plan 够用
域名~$1runclaw.dev $10/年
监控 (Uptime Robot)$0Free tier
备份 (Hetzner Snapshot)~€5每日快照
**合计****~$40/月****$0.40/用户/月**

3.4 定价模型

方案价格包含
**Free**$01 个 agent, 1 个渠道, 1GB 存储, 社区模型
**Pro**$5/月3 个 agent, 所有渠道, 5GB 存储, BYOK
**Team**$15/月10 个 agent, 优先支持, 20GB, 自定义域名

毛利分析(Pro 方案)

四、MVP 范围

4.1 Phase 1: 核心功能(2-3 周)

4.2 Phase 2: 体验优化(2-3 周)

4.3 Phase 3: 增长(后续)

五、技术实现要点

5.1 控制面技术栈


前端: Next.js / Remix (部署到 Cloudflare Pages)
后端: Hono / Fastify (运行在 VPS)
数据库: SQLite (Turso) 或 PostgreSQL
队列: BullMQ (Redis)
容器编排: Docker API (直接调用,不用 K8s)

为什么不用 Kubernetes

5.2 容器生命周期管理


# 伪代码
def create_instance(user_id, config):
    # 1. 创建持久化 volume
    volume_config = docker.volumes.create(f"oc-config-{user_id}")
    volume_workspace = docker.volumes.create(f"oc-workspace-{user_id}")
    
    # 2. 写入用户配置
    write_openclaw_config(volume_config, config)
    
    # 3. 启动容器
    container = docker.containers.run(
        image="ghcr.io/openclaw/openclaw:latest",
        name=f"oc-{user_id}",
        volumes={
            volume_config: "/home/node/.openclaw",
            volume_workspace: "/home/node/.openclaw/workspace",
        },
        mem_limit="512m",
        cpu_quota=50000,  # 0.5 CPU
        restart_policy={"Name": "unless-stopped"},
        labels={"user": user_id, "service": "openclaw"},
    )
    
    # 4. 注册 Traefik 路由 (通过 Docker label)
    # Traefik 自动发现带 label 的容器
    
    return container.id

def hibernate_instance(user_id):
    """空闲超过 24h 的实例休眠(停止容器但保留 volume)"""
    container = docker.containers.get(f"oc-{user_id}")
    container.stop()
    # volume 保留,下次访问时自动唤醒

def wake_instance(user_id):
    """收到消息时自动唤醒"""
    container = docker.containers.get(f"oc-{user_id}")
    container.start()
    # 冷启动 ~3-5 秒

5.3 休眠策略(降本关键)

大部分用户不会 24h 活跃。通过休眠可以大幅降低资源占用:

状态触发条件资源占用恢复时间
活跃有消息/心跳150-500MB-
休眠空闲 >1h0 (仅磁盘)~3-5s
归档空闲 >30天压缩备份到 R2~30s

唤醒机制

有了休眠,单台 16GB 服务器可以注册 500+ 用户(同时活跃 50-80 个)。

5.4 安全隔离

层面措施
容器隔离每用户独立容器,non-root 运行
网络隔离用户间容器无法互通(Docker network per user)
资源限制CPU/内存/磁盘配额
密钥安全API key 加密存储,不明文记录日志
数据隔离独立 volume,用户只能访问自己的数据
备份每日自动备份到 R2,用户可手动导出

六、竞品分析

竞品模式价格差异
**ClawRouter/BlockRun**LLM 路由 + 支付按 token不托管 OpenClaw 本身
**Railway / Render**通用 PaaS$5-20/月通用平台,不懂 OpenClaw
**Replit**在线 IDE + 托管$25/月面向开发者,太贵
**直接自建 VPS**DIY$5-12/月需要技术能力

我们的差异化

1. OpenClaw 原生 — 不是通用 PaaS,是专门为 OpenClaw 优化的托管

2. 零配置 — 不需要懂 Docker/Linux/命令行

3. 预装生态 — Skill 商店、模板、社区集成

4. 社区效应 — 用户互相分享 SOUL.md / Skill / 模板

七、风险与应对

风险等级应对
OpenClaw 官方推出托管服务🔴 高先发优势 + 差异化(中文社区、本地化)
用户滥用(挖矿/攻击)🟡 中资源限额 + 行为监控 + ToS
LLM API 变动🟡 中BYOK 模式转嫁风险给用户
容器逃逸安全风险🟡 中non-root + seccomp + 定期更新
规模扩展瓶颈🟢 低Docker → K8s 迁移路径清晰

八、时间线

阶段时间里程碑
Week 1-23月中控制面 MVP(注册 + 创建实例 + Telegram 连接)
Week 3-43月底Web UI + 文件管理 + 基础计费
Week 5-64月中公测(邀请制,20-50 用户)
Week 7-84月底修 bug + 优化 + Skill 商店
Month 35月正式上线 + 定价

九、行动项

立即可做

1. 注册域名 — runclaw.dev ($10.18/年)

2. 开一台 Hetzner CAX31 — €15.90/月,装 Docker + Traefik

3. 写控制面 API — 用户 CRUD + 容器生命周期

4. 测试 Docker 部署 — 用官方镜像跑通单用户流程

需要决策

十、总结

可行性:高 ✅

最大风险:OpenClaw 官方自己做托管。应对策略是快速上线 + 中文社区深耕 + 差异化功能。

一句话:这是一个低成本启动、高毛利、有真实需求的项目。值得做。