Pinchtab 深度研究报告
项目地址: https://github.com/pinchtab/pinchtab
官网: https://pinchtab.com
协议: MIT
语言: Go
版本: v0.1.0(首个发布)
报告日期: 2026-02-20
一句话概括
Pinchtab 是一个 12MB 的 Go 单文件二进制,启动一个 Chrome 实例并暴露 HTTP API,让任何 AI Agent(或 curl)都能控制浏览器。核心卖点:无框架锁定 + Token 效率极高。
🎯 解决什么问题
现有浏览器自动化工具(OpenClaw Browser、Playwright MCP、Browser Use)都和自己的框架深度绑定。换 Agent 框架就得重新对接。
Pinchtab 的方案很简单:一个 HTTP 服务器。9 个端点,JSON 进出。任何语言、任何 Agent、甚至 curl 都能用。
🏗️ 架构
Agent (任意) → HTTP :9867 → Pinchtab (Go) → CDP → Chrome (你的标签页)
就这么简单。没有数据库,没有 SDK 依赖,一个二进制 + 一个 Chrome。
核心技术栈:
- Go 1.25+
- chromedp(Chrome DevTools Protocol 的 Go 驱动)
- 纯标准库 + 4 个依赖
💡 核心特性
Token 效率(实测数据,搜索结果页)
| 方法 | Token 数 | 相比截图 |
|---|---|---|
| 完整 a11y 快照 | ~10,500 | — |
| 交互元素过滤 | ~3,600 | 节省 64% |
| 截图(视觉模型) | ~2,000 | — |
| **Pinchtab /text** | **~800** | **节省 60%** |
50 页监控任务成本对比:截图 $0.30 vs Pinchtab /text $0.01。
其他亮点
- Stealth 模式: 修补 navigator.webdriver、伪装 UA、隐藏自动化标记,能过主流网站的 bot 检测
- Session 持久化: Cookie、登录状态、标签页跨重启保留
- Smart Diff:
?diff=true只返回上次快照以来的变化 - Dashboard 模式: 多 Profile 管理,headed 模式下可视操作
完整 API(就 9 个端点)
| 方法 | 端点 | 描述 |
|---|---|---|
| GET | /health | 健康检查 |
| GET | /tabs | 列出标签页 |
| GET | /snapshot | A11y 树(主要接口) |
| GET | /screenshot | JPEG 截图 |
| GET | /text | 可读文本提取 |
| POST | /navigate | 导航到 URL |
| POST | /action | 点击、输入、滚动等 |
| POST | /evaluate | 执行 JavaScript |
| POST | /tab | 开关标签页 |
🤔 与我们的关系
对比 OpenClaw Browser
Pinchtab README 直接把 OpenClaw 当竞品对比:
| 维度 | Pinchtab | OpenClaw Browser |
|---|---|---|
| Token/页 | ~800(/text) | ~10,000+ |
| 接口 | HTTP(任何语言) | 内部 API |
| Stealth | ✅ | ❌ |
| Session 持久化 | ✅ | ❌ |
| 独立部署 | ✅ 12MB 二进制 | 需要 OpenClaw 框架 |
但要注意:OpenClaw 的 browser 工具是集成在 Agent 框架内的,直接调用比 HTTP 多一轮网络开销少。Pinchtab 的优势是解耦,适合多 Agent 架构或非 OpenClaw 场景。
对我们的实际价值
1. Polymarket 数据抓取:如果 web_fetch 被反爬,Pinchtab 的 stealth 模式 + /text 端点是一个优秀的备选方案
2. Twitter 抓取:我们的 bird-x 目前遇到 403 问题,Pinchtab 的 stealth 模式可能绕过
3. 通用浏览器自动化:可以作为 OpenClaw browser 的独立替代/补充
4. 成本优化:如果有大量网页监控需求,/text 端点 5-13x 的 token 节省很实在
已有 OpenClaw Skill
项目自带 OpenClaw skill(skill/pinchtab/SKILL.md),可以直接集成到我们的工作流。
⚠️ 风险与局限
1. v0.1.0 早期阶段:第一个版本,功能和稳定性待验证
2. 安全责任在用户:登录状态持久化意味着任何能访问 HTTP 端口的人都能操控你的账号
3. 没有 tab 数量限制:可能导致内存失控
4. Headed 模式不成熟:TODO 里标注"实验性"
5. Profile 管理手动:比较原始
6. 依赖本地 Chrome:Docker 部署最方便,裸机需要自己装 Chrome
✅ 总结
Pinchtab 的定位非常精准:一个极简的、框架无关的浏览器控制 HTTP 服务。
值得关注:
- 设计哲学清晰——12MB 二进制、9 个 API、零配置
- Token 效率实测数据令人信服,/text 端点在读取场景下有真实优势
- Stealth 模式解决了 Cloudflare/bot 检测这个普遍痛点
- 自带 OpenClaw skill,集成成本低
适合场景:
- 多 Agent 架构中共享浏览器实例
- 大量网页监控/爬取(成本敏感)
- 需要绕过 bot 检测的场景
- 非 OpenClaw 框架想要浏览器能力
不适合场景:
- 已经用 OpenClaw browser 且够用的情况
- 需要高级浏览器编排(录制、回放、复杂工作流)
对我们来说,最实际的应用是解决 Twitter 403 和 Cloudflare 反爬问题。如果哪天 web_fetch + browser 都搞不定某个站,可以考虑部署 Pinchtab 作为备选。