Pinchtab 深度研究报告

项目地址: https://github.com/pinchtab/pinchtab

官网: https://pinchtab.com

协议: MIT

语言: Go

版本: v0.1.0(首个发布)

报告日期: 2026-02-20

一句话概括

Pinchtab 是一个 12MB 的 Go 单文件二进制,启动一个 Chrome 实例并暴露 HTTP API,让任何 AI Agent(或 curl)都能控制浏览器。核心卖点:无框架锁定 + Token 效率极高

🎯 解决什么问题

现有浏览器自动化工具(OpenClaw Browser、Playwright MCP、Browser Use)都和自己的框架深度绑定。换 Agent 框架就得重新对接。

Pinchtab 的方案很简单:一个 HTTP 服务器。9 个端点,JSON 进出。任何语言、任何 Agent、甚至 curl 都能用。

🏗️ 架构


Agent (任意) → HTTP :9867 → Pinchtab (Go) → CDP → Chrome (你的标签页)

就这么简单。没有数据库,没有 SDK 依赖,一个二进制 + 一个 Chrome。

核心技术栈

💡 核心特性

Token 效率(实测数据,搜索结果页)

方法Token 数相比截图
完整 a11y 快照~10,500
交互元素过滤~3,600节省 64%
截图(视觉模型)~2,000
**Pinchtab /text****~800****节省 60%**

50 页监控任务成本对比:截图 $0.30 vs Pinchtab /text $0.01

其他亮点

完整 API(就 9 个端点)

方法端点描述
GET/health健康检查
GET/tabs列出标签页
GET/snapshotA11y 树(主要接口)
GET/screenshotJPEG 截图
GET/text可读文本提取
POST/navigate导航到 URL
POST/action点击、输入、滚动等
POST/evaluate执行 JavaScript
POST/tab开关标签页

🤔 与我们的关系

对比 OpenClaw Browser

Pinchtab README 直接把 OpenClaw 当竞品对比:

维度PinchtabOpenClaw Browser
Token/页~800(/text)~10,000+
接口HTTP(任何语言)内部 API
Stealth
Session 持久化
独立部署✅ 12MB 二进制需要 OpenClaw 框架

但要注意:OpenClaw 的 browser 工具是集成在 Agent 框架内的,直接调用比 HTTP 多一轮网络开销少。Pinchtab 的优势是解耦,适合多 Agent 架构或非 OpenClaw 场景。

对我们的实际价值

1. Polymarket 数据抓取:如果 web_fetch 被反爬,Pinchtab 的 stealth 模式 + /text 端点是一个优秀的备选方案

2. Twitter 抓取:我们的 bird-x 目前遇到 403 问题,Pinchtab 的 stealth 模式可能绕过

3. 通用浏览器自动化:可以作为 OpenClaw browser 的独立替代/补充

4. 成本优化:如果有大量网页监控需求,/text 端点 5-13x 的 token 节省很实在

已有 OpenClaw Skill

项目自带 OpenClaw skill(skill/pinchtab/SKILL.md),可以直接集成到我们的工作流。

⚠️ 风险与局限

1. v0.1.0 早期阶段:第一个版本,功能和稳定性待验证

2. 安全责任在用户:登录状态持久化意味着任何能访问 HTTP 端口的人都能操控你的账号

3. 没有 tab 数量限制:可能导致内存失控

4. Headed 模式不成熟:TODO 里标注"实验性"

5. Profile 管理手动:比较原始

6. 依赖本地 Chrome:Docker 部署最方便,裸机需要自己装 Chrome

✅ 总结

Pinchtab 的定位非常精准:一个极简的、框架无关的浏览器控制 HTTP 服务

值得关注

适合场景

不适合场景

对我们来说,最实际的应用是解决 Twitter 403 和 Cloudflare 反爬问题。如果哪天 web_fetch + browser 都搞不定某个站,可以考虑部署 Pinchtab 作为备选。