browse.sh — AI Agent 的浏览器技能目录
来源: https://browse.sh/
日期: 2026-05-19
评分: ⭐⭐⭐⭐☆ (4/5)
一句话版本
browse.sh 是个浏览器自动化技能的"应用商店"——AI 代理可以像 npm install 一样安装现成的网页操作技能(比如搜 Airbnb、查 Amazon 价格、爬 AllTrails 徒步路线),然后用一个命令行工具控制浏览器做各种事情,不用自己写爬虫脚本。
核心内容
这是什么?
browse.sh 是 Browserbase 公司推出的开放网页技能目录,配有一个 CLI 工具。它解决的核心问题是:让 AI 代理(特别是 Claude Code、Cursor 等编码代理)能像人一样操作任意网页,但又不用为每个网站写定制代码。
安装方式
npm install -g browse
就这么简单。一个 npm 包搞定所有。
三大核心功能
| 功能 | 说明 |
|---|---|
| **Fetch** | 读取任意网页内容,自动从轻量 HTTP 降级到完整浏览器渲染 |
| **Search** | 结构化网页搜索,底层用 Browserbase Search |
| **Browse** | 完整的浏览器会话(通过 CDP),支持点击、滚动、填表、登录 |
技能目录
这是最亮眼的部分。browse.sh 提供了数百个预置技能,覆盖常见网站:
- 电商: Amazon, Best Buy, eBay, Craigslist, Depop
- 旅行: Airbnb, Booking.com, AllTrails, CarGurus, Cruise Critic
- 学术: arXiv, Google Scholar, Wikipedia
- 新闻/媒体: YouTube, Wikipedia, GitHub
- 金融: Bankrate, Bitcoin fees
- 本地服务: Apartments.com, ClassPass, DoorDash
每个技能都是一个标准的 SKILL.md 文件,Agent 可以读取理解并调用。
技术架构
- 底层基于 Stagehand(Browserbase 的 AI 浏览器 SDK)
- 支持本地 Chrome 直接操作(开发调试用)
- 支持 Browserbase 云端浏览器(生产环境,含反爬虫、CAPTCHA 解算、住宅代理)
- 浏览器状态可持久化(cookies、localStorage),代理保持登录态
- 通过
skills.sh生态分发技能
兼容性
- Claude Code:
/plugin marketplace add browserbase/skills - Cursor / Codex: 直接在终端里用 CLI
- 任何支持终端命令的 AI Agent 都能用
分析
为什么重要?
1. 标准化了 Agent 控制浏览器的接口 — 之前每个团队自己造轮子(Playwright + custom scripts),现在有一个统一的 CLI 和技能生态
2. 技能可复用、可分享 — SKILL.md 格式让技能既是文档又是代码,Agent 可以自己读、自己用
3. 本地到云端无缝切换 — 开发用本地 Chrome,上线用 Browserbase 云,同一个 CLI
4. 与 OpenClaw 的 Skill 系统思路高度一致 — 都是让 Agent 通过沙箱化的技能文件获得新能力
类比思考
- browse.sh : 浏览器操作 = npm : JavaScript — 把网页操作变成了可安装的包
- Skill 目录 = Google Play Store — 但内容是给 AI Agent 看的,不是给人看的
不足
- Browserbase 云服务需要付费(但本地使用是免费的)
- 技能质量参差不齐(社区贡献的技能质量如何保证?)
- 网站改版后技能可能失效(需要维护)
- 目前主要面向编码 agent,对普通用户门槛较高
与我们项目的关联
Jay 的 OpenClaw 生态也有 browser 技能和 SKILL.md 系统。browse.sh 的:
- 技能分发方式(通过 npm/CLI 安装)值得借鉴
- llms.txt / llms-full.txt 的双层索引很优雅 — Agent 先看紧凑索引,需要再展开
- 技能目录的广度(数百个网站)提示:OpenClaw 如果能建立一个类似的技能市场会很有价值
- browse CLI 的 Fetch → Search → Browse 三级递进 是一个好的 API 设计模式
直接可用的点
- 我们可以直接
npm install -g browse在 OpenClaw 环境中使用 - 对于需要浏览器操作但本地 browser 技能不好使的场景,可以走 browse CLI 作为 fallback
- clawhub.ai(OpenClaw 的技能市场)和 browse.sh 在做类似的事情,值得持续关注对比
评分表
| 维度 | 评分 | 说明 |
|---|---|---|
| 创新性 | ⭐⭐⭐⭐ | 把浏览器自动化做成了 npm 一样的技能包生态 |
| 实用性 | ⭐⭐⭐⭐⭐ | 数百个现成技能,安装即用 |
| 技术实现 | ⭐⭐⭐⭐ | 基于 Stagehand,本地+云端双模式 |
| 生态潜力 | ⭐⭐⭐⭐ | skills.sh 生态在增长,3.3k GitHub stars |
| 与 Jay 项目关联 | ⭐⭐⭐⭐ | 思路高度一致,工具可互用 |
关键链接
- https://browse.sh/ — 主页 + 技能目录
- https://www.browserbase.com/browse-cli — Browserbase 官方介绍
- https://github.com/browserbase/skills — GitHub 仓库(3.3k stars)
- https://skills.sh/ — 技能分发生态
- https://github.com/vercel-labs/agent-browser — Vercel Labs 同类项目(竞品参考)