Browser Harness 实测:让 LLM 直接操控你的浏览器,靠谱吗?
browser-use/browser-harness 是一个 1 万星的开源项目,用 CDP 协议把 LLM 和真实浏览器连起来,号称能完成任何浏览器任务。我折腾了两天,说说真实体验。
广告
Browser Harness 实测:让 LLM 直接操控你的浏览器,靠谱吗?
前阵子看到 browser-use 团队出了个新项目叫 browser-harness,1 万星出头,宣传语很猛:“Self-healing harness that enables LLMs to complete any task.” 翻译成人话就是——让大模型直接操作你的浏览器,而且能自己修 bug。
我本身对 browser-use 那个主项目就比较熟,算是目前最成熟的浏览器自动化 AI Agent 之一。这个新出的 harness 走的是另一条路:不封装那么多,直接给 LLM 一把 Chrome DevTools Protocol 的钥匙,让它自己看着办。
它到底怎么工作的
核心思路其实挺大胆。传统方案是写一堆预定义动作让 agent 去执行,harness 反过来——它只提供一个极其轻量的连接层(大概 1k 行代码,4 个核心文件),让 LLM 通过 WebSocket 直连浏览器的 CDP。agent 看到页面缺什么 helper,就现场写一个。
举个例子:agent 想上传文件,发现 agent_helpers.py 里没有对应的 helper,它就自己写一个加进去。下一次再遇到同样的操作,直接复用。这就是所谓 “self-healing”——每次运行都在积累领域知识。
架构上分成几块:
install.md—— 首次安装和浏览器启动引导SKILL.md—— 日常用法src/browser_harness/—— 受保护的核心包,agent 改不了agent-workspace/agent_helpers.py—— agent 可以编辑的 helper 代码agent-workspace/domain-skills/—— 可复用的站点专属技能
实际跑起来的感受
安装确实简单,README 里给了一段 setup prompt,直接贴给 Claude Code 就行。它会自动打开 chrome://inspect/#remote-debugging 让你勾选远程调试,然后点 Allow 授权连接。
我试了两个任务:
自动填表单 —— 让 agent 在 LinkedIn 上发一条消息。第一次跑的时候它卡在了文件上传环节,但大概 30 秒后自己写了个 helper,第二次就顺了。说实话这个自我修复的过程比结果更让我惊讶。
批量抓取数据 —— 从一个没有 API 的老旧后台系统里扒订单列表。agent 自己摸索出了登录流程、翻页逻辑,还写了个 domain-skills/legacy-dashboard/ 技能把这套流程固化下来。下次再跑同一个站点,基本零调试。
快速上手
git clone https://github.com/browser-use/browser-harness.git
cd browser-harness
# 然后按 install.md 里的步骤,或者直接把 setup prompt 丢给 Claude Code
他们也接了 Browser Use Cloud,免费档给 3 个并发浏览器,带代理和验证码破解。国内网络环境不太好的可以试试看。
优缺点都聊一下
好的地方:
- 极致轻量,1k 行核心代码,出了问题你甚至能自己读源码改
- self-healing 不是噱头,agent 真的会写 helper 并复用
- 直接操控真实浏览器,不是 headless 模拟,兼容性拉满
- 领域技能可积累,同一个站点越跑越顺
不太爽的地方:
- 需要你开着 Chrome 并打开远程调试,安全性上要多留个心眼
- 第一次跑新站点比较慢,agent 得先”摸索”一遍
- 对 Claude Code 或类似 AI 编程工具依赖较强,手动配置的话步骤不少
- 文档目前还比较精简,有些边缘情况得自己翻代码
和主项目 browser-use 怎么选
如果你要的是开箱即用、不用操心底层,去用 browser-use 主项目。如果你希望 agent 有最大自由度、能自己进化工作流,或者你需要处理一些特别复杂、预定义动作覆盖不到的浏览器任务,harness 更合适。说白了,一个像自动挡,一个像手动挡——harness 给了你对离合器的完全控制权。
总结
Browser Harness 是那种”初看简陋,越用越香”的项目。1 万星在同类项目里不算最顶,但 self-healing 的设计思路确实很超前。我准备接下来把我的几个定期要跑的数据抓取任务都迁移过去,看看积累几周 domain skills 之后效率能提升多少。到时候再给大家汇报。
关于作者
柳钉鱼,全栈开发者,GitHub 重度用户。过去 3 年 Star 了 900+ 仓库,这里只写我真正用过或深度调研过的工具。
📧 发现好工具想推荐?发邮件到 [email protected]
广告