Browser Harness 实测：让 LLM 直接操控你的浏览器，靠谱吗？

前阵子看到 browser-use 团队出了个新项目叫 browser-harness，1 万星出头，宣传语很猛：“Self-healing harness that enables LLMs to complete any task.” 翻译成人话就是——让大模型直接操作你的浏览器，而且能自己修 bug。

我本身对 browser-use 那个主项目就比较熟，算是目前最成熟的浏览器自动化 AI Agent 之一。这个新出的 harness 走的是另一条路：不封装那么多，直接给 LLM 一把 Chrome DevTools Protocol 的钥匙，让它自己看着办。

它到底怎么工作的

核心思路其实挺大胆。传统方案是写一堆预定义动作让 agent 去执行，harness 反过来——它只提供一个极其轻量的连接层（大概 1k 行代码，4 个核心文件），让 LLM 通过 WebSocket 直连浏览器的 CDP。agent 看到页面缺什么 helper，就现场写一个。

举个例子：agent 想上传文件，发现 agent_helpers.py 里没有对应的 helper，它就自己写一个加进去。下一次再遇到同样的操作，直接复用。这就是所谓 “self-healing”——每次运行都在积累领域知识。

架构上分成几块：

install.md —— 首次安装和浏览器启动引导
SKILL.md —— 日常用法
src/browser_harness/ —— 受保护的核心包，agent 改不了
agent-workspace/agent_helpers.py —— agent 可以编辑的 helper 代码
agent-workspace/domain-skills/ —— 可复用的站点专属技能

实际跑起来的感受

安装确实简单，README 里给了一段 setup prompt，直接贴给 Claude Code 就行。它会自动打开 chrome://inspect/#remote-debugging 让你勾选远程调试，然后点 Allow 授权连接。

我试了两个任务：

自动填表单 —— 让 agent 在 LinkedIn 上发一条消息。第一次跑的时候它卡在了文件上传环节，但大概 30 秒后自己写了个 helper，第二次就顺了。说实话这个自我修复的过程比结果更让我惊讶。

批量抓取数据 —— 从一个没有 API 的老旧后台系统里扒订单列表。agent 自己摸索出了登录流程、翻页逻辑，还写了个 domain-skills/legacy-dashboard/ 技能把这套流程固化下来。下次再跑同一个站点，基本零调试。

快速上手

git clone https://github.com/browser-use/browser-harness.git
cd browser-harness
# 然后按 install.md 里的步骤，或者直接把 setup prompt 丢给 Claude Code

他们也接了 Browser Use Cloud，免费档给 3 个并发浏览器，带代理和验证码破解。国内网络环境不太好的可以试试看。

优缺点都聊一下

好的地方：

极致轻量，1k 行核心代码，出了问题你甚至能自己读源码改
self-healing 不是噱头，agent 真的会写 helper 并复用
直接操控真实浏览器，不是 headless 模拟，兼容性拉满
领域技能可积累，同一个站点越跑越顺

不太爽的地方：

需要你开着 Chrome 并打开远程调试，安全性上要多留个心眼
第一次跑新站点比较慢，agent 得先”摸索”一遍
对 Claude Code 或类似 AI 编程工具依赖较强，手动配置的话步骤不少
文档目前还比较精简，有些边缘情况得自己翻代码

和主项目 browser-use 怎么选

如果你要的是开箱即用、不用操心底层，去用 browser-use 主项目。如果你希望 agent 有最大自由度、能自己进化工作流，或者你需要处理一些特别复杂、预定义动作覆盖不到的浏览器任务，harness 更合适。说白了，一个像自动挡，一个像手动挡——harness 给了你对离合器的完全控制权。

总结

Browser Harness 是那种”初看简陋，越用越香”的项目。1 万星在同类项目里不算最顶，但 self-healing 的设计思路确实很超前。我准备接下来把我的几个定期要跑的数据抓取任务都迁移过去，看看积累几周 domain skills 之后效率能提升多少。到时候再给大家汇报。

关于作者

柳钉鱼，全栈开发者，GitHub 重度用户。过去 3 年 Star 了 900+ 仓库，这里只写我真正用过或深度调研过的工具。

📧 发现好工具想推荐？发邮件到 [email protected]

Browser Harness 实测：让 LLM 直接操控你的浏览器，靠谱吗？

Browser Harness 实测：让 LLM 直接操控你的浏览器，靠谱吗？

它到底怎么工作的

实际跑起来的感受

快速上手

优缺点都聊一下

和主项目 browser-use 怎么选

总结

相关文章

MaxKB 深度评测：这个 2万星开源智能体平台，真能替代商业方案吗？

calibre 深度评测：我用了8年的电子书管理神器，真的离不开它

微软 Magentic-UI 实测：AI 操控浏览器，离真正可用还有多远？