用手机就能跑 AI Agent?Hermes WebUI 让我改变了想法
Hermes WebUI 把 Hermes Agent 搬进了浏览器和手机,让你随时随地跟 AI Agent 对话。我试用了一周,聊聊它到底行不行。
广告
用手机就能跑 AI Agent?Hermes WebUI 让我改变了想法
说实话,我之前对「在手机上跑 AI Agent」这件事挺悲观的。要么配置复杂到想摔手机,要么响应慢得像在拨号上网。直到我刷到 nesquena/hermes-webui 这个项目,描述写得特别直接——「The best way to use Hermes Agent from the web or from your phone」。
口气不小。我偏要试试看。
Hermes Agent 是什么来头
如果你还没听过 Hermes Agent,它其实是一个支持多工具调用的 AI Agent 框架。名字取自希腊神话里的信使神,暗示它能在不同系统之间传递消息、调用工具。核心思路是让 LLM 不仅能聊天,还能真正动手干活——查天气、调 API、读写文件,样样都来。
但问题来了:Hermes Agent 原生是命令行交互的。这意味着你得开着终端,黑底白字地跟它对话。对于开发者来说还行,普通人根本摸不着门。
Hermes WebUI 就是来解决这个痛点的。
核心功能:把 Agent 塞进浏览器
我装完这个项目的第一反应是——快。整个界面基于现代 Web 技术栈,响应速度比我预期的快得多。几个让我印象深刻的功能点:
响应式界面,手机友好
这大概是项目最大的卖点。你不需要装任何 App,直接用手机浏览器打开,界面会自动适配。我在 iPhone 和一部老安卓上都试了,布局没有崩,输入框和对话气泡的大小也刚好。对于想随时随地用 Agent 的人来说,这体验确实舒服。
实时对话流
Agent 思考的过程是可见的。它不会傻等全部结果出来才给你看,而是像 ChatGPT 那样,一个字一个字地往外吐。这种「流式输出」在移动端特别重要,因为用户最怕的就是点了发送之后屏幕卡死,不知道后端在干嘛。
工具调用可视化
当 Hermes Agent 调用外部工具时,WebUI 会用小卡片的形式展示它正在做什么。比如让它「查一下北京明天天气」,你会看到一张卡片跳出来,写着「正在调用 weather_tool」。成功了打勾,失败了给红叉。这比命令行里一堆 JSON 日志友好一百倍。
会话历史管理
左边栏有历史记录,点一下就能回到之前的对话。我试了一下,它会把上下文带回来,Agent 记得我们之前聊过什么。这在手机上太实用了——谁想每次打开都从头教一遍?
实际使用场景
我用它做了几件事。一个是让它帮我查 GitHub 上某个项目的最近提交,Agent 自动调了 GitHub API,把结果整理成中文摘要发给我。另一个是我让它监控一个网站的 API 状态,每隔十分钟检查一次,异常就推通知。
这些任务在电脑上当然也能做,但能在手机浏览器里完成,意味着我可以躺在沙发上、等地铁的时候,随时给 Agent 派活。
快速上手
项目是 Python 写的,安装意外地简单:
git clone https://github.com/nesquena/hermes-webui.git
cd hermes-webui
pip install -r requirements.txt
python app.py
默认跑在 localhost 上。如果你想让手机也能访问,加一句 --host 0.0.0.0 就行。没有 Docker,没有复杂的配置, literally 三步搞定。
优缺点
优点很明显:零门槛、移动端体验好、界面干净。对于想体验 Agent 框架但不想折腾命令行的人来说,这几乎是最友好的入口。
缺点也有。项目还很新,我翻了一下 issue 区,有几个用户反馈在 Safari 上偶尔会出现连接断开的问题。另外它目前只支持 Hermes Agent,如果你用的是 LangChain 或者 AutoGPT,那暂时还用不上这个 UI。
还有一个比较现实的限制:因为跑在浏览器里,复杂的长时间任务(比如批量处理几千个文件)体验一般。手机端适合轻量级、交互型的任务,重活还是回电脑上干吧。
跟竞品比怎么样
市面上类似的 Agent UI 不算少。OpenWebUI 功能最全,但部署起来像开飞机;LangFlow 偏向可视化编排,更像给开发者用的工具;而 Hermes WebUI 的定位很清晰——就是让你快速、轻松地用上 Hermes Agent。
它不追求大而全,而是把「移动端可用」这个点打透。这个取舍我觉得很聪明。
适合谁用
如果你是 Hermes Agent 的用户,或者想找一个能在手机上跑的轻量级 Agent 界面,这个项目值得一试。反过来说,如果你需要复杂的多 Agent 协作、自定义插件生态,那可能还得继续用更重的方案。
我猜这个项目接下来会加 PWA 支持,到时候体验还能再上一个台阶。
关于作者
柳钉鱼,全栈开发者,GitHub 重度用户。过去 3 年 Star 了 900+ 仓库,这里只写我真正用过或深度调研过的工具。
📧 发现好工具想推荐?发邮件到 [email protected]
广告