AI 工具
English

Open WebUI 实测:本地跑 LLM 最舒服的界面,没有之一

open-webui/open-webui 是一个 13 万星的开源项目,给 Ollama 和各种 LLM API 套了一个极其精致的 Web 界面。我在本地部署用了一周,分享体验。

ollamallmself-hostedaiwebuirag

广告

Open WebUI 实测:本地跑 LLM 最舒服的界面,没有之一

用过 Ollama 命令行的朋友都知道,跑本地模型虽然爽,但交互体验基本停留在”终端聊天气泡”级别。我也试过几个第三方 UI,要么功能残缺,要么配置麻烦到想放弃。直到发现了 Open WebUI——GitHub 上 13 万星,直接颠覆了我对本地 LLM 界面的预期。

这界面到底强在哪

第一印象就是精致。不是那种”开源项目凑合能用”的精致,是拿出去跟 ChatGPT 官网比也不虚的精致。Markdown 渲染、代码高亮、LaTeX 公式、图片上传理解,全都有。而且完全离线运行,数据不出本机。

多模型切换做得特别好。我可以同时配置 Ollama 本地模型(qwen2.5、llama3)和 OpenAI/Claude API,对话中间随时切换。比如先让本地模型写个草稿,再切到 GPT-4o 润色,无缝衔接。

RAG 知识库是意外惊喜。直接上传 PDF、Word、TXT,它会自动切分向量化,然后聊天的时候就能基于文档内容回答。我试了一份 200 页的技术白皮书,问具体参数它能准确定位到第几页。用的是本地向量模型,不需要联网。

MCP 支持也很新。最近版本接入了 Model Context Protocol,可以直接连各种 MCP server,让本地模型也能操作文件系统、查数据库、调用工具。这个能力以前只有 Claude Code 有,现在 Open WebUI 也能玩了。

部署有多简单

如果你已经装了 Ollama,就一行:

docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

打开 http://localhost:3000,注册第一个账号就是管理员。然后进设置里填 API key、配置本地模型路径,完事。

实际用下来的一些细节

语音输入支持 Whisper,我开会的时候直接对着麦克风说需求,它转文字后发给模型处理。准确率还行,中文夹杂英文术语的时候偶尔会翻车。

图片生成接 Stable Diffusion 或 DALL-E,在对话里直接说”帮我画一张…”就能出图。不过 SD 的配置稍微麻烦一点,需要单独起服务。

团队协作功能也挺实用。可以创建多个工作区,不同的人用不同的模型配置和知识库。我给团队搭了一个内部版,大家共用一套 RAG 知识库,问公司规范、查历史文档特别方便。

缺点也得说

资源占用比纯命令行高不少。跑在 Docker 里内存常年占 2-3GB,加上大模型本身,16GB 内存的笔记本有点紧张。

移动端体验一般。虽然界面是响应式的,但手机上用还是不如原生 App 顺手,尤其是长对话滚动的时候。

高级功能文档不够细。比如 RAG 的 chunk 策略、向量模型选择、MCP 配置,这些东西得自己去翻 issue 和 discord 才能搞清楚。

适合谁

如果你已经在用 Ollama 跑本地模型,Open WebUI 几乎是必装的。它把本地 LLM 的体验从”能用”直接拉到了”好用”。如果你是纯云端 API 用户,它也支持 OpenAI/Claude/Gemini,相当于一个统一的多模型客户端,而且数据隐私更有保障。

13 万星在这个细分领域确实是断层领先。我准备长期用下去,也把团队的知识库逐步迁移过来。


关于作者

柳钉鱼,全栈开发者,GitHub 重度用户。过去 3 年 Star 了 900+ 仓库,这里只写我真正用过或深度调研过的工具。

📧 发现好工具想推荐?发邮件到 [email protected]

广告

相关文章