Open WebUI 实测：本地跑 LLM 最舒服的界面，没有之一

用过 Ollama 命令行的朋友都知道，跑本地模型虽然爽，但交互体验基本停留在”终端聊天气泡”级别。我也试过几个第三方 UI，要么功能残缺，要么配置麻烦到想放弃。直到发现了 Open WebUI——GitHub 上 13 万星，直接颠覆了我对本地 LLM 界面的预期。

这界面到底强在哪

第一印象就是精致。不是那种”开源项目凑合能用”的精致，是拿出去跟 ChatGPT 官网比也不虚的精致。Markdown 渲染、代码高亮、LaTeX 公式、图片上传理解，全都有。而且完全离线运行，数据不出本机。

多模型切换做得特别好。我可以同时配置 Ollama 本地模型（qwen2.5、llama3）和 OpenAI/Claude API，对话中间随时切换。比如先让本地模型写个草稿，再切到 GPT-4o 润色，无缝衔接。

RAG 知识库是意外惊喜。直接上传 PDF、Word、TXT，它会自动切分向量化，然后聊天的时候就能基于文档内容回答。我试了一份 200 页的技术白皮书，问具体参数它能准确定位到第几页。用的是本地向量模型，不需要联网。

MCP 支持也很新。最近版本接入了 Model Context Protocol，可以直接连各种 MCP server，让本地模型也能操作文件系统、查数据库、调用工具。这个能力以前只有 Claude Code 有，现在 Open WebUI 也能玩了。

部署有多简单

如果你已经装了 Ollama，就一行：

docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

打开 http://localhost:3000，注册第一个账号就是管理员。然后进设置里填 API key、配置本地模型路径，完事。

实际用下来的一些细节

语音输入支持 Whisper，我开会的时候直接对着麦克风说需求，它转文字后发给模型处理。准确率还行，中文夹杂英文术语的时候偶尔会翻车。

图片生成接 Stable Diffusion 或 DALL-E，在对话里直接说”帮我画一张…”就能出图。不过 SD 的配置稍微麻烦一点，需要单独起服务。

团队协作功能也挺实用。可以创建多个工作区，不同的人用不同的模型配置和知识库。我给团队搭了一个内部版，大家共用一套 RAG 知识库，问公司规范、查历史文档特别方便。

缺点也得说

资源占用比纯命令行高不少。跑在 Docker 里内存常年占 2-3GB，加上大模型本身，16GB 内存的笔记本有点紧张。

移动端体验一般。虽然界面是响应式的，但手机上用还是不如原生 App 顺手，尤其是长对话滚动的时候。

高级功能文档不够细。比如 RAG 的 chunk 策略、向量模型选择、MCP 配置，这些东西得自己去翻 issue 和 discord 才能搞清楚。

适合谁

如果你已经在用 Ollama 跑本地模型，Open WebUI 几乎是必装的。它把本地 LLM 的体验从”能用”直接拉到了”好用”。如果你是纯云端 API 用户，它也支持 OpenAI/Claude/Gemini，相当于一个统一的多模型客户端，而且数据隐私更有保障。

13 万星在这个细分领域确实是断层领先。我准备长期用下去，也把团队的知识库逐步迁移过来。

关于作者

柳钉鱼，全栈开发者，GitHub 重度用户。过去 3 年 Star 了 900+ 仓库，这里只写我真正用过或深度调研过的工具。

📧 发现好工具想推荐？发邮件到 [email protected]

Open WebUI 实测：本地跑 LLM 最舒服的界面，没有之一

Open WebUI 实测：本地跑 LLM 最舒服的界面，没有之一

这界面到底强在哪

部署有多简单

实际用下来的一些细节

缺点也得说

适合谁

相关文章

MaxKB 深度评测：这个 2万星开源智能体平台，真能替代商业方案吗？

dotclaude 深度体验：把 Claude 变成你的全能开发搭档

微软 Magentic-UI 实测：AI 操控浏览器，离真正可用还有多远？