Stable Diffusion WebUI 三年老用户复盘:它为什么依然是 AI 画图的首选?
AUTOMATIC1111/stable-diffusion-webui 是 AI 图像生成领域最经典的开源项目,16 万星。作为用了三年的老用户,聊聊它到底强在哪,以及 2026 年还值不值得入坑。
广告
Stable Diffusion WebUI 三年老用户复盘:它为什么依然是 AI 画图的首选?
2023 年我第一次接触 AI 画图的时候,Midjourney 还得在 Discord 里排队,DALL-E 2 的画质也一般。朋友推荐我试试 Stable Diffusion,说本地跑免费无限量。我照着教程装了 AUTOMATIC1111 的 WebUI,那时候它大概三四万星吧。三年过去了,它涨到了 16 万星,而我也从一个只会抄 prompt 的小白变成了能自己炼 LoRA 的半吊子玩家。
今天不聊入门教程,聊聊作为一个老用户,为什么到了 2026 年我还在用它。
生态就是护城河
SD WebUI 最大的优势从来不是某个功能,而是生态。Civitai 上几十万个模型、LoRA、ControlNet 预处理器,几乎全是围绕 SD 生态建的。你想画二次元、写实人像、建筑效果图、产品渲染图,都能找到专门的模型和 workflow。
ControlNet 更是个神器。上传一张姿势参考图,让 AI 按这个姿势重新画;上传线稿,让 AI 上色;上传深度图,保持场景结构不变换风格。这些能力 MJ 和 DALL-E 到现在也做不到这么精细的控制。
插件系统也是无底洞。从提示词补全、画质增强到视频生成, community 写的插件少说几百个。我常用的就有:
- adetailer:自动修复脸崩和手崩
- controlnet:姿势/线稿/深度控制
- region-prompter:分区 prompt,左边画人右边画景
- animatediff:图生视频
2026 年的实际体验
硬件要求确实降了不少。当年我跑 SD 1.5 还得 8GB 显存,现在 SDXL 在 6GB 显存上也能跑, thanks to 各种优化技术(fp8、tile vae、cpu offload)。我的 RTX 3060 12GB 跑 SDXL 512x512 大概 5 秒一张,完全能接受。
SDXL + Lightning 的组合是我目前的日常配置。画质比早期 SD 1.5 好太多,生成速度也快。配合 refiner 做两步生成,细节丰富度接近 MJ v6 的八成,但完全免费。
Flux 支持也加了进来。虽然 WebUI 对 Flux 的支持不如 ComfyUI 原生,但基本功能都能跑。我偶尔用 Flux 做写实人像,确实比 SDXL 更自然。
和 Midjourney、DALL-E 怎么选
说实话,这三个工具我现在都在用,但场景完全不同:
- Midjourney:给客户看概念图、做视觉探索。提示词简单,出图审美在线,但控制精度几乎为零。
- DALL-E 3:跟 ChatGPT 配合做快速草图,理解自然语言能力最强,但画风单一。
- SD WebUI:需要精细控制的时候,比如指定姿势、换脸、保持角色一致性、炼自己的风格模型。以及——不想花钱的时候。
如果你只是偶尔玩一下 AI 画图,MJ 或 DALL-E 更省心。但如果你想深入这个领域,或者需要把 AI 画图融入自己的工作流,SD WebUI 是绕不过去的必修课。
槽点
学习曲线依然很陡。新手面对那一排排参数(CFG Scale、Steps、Sampler、Denoising strength)基本一脸懵。我带了三个朋友入坑,两个放弃了。
界面年代感。虽然功能全,但 WebUI 的界面设计确实有点老旧了。ComfyUI 的节点式 workflow 在复杂场景下更直观,我现在做复杂项目会切到 ComfyUI,简单出图还是回 WebUI。
** AGPL 协议**。商用需要注意,衍生作品也要开源。这点对想拿它做闭源产品的公司不太友好。
总结
三年过去,AI 画图领域新工具层出不穷,但 AUTOMATIC1111 的 WebUI 依然是那个最均衡的选择:免费、可控、生态庞大。16 万星不是运气,是它确实解决了大量真实需求。
我的建议是:如果你还没碰过 Stable Diffusion,2026 年依然是入坑的好时机。硬件门槛低了,模型质量高了,教程也遍地都是。先装起来跑几张图,剩下的交给好奇心。
关于作者
柳钉鱼,全栈开发者,GitHub 重度用户。过去 3 年 Star 了 900+ 仓库,这里只写我真正用过或深度调研过的工具。
📧 发现好工具想推荐?发邮件到 [email protected]
广告