Buzz 体验记:本地跑 Whisper 的语音转写工具,到底好不好用?
Buzz 是一款基于 OpenAI Whisper 的本地化音频转录与翻译工具,1.8 万星的开源项目。我用了几周做会议记录和播客字幕,分享一些真实感受。
广告
Buzz 体验记:本地跑 Whisper 的语音转写工具,到底好不好用?
我以前一直用某讯飞的转写服务做播客字幕,每个月要花几十块钱不说,还得把音频上传到云端,有些访谈类内容涉及隐私,心里总不踏实。后来在 GitHub 上翻到了 Buzz,这玩意儿直接把 Whisper 装到桌面上,完全离线跑——我一下子就被吸引了。
它到底是个啥
Buzz 是 Chidi Williams 写的一个开源桌面应用,用 Python 开发,GitHub 现在攒了 1.8 万星。本质上它就是给 OpenAI 的 Whisper 模型套了个图形界面,让普通用户不用碰命令行就能做音频转录。
支持 Mac、Windows、Linux 三平台,License 是 MIT,商业用途也没问题。最近一次更新是 2026 年 4 月底,维护得相当勤快。
我实际用下来,这几个点真香
完全离线,隐私无忧。我录过一些客户访谈,内容比较敏感,以前不敢传到云端转写工具上。Buzz 跑的是本地模型,音频文件压根不出电脑,这一点对我来说就值回票价了。
模型大小自己挑。Whisper 有 tiny、base、small、medium、large 几个尺寸,Buzz 全都支持。我笔记本是 M2 MacBook Air,跑 small 模型实时转写一段中文播客没问题,准确率大概在 92% 左右。要追求更高准确率就上 large-v3,代价是处理速度会慢一些——一段 30 分钟的音频,在我机器上大概要跑 5 分钟。
实时转写也能搞。Buzz 不光能处理录好的音频文件,还能直接接系统麦克风,边录边转。我开会用过几次,虽然偶尔有几个字飘忽,但整体能用,导出 SRT 字幕文件特别方便。
多语言互译。Whisper 本身支持 99 种语言互译,Buzz 直接把这个能力暴露出来了。我试过把一段日语播客直接转成英文文本,效果意外地不错——比我自己用谷歌翻译再校对快多了。
怎么快速跑起来
最省事的办法是直接去 GitHub Releases 下载安装包,Mac 和 Windows 都有现成的。打开之后界面非常朴素——选音频文件、选模型大小、选输出语言,点开始就完事。
如果你想从源码跑,也很直接:
git clone https://github.com/chidiwilliams/buzz
cd buzz
pip install poetry
poetry install
poetry run python -m buzz
第一次跑的时候它会自动下载选中的 Whisper 模型,网络不好的话可以提前手动下载放到 ~/.cache/whisper 里。我第一次下 large-v3 模型花了 20 多分钟,后面就不用等了。
几个坑得提前知道
显卡支持有点麻烦。如果你想用 NVIDIA 显卡加速,得自己装 CUDA 和对应版本的 PyTorch。Mac 用户走 Metal 后端基本无感,Linux 用户体验最折腾。我有个朋友在 RTX 4060 上配了大半天才跑起来。
长音频偶尔会出戏。超过两小时的音频,模型有时候会卡在某段反复输出同一句话(社区里管这叫 hallucination)。解决办法是先用 ffmpeg 切成 30 分钟一段再丢进去。这其实是 Whisper 模型本身的毛病,不是 Buzz 的锅。
界面不算精致。这毕竟是开源工具,UI 看着有点上世纪的感觉。功能虽全但摆放杂乱,新手第一次进去可能要找半天”实时转写”在哪。社区一直在喊重做界面,但项目作者一个人维护,精力有限。
中文标点会丢。Whisper 对中文的处理,标点符号经常缺失,需要后期手动补。这个不是 Buzz 能解决的,是底层模型的问题——但用户得有心理准备。
跟同类工具比起来
我也试过 MacWhisper(只有 Mac 版,有付费门槛)、Aiko(Mac 免费但功能简陋)、还有 Whisper.cpp 命令行版。
Buzz 最大的优势是跨平台 + 全功能 + 完全免费。MacWhisper 的 UI 更精致但要 30 多刀,Aiko 是免费但只能做最基础的转写,Whisper.cpp 性能强但对非技术用户太不友好。
云端的 OpenAI Whisper API 也是个选择,准确率最高、不挑硬件,但每分钟要 0.006 美元,而且你得相信 OpenAI 不会偷看你的音频。
谁应该用
如果你是播客主、自媒体、记者、学生(做访谈记录),或者公司里需要做会议纪要的同事,Buzz 真的能省不少钱和时间。特别是涉及隐私内容的场景,本地处理这一点就完胜所有云服务。
但如果你只是偶尔转个语音消息,云端服务可能更方便——毕竟 Buzz 第一次跑要下几个 G 的模型,不是所有人都愿意为偶发需求折腾。
总结
Buzz 不是那种花里胡哨的 AI 产品,它就是把 Whisper 这个开源神器,以最直接的方式塞到你桌面上。1.8 万星是有道理的——它解决了真实需求,做到了”够用、好装、不收费”。我现在的工作流里它已经替代了商业服务,也推荐给了几个做内容的朋友,反馈都不错。
唯一的建议是:别只用 base 或 small 模型,如果你电脑还行,直接上 medium,体验完全是另一个档次。
GitHub: https://github.com/chidiwilliams/buzz
关于作者
柳钉鱼,全栈开发者,GitHub 重度用户。过去 3 年 Star 了 900+ 仓库,这里只写我真正用过或深度调研过的工具。
📧 发现好工具想推荐?发邮件到 [email protected]
广告