我想要离线就能用、不用每月掏$15的语音输入。试了一圈——Siri(要联网)、Wispr Flow(订阅制)、SuperWhisper(也是订阅)——最后干脆自己做了想要的东西:Mac上跑,哪都能用的全局语音输入。$4.99买断。
按住Fn,开始说话
1.2.3版本加了大家一直要的功能:随便在哪个应用里——Gmail、Slack、VS Code、终端,什么都行——按住Fn键说话就完了。松开,文字就出来了。
底层跑的是Whisper Large-v3 Turbo,目前最准的本地语音模型。全在本地处理——不用联网,没有服务器,数据不出你的机器。
设置只要30秒
- 1. 打开Whisper Notes
- 2. 设置 → 键盘快捷键
- 3. 启用全局语音输入
- 4. 提示时授予辅助功能权限
就这样。现在Fn键在Mac上随处都是语音输入了。
界面变更好了
我们重构了界面。现在更干净——视觉层级更好,交互更流畅,杂乱更少。用一段时间后你会注意到的那种打磨。
流式转录
结果准备好就流式输出,而不是让你等整个文件转完。文字一段段出现——你能立即开始阅读和编辑。
自定义词汇
Whisper挺好,但它会搞乱专业术语、公司名和缩写。添加你自己的词汇,模型转录时就会用。对小众行话有效,保留格式(比如"Claude Opus 4.5"而不是"claude opus four point five"),还能修复那些烦人的名字错误。
语音活动检测
长时间沉默过去会让Whisper产生幻觉——重复短语或编造文字来填补空白。语音活动检测(VAD)能捕捉这些沉默片段并正确处理。我们在有停顿的录音中把幻觉问题削减了约70%。转录现在更干净、更准确了。
性能提升
启动更快,模型加载更快,内存占用更低。整体感觉更敏捷。
和Wispr Flow比起来怎么样
| Whisper Notes | Wispr Flow | |
|---|---|---|
| 价格 | $4.99一次 | $10-15/月 |
| 离线 | 100%本地 | 需要联网 |
| 隐私 | 音频从不离开设备 | 音频发送到云端 |
| 延迟 | 即时(本地处理) | 网络延迟 |
| 准确度 | Whisper Large-v3 Turbo | 云端API(稍好一点) |
Wispr Flow的云端方案意味着某些情况下准确度略好一点。但这也意味着你的音频要去他们的服务器,需要联网,而且每月都要付钱。
如果你在意隐私——或者只是不想再多一个订阅——选择挺明确的。
试试看
$4.99就能同时拥有iOS和Mac版。如果你已经有iPhone应用,Mac版也包含在内——Apple的通用购买意味着买一次,随处用。
有想法或反馈?发邮件到[email protected]。我真的会读每条消息并回复。