语音转文字:为什么打字限制了思考
你的思维速度是每分钟 150 个词,打字只有 40 个。这个差距是真实的,它每天都在吞噬你的想法。

为什么打字限制了思考
你的大脑跑的是说话的速度。键盘强迫你把想法翻译成手指动作。语音跳过这层翻译。Whisper Notes 在本地把语音转成文字——Mac 用 Whisper Large-v3 Turbo,iPhone 用神经引擎优化模型。你的音频永远不碰服务器。
- •Mac:按住 Fn 随处说——Claude、ChatGPT、Slack、VS Code,哪里都行
- •iPhone:锁屏小组件 1 秒秒开录音
- •一切都在你设备上处理。不上传。永远不。
- •$4.99 买断。两个平台。没有订阅。
Mac (macOS 14+, Apple Silicon) · iPhone (iOS 18+)
Mac 端:Fn 键即时输入
你 Mac 上的每个输入框现在都是语音界面。邮件草稿、Slack 回复、代码注释、AI 提示词——任何能打字的地方,现在都能说话。按住 Fn,说,松开。文字出现在光标处。不用切应用。不用等。
全系统语音输入
Whisper Notes 装了一个全局快捷键。在任何应用里——Claude、ChatGPT、Gemini、Gmail、Notion、VS Code,甚至 Terminal——按住 Fn 说话。松开后,Whisper Large-v3 Turbo 在本地处理音频。文字出现在光标位置。零云端延迟。
- •所有 Mac 应用都能用。没有例外。
- •文字秒出现在光标位置
- •Whisper Large-v3 Turbo:15 亿参数,本地跑
- •30 秒搞定设置:设置 → 键盘快捷键 → 启用
Works in: Claude, ChatGPT, Gemini, Gmail, Slack, VS Code, Terminal, Notion
流式出结果
不用等整个文件处理完。结果一段段出来。边转录边看边改。
自定义词汇
AI 模型对人名和专业术语容易翻车。加上你的词汇表——公司名、产品名、技术术语。大小写保持原样("Claude Opus 4.5" 就是 "Claude Opus 4.5",不是 "claude opus")。
Claude, GPT-4, Gemini, Whisper · OAuth, TypeScript, Kubernetes · HIPAA, GDPR, SOC2
静默处理
Whisper 在长时间停顿时会产生幻觉——重复词句或编造内容。语音活动检测捕捉这些静默段并正确处理。有自然停顿的音频,幻觉问题减少 70%。
有多快?
M4: 12 倍实时(2 小时音频 → 10 分钟)
M3/M2: 10 倍实时
M1: 8 倍实时
杀手级场景:用嘴跟 AI 聊天
跟 Claude 聊
按住 Fn,详细描述你的问题。自然说话比打字更容易写出好的提示词。松开,发送。不用从别的应用复制粘贴。就你和 AI,直接聊。
Slack 和邮件
长回复是阻力。语音消灭阻力。在撰写框按住 Fn,说出你想说的,松开。20 秒搞定,而不是敲 3 分钟键盘。
写初稿
写作者普遍反映,口述的初稿更放松、更真实。键盘会在潜意识里建一道编辑墙。语音绕过它。先把想法倒出来,之后再改。
移动端:灵感来了就抓住
好想法不会等你坐到桌前。它们在散步时袭来、在洗澡时、凌晨 2 点、排队买咖啡时。锁屏小组件把捕捉阻力降到接近零。点一下,说,完了。想法在消失前就被保存了。
锁屏小组件
- •从手机在口袋里到开始录音 1 秒搞定
- •实时活动显示你说了多久
- •灵动岛显示录音状态
- •不用打开应用,不用输密码
解放双手
- •戴手套、手湿、两手都拎着东西——都能用
- •AirPods 敲一下开始/停止
- •低语级别灵敏度,安静环境也能用
- •户外风噪和环境噪音处理
导出到任何地方
- •复制到剪贴板秒粘贴
- •分享到备忘录、信息、邮件,任何应用
- •带时间戳导出方便回顾
- •SRT 字幕格式用于视频
凌晨 2 点的灵感问题
睡前
"那个 API 设计是错的。事件应该是不可变的。明早第一件事重构成事件溯源模式。"
晨跑
"文章想法:键盘作为思维压缩算法。我们写的和想的不一样,因为打字太慢了。"
散步
"会议卡住了因为我们在优化错误的指标。围绕留存而不是参与度来重新定义。"
为什么离线很重要
你的音频永远不离开设备
- •不上传服务器——处理在神经引擎(iPhone)或 Metal(Mac)上进行
- •不用担心数据保留政策,因为根本没有数据传输
- •放心用于机密对话、HIPAA 敏感笔记、法律工作
- •你的录音只存在于你拥有的硬件上
没网也能用
- •飞行模式、地铁隧道、信号不好——都能用
- •限制网络的安全设施——能用
- •延迟只是处理时间,不是网络往返
- •服务器过载时性能不会下降
买一次,用一辈子
- •$4.99 买断 iPhone 和 Mac。两个都包。
- •不按分钟收费,没有使用上限,没有「免费版」限制
- •语音重度用户在其他地方每年花 $120-180
- •第一个月就回本
对比一下
| 功能 | Whisper Notes | Apple 听写 | SuperWhisper | Wispr Flow |
|---|---|---|---|---|
| 处理位置 | 100% 本地 | Apple 服务器 | 100% 本地 | 云服务器 |
| iPhone + Mac | $4.99 都包 | 免费 | 只有 Mac | 只有 Mac |
| 锁屏小组件 | 有 | 没有 | 没 iPhone 应用 | 没 iPhone 应用 |
| 全系统 Fn 键 | 有 | 有 | 有 | 有 |
| 价格模式 | $4.99 买断 | 免费 | $8.49/月 或 $249 | $10-15/月 |
| AI 模型 | Whisper Large-v3 Turbo | Apple 专有 | Whisper 变体 | GPT-4 + Whisper |
| 自定义词汇 | 有 | 没有 | 有 | 有 |
| 年费 | 总共 $4.99 | 免费 | $102/年 | $120-180/年 |
Whisper Notes 是唯一同时满足这些条件的:两个平台 + 100% 离线 + 锁屏捕捉 + 一次性付款。
说实话的权衡
本地处理有真实的权衡。我们觉得对大多数人来说是值的,但你应该知道你在买什么:
模型下载
Mac 自带 580MB 通用模型,所有 Apple Silicon Mac 都能跑。如果你的机器性能更强,可以在应用内下载 Whisper Large V3 Turbo(约 3GB)获得更高精度。我们正在测试 Parakeet 等新架构,持续推进本地转录的边界。
只支持 Apple
这是 Apple Silicon 应用。需要 M1 或更新的 Mac、iOS 18+ 的 iPhone。没有 Android。没有 Windows。没有 Intel Mac。如果你不在 Apple 生态,这不适合你。
速度 vs 云端
本地推理比云 API 慢。10 分钟音频在 iPhone 15 上需要 1-2 分钟处理。云服务几秒就返回。如果你需要对一小时的录音秒出结果,云端可能更合适。
准确率天花板
Whisper 在清晰语音上达到 95% 以上准确率。重口音、嘈杂背景或含糊发音需要一些编辑。如果你需要 99.9% 准确率做医疗记录,请雇人工转录员。如果你需要 95% 准确率、即时且私密,这个能用。
开始使用
iPhone
- 1.从 App Store 下载 Whisper Notes ($4.99)
- 2.打开一次——模型自动下载
- 3.长按主屏幕 → 点 '+' → 搜 'Whisper Notes' → 添加小组件
- 4.从锁屏点击小组件。开始录了。
Mac
- 1.下载 Whisper Notes(买 iPhone 版就包含)
- 2.打开一次——模型自动下载
- 3.设置 → 键盘快捷键 → 启用全局听写
- 4.提示时授予辅助功能权限
- 5.随便哪里按住 Fn 开始说
弥合差距
通用购买:$4.99 买断 iPhone 和 Mac。无订阅。不按分钟收费。开口就行。
Fn 键听写 · 锁屏小组件 · 100+ 语言 · 100% 离线 · 一次性购买