语音转文字:为什么打字限制了思考

你的思维速度是每分钟 150 个词,打字只有 40 个。这个差距是真实的,它每天都在吞噬你的想法。

Voice to Text Offline

为什么打字限制了思考

你的大脑跑的是说话的速度。键盘强迫你把想法翻译成手指动作。语音跳过这层翻译。Whisper Notes 在本地把语音转成文字——Mac 用 Whisper Large-v3 Turbo,iPhone 用神经引擎优化模型。你的音频永远不碰服务器。

  • Mac:按住 Fn 随处说——Claude、ChatGPT、Slack、VS Code,哪里都行
  • iPhone:锁屏小组件 1 秒秒开录音
  • 一切都在你设备上处理。不上传。永远不。
  • $4.99 买断。两个平台。没有订阅。

Mac (macOS 14+, Apple Silicon) · iPhone (iOS 18+)

Mac 端:Fn 键即时输入

你 Mac 上的每个输入框现在都是语音界面。邮件草稿、Slack 回复、代码注释、AI 提示词——任何能打字的地方,现在都能说话。按住 Fn,说,松开。文字出现在光标处。不用切应用。不用等。

全系统语音输入

Whisper Notes 装了一个全局快捷键。在任何应用里——Claude、ChatGPT、Gemini、Gmail、Notion、VS Code,甚至 Terminal——按住 Fn 说话。松开后,Whisper Large-v3 Turbo 在本地处理音频。文字出现在光标位置。零云端延迟。

  • 所有 Mac 应用都能用。没有例外。
  • 文字秒出现在光标位置
  • Whisper Large-v3 Turbo:15 亿参数,本地跑
  • 30 秒搞定设置:设置 → 键盘快捷键 → 启用

Works in: Claude, ChatGPT, Gemini, Gmail, Slack, VS Code, Terminal, Notion

流式出结果

不用等整个文件处理完。结果一段段出来。边转录边看边改。

自定义词汇

AI 模型对人名和专业术语容易翻车。加上你的词汇表——公司名、产品名、技术术语。大小写保持原样("Claude Opus 4.5" 就是 "Claude Opus 4.5",不是 "claude opus")。

Claude, GPT-4, Gemini, Whisper · OAuth, TypeScript, Kubernetes · HIPAA, GDPR, SOC2

静默处理

Whisper 在长时间停顿时会产生幻觉——重复词句或编造内容。语音活动检测捕捉这些静默段并正确处理。有自然停顿的音频,幻觉问题减少 70%。

有多快?

M4: 12 倍实时(2 小时音频 → 10 分钟)

M3/M2: 10 倍实时

M1: 8 倍实时

杀手级场景:用嘴跟 AI 聊天

跟 Claude 聊

按住 Fn,详细描述你的问题。自然说话比打字更容易写出好的提示词。松开,发送。不用从别的应用复制粘贴。就你和 AI,直接聊。

Slack 和邮件

长回复是阻力。语音消灭阻力。在撰写框按住 Fn,说出你想说的,松开。20 秒搞定,而不是敲 3 分钟键盘。

写初稿

写作者普遍反映,口述的初稿更放松、更真实。键盘会在潜意识里建一道编辑墙。语音绕过它。先把想法倒出来,之后再改。

移动端:灵感来了就抓住

好想法不会等你坐到桌前。它们在散步时袭来、在洗澡时、凌晨 2 点、排队买咖啡时。锁屏小组件把捕捉阻力降到接近零。点一下,说,完了。想法在消失前就被保存了。

锁屏小组件

  • 从手机在口袋里到开始录音 1 秒搞定
  • 实时活动显示你说了多久
  • 灵动岛显示录音状态
  • 不用打开应用,不用输密码

解放双手

  • 戴手套、手湿、两手都拎着东西——都能用
  • AirPods 敲一下开始/停止
  • 低语级别灵敏度,安静环境也能用
  • 户外风噪和环境噪音处理

导出到任何地方

  • 复制到剪贴板秒粘贴
  • 分享到备忘录、信息、邮件,任何应用
  • 带时间戳导出方便回顾
  • SRT 字幕格式用于视频

凌晨 2 点的灵感问题

睡前

"那个 API 设计是错的。事件应该是不可变的。明早第一件事重构成事件溯源模式。"

晨跑

"文章想法:键盘作为思维压缩算法。我们写的和想的不一样,因为打字太慢了。"

散步

"会议卡住了因为我们在优化错误的指标。围绕留存而不是参与度来重新定义。"

为什么离线很重要

你的音频永远不离开设备

  • 不上传服务器——处理在神经引擎(iPhone)或 Metal(Mac)上进行
  • 不用担心数据保留政策,因为根本没有数据传输
  • 放心用于机密对话、HIPAA 敏感笔记、法律工作
  • 你的录音只存在于你拥有的硬件上

没网也能用

  • 飞行模式、地铁隧道、信号不好——都能用
  • 限制网络的安全设施——能用
  • 延迟只是处理时间,不是网络往返
  • 服务器过载时性能不会下降

买一次,用一辈子

  • $4.99 买断 iPhone 和 Mac。两个都包。
  • 不按分钟收费,没有使用上限,没有「免费版」限制
  • 语音重度用户在其他地方每年花 $120-180
  • 第一个月就回本

对比一下

功能Whisper NotesApple 听写SuperWhisperWispr Flow
处理位置100% 本地Apple 服务器100% 本地云服务器
iPhone + Mac$4.99 都包免费只有 Mac只有 Mac
锁屏小组件没有没 iPhone 应用没 iPhone 应用
全系统 Fn 键
价格模式$4.99 买断免费$8.49/月 或 $249$10-15/月
AI 模型Whisper Large-v3 TurboApple 专有Whisper 变体GPT-4 + Whisper
自定义词汇没有
年费总共 $4.99免费$102/年$120-180/年

Whisper Notes 是唯一同时满足这些条件的:两个平台 + 100% 离线 + 锁屏捕捉 + 一次性付款。

说实话的权衡

本地处理有真实的权衡。我们觉得对大多数人来说是值的,但你应该知道你在买什么:

模型下载

Mac 自带 580MB 通用模型,所有 Apple Silicon Mac 都能跑。如果你的机器性能更强,可以在应用内下载 Whisper Large V3 Turbo(约 3GB)获得更高精度。我们正在测试 Parakeet 等新架构,持续推进本地转录的边界。

只支持 Apple

这是 Apple Silicon 应用。需要 M1 或更新的 Mac、iOS 18+ 的 iPhone。没有 Android。没有 Windows。没有 Intel Mac。如果你不在 Apple 生态,这不适合你。

速度 vs 云端

本地推理比云 API 慢。10 分钟音频在 iPhone 15 上需要 1-2 分钟处理。云服务几秒就返回。如果你需要对一小时的录音秒出结果,云端可能更合适。

准确率天花板

Whisper 在清晰语音上达到 95% 以上准确率。重口音、嘈杂背景或含糊发音需要一些编辑。如果你需要 99.9% 准确率做医疗记录,请雇人工转录员。如果你需要 95% 准确率、即时且私密,这个能用。

开始使用

iPhone

  1. 1.从 App Store 下载 Whisper Notes ($4.99)
  2. 2.打开一次——模型自动下载
  3. 3.长按主屏幕 → 点 '+' → 搜 'Whisper Notes' → 添加小组件
  4. 4.从锁屏点击小组件。开始录了。

Mac

  1. 1.下载 Whisper Notes(买 iPhone 版就包含)
  2. 2.打开一次——模型自动下载
  3. 3.设置 → 键盘快捷键 → 启用全局听写
  4. 4.提示时授予辅助功能权限
  5. 5.随便哪里按住 Fn 开始说

弥合差距

通用购买:$4.99 买断 iPhone 和 Mac。无订阅。不按分钟收费。开口就行。

Fn 键听写 · 锁屏小组件 · 100+ 语言 · 100% 离线 · 一次性购买