最佳离线语音备忘录应用 | 100%私密

2025年5月5日
·
5 min read
·Whisper Notes Team

语音的隐私:为什么我们选择本地架构

在便利与掌控之间,不需要做妥协。

语音备忘录的特殊性

语音备忘录往往是混乱的、未经过滤的、私密的。它们捕捉的是形成中的思想——还没打磨好的想法、还没消化完的情绪、还没组织好的观察。正是这种原始状态,让它们如此珍贵。

它们的感觉和一份润色好的文档不同。这种感觉很重要。

当你录制语音备忘录时,你往往是在对自己说话。那个时刻的亲密感——说了一半的句子、跑题的思绪、毫无保留的坦诚——在技术处理上,值得某种特别的尊重。

一个数字卫生的问题

你的声音是一种独特的生物特征标识符。和密码不同,你没法重置它。和信用卡号不同,你没法申请一个新的。这不是为了制造恐慌——只是声音数据的一个特性,值得认识到。

对于大多数日常录音,云端处理完全没问题。但对于敏感内容——私人反思、工作笔记、客户谈话——让原始音频文件远离云端,只是一种良好的数字卫生习惯。这和不用明文存储密码是同一个道理:不是因为灾难迫在眉睫,而是因为周到的架构设计能在问题出现之前就预防它们。

我们围绕这个原则构建了 Whisper Notes。你的音频留在你的设备上——不是因为我们觉得云服务很危险,而是因为我们相信你应该有选择的权利。

技术架构

Whisper Notes 直接在你的硬件上运行 OpenAI 的 Whisper 语音识别模型。没有服务器组件。你的录音在本地处理,永远不会传输到任何地方。

Mac 和 iPhone 上的实现有所不同,以针对各平台的能力进行优化:

Mac:Whisper Large-v3 Turbo

在 Mac 上,我们运行 Whisper Large-v3 Turbo——一个为 Apple Silicon 优化的 15 亿参数模型。这能提供接近云端转写服务的准确度,带有正确的标点符号和智能的段落格式。

处理速度随芯片性能而变化:M4 芯片大约达到 12 倍实时速度,而 M1 芯片大约是 8 倍实时速度。

iPhone:移动端优化的 Whisper 模型

移动设备有不同的限制——散热上限、电池续航、内存带宽。我们部署了一个专门为 A 系列和 M 系列芯片的神经网络引擎调优的移动端优化 Whisper 模型。

虽然比 Mac 模型小,但它能产出结构化、有标点的文本,表现始终优于标准听写。取舍是诚实的:对于长录音的最高准确度,在 Mac 上处理。对于快速捕捉,移动端模型表现很好。

为速度而设计

好想法不会等待。它们在开车时、走路时、睡前、排队时出现。锁屏小组件的设计目标是最小化摩擦,让你用最快的速度从想法到录音。

iPhone 锁屏上的 Whisper Notes 录音小组件和实时活动

锁屏小组件配合实时活动

  • 一键激活:直接从锁屏开始录音
  • 实时活动:灵动岛上显示录音时长的视觉确认
  • Face ID 集成:小组件与 Face ID 认证流畅协作
  • 支持免提:戴手套、湿手、AirPods 点击手势都能用

捕捉-回顾工作流

最有效的语音备忘录工作流将捕捉和回顾分开。移动设备擅长快速录音;桌面环境擅长深度编辑。

iPhone:捕捉

用 iPhone 在想法闪现时捕捉它们。锁屏小组件将摩擦降低到一次点击。移动端模型立即转写,马上给你可用的文本。

Mac:回顾

在 Mac 上,Whisper Notes 提供深度工作的工具:

  • Large-v3 Turbo 处理:以最高准确度重新转写录音
  • 带时间戳的段落:点击任意段落跳转到音频中的对应时刻
  • 同步播放:音频播放时文本高亮
  • 灵活导出:纯文本、带时间戳格式或 SRT 字幕
  • 系统级听写:按住 Fn 键直接在任何应用中听写
Mac 界面显示带时间戳的转写文本和播放控制

带时间戳的转写文本配合同步音频播放

安心感

真正的好处不只是技术上的安全——而是心理上的。

知道你的音频永远不会离开你的设备,给了你完全自由表达的空间,不用自我审查。你可以录下半成形的想法、发泄情绪、天马行空地头脑风暴、记录敏感的工作事务——完全不用担心谁可能最终会接触到那些音频。

这就像有些人更喜欢用纸质笔记本的原因:不是因为数字笔记不安全,而是因为那种隐私感会改变你思考的自由度。

经济模型

由于所有处理都在你的设备上进行,没有随使用量扩展的服务器成本。这使得一次性购买模式成为可能:iPhone 和 Mac 一共 4.99 美元,永久有效。

无订阅。无按分钟计费。无使用限制。

诚实的取舍

本地处理涉及真实的取舍,值得了解:

需要考虑的因素

  • 处理速度:设备端推理比云端 API 慢。10 分钟录音在 iPhone 15 上需要 1-2 分钟处理。云服务几秒就能返回结果。
  • 准确度上限:Whisper 在清晰语音上达到 95% 以上准确度。重口音或嘈杂背景可能需要一些编辑。
  • 平台限制:仅限 Apple Silicon——Mac M1 或更新,iPhone 需 iOS 18+。没有 Android 或 Windows。
  • 录音后转写:Whisper Notes 在录音后转写,而不是录音过程中。这能产生更准确的结果。

适合的场景

Whisper Notes 适合:

  • 注重隐私的专业人士:法律、医疗、新闻、心理咨询
  • 个人反思:日记、想法捕捉、思绪整理
  • 离线环境:飞机、安全设施、网络不稳定的地方
  • 厌倦订阅的用户:一次付款,永久使用

可能需要其他选择的场景

如果你需要以下功能,云服务可能更适合:

  • • 与团队共享的实时转写
  • • 长时间录音的即时处理
  • • Android 或 Windows 支持

总结

Whisper Notes 建立在一个简单的前提上:语音备忘录是私密的,你应该掌控那些音频存放在哪里。我们选择本地优先架构,不是因为云服务不好,而是因为有些内容值得留在你的设备上。

Mac 上的 Whisper Large-v3 Turbo 提供准确度。iPhone 上的移动端优化模型提供快速捕捉。两个平台都完全离线处理。

4.99 美元一次性购买。iPhone 和 Mac。你的音频只属于你。