语音的隐私:为什么我们选择本地架构
在便利与掌控之间,不需要做妥协。
语音备忘录的特殊性
语音备忘录往往是混乱的、未经过滤的、私密的。它们捕捉的是形成中的思想——还没打磨好的想法、还没消化完的情绪、还没组织好的观察。正是这种原始状态,让它们如此珍贵。
它们的感觉和一份润色好的文档不同。这种感觉很重要。
当你录制语音备忘录时,你往往是在对自己说话。那个时刻的亲密感——说了一半的句子、跑题的思绪、毫无保留的坦诚——在技术处理上,值得某种特别的尊重。
一个数字卫生的问题
你的声音是一种独特的生物特征标识符。和密码不同,你没法重置它。和信用卡号不同,你没法申请一个新的。这不是为了制造恐慌——只是声音数据的一个特性,值得认识到。
对于大多数日常录音,云端处理完全没问题。但对于敏感内容——私人反思、工作笔记、客户谈话——让原始音频文件远离云端,只是一种良好的数字卫生习惯。这和不用明文存储密码是同一个道理:不是因为灾难迫在眉睫,而是因为周到的架构设计能在问题出现之前就预防它们。
我们围绕这个原则构建了 Whisper Notes。你的音频留在你的设备上——不是因为我们觉得云服务很危险,而是因为我们相信你应该有选择的权利。
技术架构
Whisper Notes 直接在你的硬件上运行 OpenAI 的 Whisper 语音识别模型。没有服务器组件。你的录音在本地处理,永远不会传输到任何地方。
Mac 和 iPhone 上的实现有所不同,以针对各平台的能力进行优化:
Mac:Whisper Large-v3 Turbo
在 Mac 上,我们运行 Whisper Large-v3 Turbo——一个为 Apple Silicon 优化的 15 亿参数模型。这能提供接近云端转写服务的准确度,带有正确的标点符号和智能的段落格式。
处理速度随芯片性能而变化:M4 芯片大约达到 12 倍实时速度,而 M1 芯片大约是 8 倍实时速度。
iPhone:移动端优化的 Whisper 模型
移动设备有不同的限制——散热上限、电池续航、内存带宽。我们部署了一个专门为 A 系列和 M 系列芯片的神经网络引擎调优的移动端优化 Whisper 模型。
虽然比 Mac 模型小,但它能产出结构化、有标点的文本,表现始终优于标准听写。取舍是诚实的:对于长录音的最高准确度,在 Mac 上处理。对于快速捕捉,移动端模型表现很好。
为速度而设计
好想法不会等待。它们在开车时、走路时、睡前、排队时出现。锁屏小组件的设计目标是最小化摩擦,让你用最快的速度从想法到录音。
锁屏小组件配合实时活动
- • 一键激活:直接从锁屏开始录音
- • 实时活动:灵动岛上显示录音时长的视觉确认
- • Face ID 集成:小组件与 Face ID 认证流畅协作
- • 支持免提:戴手套、湿手、AirPods 点击手势都能用
捕捉-回顾工作流
最有效的语音备忘录工作流将捕捉和回顾分开。移动设备擅长快速录音;桌面环境擅长深度编辑。
iPhone:捕捉
用 iPhone 在想法闪现时捕捉它们。锁屏小组件将摩擦降低到一次点击。移动端模型立即转写,马上给你可用的文本。
Mac:回顾
在 Mac 上,Whisper Notes 提供深度工作的工具:
- • Large-v3 Turbo 处理:以最高准确度重新转写录音
- • 带时间戳的段落:点击任意段落跳转到音频中的对应时刻
- • 同步播放:音频播放时文本高亮
- • 灵活导出:纯文本、带时间戳格式或 SRT 字幕
- • 系统级听写:按住 Fn 键直接在任何应用中听写
带时间戳的转写文本配合同步音频播放
安心感
真正的好处不只是技术上的安全——而是心理上的。
知道你的音频永远不会离开你的设备,给了你完全自由表达的空间,不用自我审查。你可以录下半成形的想法、发泄情绪、天马行空地头脑风暴、记录敏感的工作事务——完全不用担心谁可能最终会接触到那些音频。
这就像有些人更喜欢用纸质笔记本的原因:不是因为数字笔记不安全,而是因为那种隐私感会改变你思考的自由度。
经济模型
由于所有处理都在你的设备上进行,没有随使用量扩展的服务器成本。这使得一次性购买模式成为可能:iPhone 和 Mac 一共 4.99 美元,永久有效。
无订阅。无按分钟计费。无使用限制。
诚实的取舍
本地处理涉及真实的取舍,值得了解:
需要考虑的因素
- • 处理速度:设备端推理比云端 API 慢。10 分钟录音在 iPhone 15 上需要 1-2 分钟处理。云服务几秒就能返回结果。
- • 准确度上限:Whisper 在清晰语音上达到 95% 以上准确度。重口音或嘈杂背景可能需要一些编辑。
- • 平台限制:仅限 Apple Silicon——Mac M1 或更新,iPhone 需 iOS 18+。没有 Android 或 Windows。
- • 录音后转写:Whisper Notes 在录音后转写,而不是录音过程中。这能产生更准确的结果。
适合的场景
Whisper Notes 适合:
- • 注重隐私的专业人士:法律、医疗、新闻、心理咨询
- • 个人反思:日记、想法捕捉、思绪整理
- • 离线环境:飞机、安全设施、网络不稳定的地方
- • 厌倦订阅的用户:一次付款,永久使用
可能需要其他选择的场景
如果你需要以下功能,云服务可能更适合:
- • 与团队共享的实时转写
- • 长时间录音的即时处理
- • Android 或 Windows 支持
总结
Whisper Notes 建立在一个简单的前提上:语音备忘录是私密的,你应该掌控那些音频存放在哪里。我们选择本地优先架构,不是因为云服务不好,而是因为有些内容值得留在你的设备上。
Mac 上的 Whisper Large-v3 Turbo 提供准确度。iPhone 上的移动端优化模型提供快速捕捉。两个平台都完全离线处理。
4.99 美元一次性购买。iPhone 和 Mac。你的音频只属于你。