語音轉文字:為什麼打字拖慢了思考

你的腦袋一分鐘跑 150 個字。手指只能敲 40 個。這個落差是真的,每天都在讓你流失想法。

Voice to Text Offline

為什麼打字拖慢了思考

你的大腦用說話的速度運轉。鍵盤強迫你把思緒翻譯成手指動作。語音跳過了這層翻譯。Whisper Notes 在本地把語音轉成文字——Mac 用 Whisper Large-v3 Turbo,iPhone 用 Neural Engine 優化模型。你的音訊永遠不會碰到伺服器。

  • Mac:按住 Fn 就能隨處聽寫——Claude、ChatGPT、Slack、VS Code,哪裡都行
  • iPhone:鎖屏小工具 1 秒啟動錄音
  • 一切都在你的裝置上完成。什麼都不會上傳。永遠不會。
  • $4.99 買斷。兩個平台。沒有訂閱。

Mac (macOS 14+, Apple Silicon) · iPhone (iOS 18+)

桌面:和任何 App 對話

你 Mac 上的每個文字框現在都是語音介面。寫郵件、回 Slack、加程式碼註解、打 AI 提示——能打字的地方,現在都能說話。按住 Fn,說,放開。文字出現在游標位置。不用切 App。不用等。

全系統語音輸入

Whisper Notes 裝了一個全域快捷鍵。在任何 App——Claude、ChatGPT、Gemini、Gmail、Notion、VS Code,連 Terminal 都行——按住 Fn 說話。放開後,Whisper Large-v3 Turbo 在本地處理你的音訊。文字出現在游標位置。零雲端延遲。

  • 所有 Mac App 都能用。沒有例外。
  • 文字瞬間出現在游標位置
  • Whisper Large-v3 Turbo:15 億參數,本地運行
  • 30 秒設定:設定 → 鍵盤快捷鍵 → 啟用

Works in: Claude, ChatGPT, Gemini, Gmail, Slack, VS Code, Terminal, Notion

串流結果

不用等整個檔案處理完。結果一段一段出現。邊轉錄邊開始閱讀和編輯。

自訂詞彙

AI 模型碰到名字和行話就會卡殼。加入你的詞彙——公司名、產品名、專業術語。大小寫會保留(「Claude Opus 4.5」就是「Claude Opus 4.5」,不會變成「claude opus」)。

Claude, GPT-4, Gemini, Whisper · OAuth, TypeScript, Kubernetes · HIPAA, GDPR, SOC2

靜音處理

Whisper 碰到長時間停頓會產生幻覺——重複句子或編造文字。語音活動偵測會捕捉這些靜默並正確處理。有自然停頓的音訊,幻覺減少 70%。

有多快?

M4: 12 倍即時(2 小時音訊 → 10 分鐘)

M3/M2: 10 倍即時

M1: 8 倍即時

殺手級使用場景:和 AI 對話

和 Claude 聊天

按住 Fn,詳細描述你的問題。自然說話產生的提示比打字好太多。放開,送出。不用從別的 App 複製貼上。就是你和 AI 在對話。

Slack 和郵件

長回覆是阻力。語音消除阻力。在輸入框按住 Fn,說你想說的,放開。20 秒搞定,不用花 3 分鐘敲鍵盤。

初稿

作家們一致反映,口述的初稿更放鬆、更誠實。鍵盤會製造一層無意識的編輯。語音繞過它。先把想法倒出來,之後再編輯。

行動:靈感來了就捕捉

好點子不會等你坐到桌前。它們在走路時冒出來,在洗澡時,在凌晨兩點,在排隊時。鎖屏小工具把捕捉的阻力降到幾乎為零。點一下,說,完成。想法在消失前就被存下來了。

鎖屏小工具

  • 從口袋掏出手機到開始錄音只要 1 秒
  • 即時動態顯示錄音時長
  • 動態島顯示錄音狀態
  • 不用開 App,不用輸密碼

解放雙手

  • 戴手套、手濕、雙手提滿東西——都能用
  • AirPods 點擊手勢啟動 / 停止
  • 低語級別的靈敏度,安靜的房間也行
  • 戶外風噪和環境音處理

匯出到任何地方

  • 複製到剪貼簿,馬上貼上
  • 分享到備忘錄、訊息、郵件,任何 App
  • 帶時間戳記匯出,方便回顧
  • SRT 格式用於影片字幕

凌晨兩點的靈感問題

睡前

「這個 API 設計是錯的。事件應該是不可變的。明天一早先重構成 event sourcing 模式。」

晨跑

「文章靈感:鍵盤是思維壓縮演算法。我們寫出來的和想的不一樣,因為打字太慢。」

散步

「會議卡住是因為我們在優化錯的指標。重新聚焦在留存率,不是互動率。」

為什麼離線很重要

你的音訊永遠不會離開你的裝置

  • 不上傳伺服器——處理在 Neural Engine (iPhone) 或 Metal (Mac) 上完成
  • 沒有資料保留政策,因為根本沒有資料傳輸
  • 適合機密對話、HIPAA 敏感筆記、法律工作
  • 你的錄音只存在於你擁有的硬體上

沒網路也能用

  • 飛航模式、地鐵隧道、不穩定的 Wi-Fi——都能用
  • 封鎖網路的安全設施——能用
  • 延遲只是處理時間,不是網路往返
  • 伺服器超載時效能也不會變差

買一次,永久使用

  • $4.99 買斷 iPhone 和 Mac。兩個。
  • 不按分鐘收費,不限使用量,沒有「免費版」限制
  • 重度語音使用者在別處一年花 $120-180
  • 第一個月就回本

比較

功能Whisper NotesApple 聽寫SuperWhisperWispr Flow
處理方式100% 本地Apple 伺服器100% 本地雲端伺服器
iPhone + Mac$4.99 兩個都包免費只有 Mac只有 Mac
鎖屏小工具沒有沒有 iPhone App沒有 iPhone App
全系統 Fn 鍵
價格模式$4.99 買斷免費$8.49/月 或 $249$10-15/月
AI 模型Whisper Large-v3 TurboApple 專有Whisper 變體GPT-4 + Whisper
自訂詞彙沒有
年度成本總共 $4.99免費$102/年$120-180/年

Whisper Notes 是唯一同時具備:兩個平台 + 100% 離線 + 鎖屏錄音 + 一次性付費的選項。

真誠的取捨

本地處理有真實的取捨。我們認為對大多數人來說值得,但你應該知道你會面對什麼:

模型下載

Mac 內建 580 MB 通用模型,所有 Apple Silicon Mac 都能跑。如果你的機器有更多算力,可以在 App 內下載 Whisper Large V3 Turbo(約 3 GB)獲得更高準確度。我們正在積極測試 Parakeet 等新架構,把本地轉錄推得更遠。

只支援 Apple

這是 Apple Silicon App。M1 或更新的 Mac,iOS 18+ 的 iPhone。沒有 Android。沒有 Windows。沒有 Intel Mac。如果你不在 Apple 生態系統裡,這不適合你。

速度 vs 雲端

本地推論比雲端 API 慢。10 分鐘音訊在 iPhone 15 上需要 1-2 分鐘處理。雲端服務幾秒鐘就回傳。如果你需要即時處理一小時的錄音,雲端可能更適合。

準確度上限

Whisper 在清晰語音上達到 95% 以上準確度。重口音、很吵的背景或含糊不清需要稍微編輯。如果你需要醫療紀錄 99.9% 的準確度,請雇用人工轉錄。如果你需要即時、私密的 95% 準確度,這個可以。

開始使用

iPhone

  1. 1.從 App Store 下載 Whisper Notes ($4.99)
  2. 2.打開一次——模型會自動下載
  3. 3.長按主畫面 → 點「+」→ 搜尋「Whisper Notes」→ 加入小工具
  4. 4.從鎖屏點擊小工具。開始錄音。

Mac

  1. 1.下載 Whisper Notes(iPhone 購買已包含)
  2. 2.打開一次——模型會自動下載
  3. 3.設定 → 鍵盤快捷鍵 → 啟用全域聽寫
  4. 4.授權輔助功能權限
  5. 5.在任何地方按住 Fn 開始說話

填補落差

通用購買:$4.99 買斷 iPhone 和 Mac。沒有訂閱。不按分鐘收費。說就對了。

Fn 鍵聽寫 · 鎖屏小工具 · 100+ 語言 · 100% 離線 · 買斷制