語音轉文字:為什麼打字拖慢了思考
你的腦袋一分鐘跑 150 個字。手指只能敲 40 個。這個落差是真的,每天都在讓你流失想法。

為什麼打字拖慢了思考
你的大腦用說話的速度運轉。鍵盤強迫你把思緒翻譯成手指動作。語音跳過了這層翻譯。Whisper Notes 在本地把語音轉成文字——Mac 用 Whisper Large-v3 Turbo,iPhone 用 Neural Engine 優化模型。你的音訊永遠不會碰到伺服器。
- •Mac:按住 Fn 就能隨處聽寫——Claude、ChatGPT、Slack、VS Code,哪裡都行
- •iPhone:鎖屏小工具 1 秒啟動錄音
- •一切都在你的裝置上完成。什麼都不會上傳。永遠不會。
- •$4.99 買斷。兩個平台。沒有訂閱。
Mac (macOS 14+, Apple Silicon) · iPhone (iOS 18+)
桌面:和任何 App 對話
你 Mac 上的每個文字框現在都是語音介面。寫郵件、回 Slack、加程式碼註解、打 AI 提示——能打字的地方,現在都能說話。按住 Fn,說,放開。文字出現在游標位置。不用切 App。不用等。
全系統語音輸入
Whisper Notes 裝了一個全域快捷鍵。在任何 App——Claude、ChatGPT、Gemini、Gmail、Notion、VS Code,連 Terminal 都行——按住 Fn 說話。放開後,Whisper Large-v3 Turbo 在本地處理你的音訊。文字出現在游標位置。零雲端延遲。
- •所有 Mac App 都能用。沒有例外。
- •文字瞬間出現在游標位置
- •Whisper Large-v3 Turbo:15 億參數,本地運行
- •30 秒設定:設定 → 鍵盤快捷鍵 → 啟用
Works in: Claude, ChatGPT, Gemini, Gmail, Slack, VS Code, Terminal, Notion
串流結果
不用等整個檔案處理完。結果一段一段出現。邊轉錄邊開始閱讀和編輯。
自訂詞彙
AI 模型碰到名字和行話就會卡殼。加入你的詞彙——公司名、產品名、專業術語。大小寫會保留(「Claude Opus 4.5」就是「Claude Opus 4.5」,不會變成「claude opus」)。
Claude, GPT-4, Gemini, Whisper · OAuth, TypeScript, Kubernetes · HIPAA, GDPR, SOC2
靜音處理
Whisper 碰到長時間停頓會產生幻覺——重複句子或編造文字。語音活動偵測會捕捉這些靜默並正確處理。有自然停頓的音訊,幻覺減少 70%。
有多快?
M4: 12 倍即時(2 小時音訊 → 10 分鐘)
M3/M2: 10 倍即時
M1: 8 倍即時
殺手級使用場景:和 AI 對話
和 Claude 聊天
按住 Fn,詳細描述你的問題。自然說話產生的提示比打字好太多。放開,送出。不用從別的 App 複製貼上。就是你和 AI 在對話。
Slack 和郵件
長回覆是阻力。語音消除阻力。在輸入框按住 Fn,說你想說的,放開。20 秒搞定,不用花 3 分鐘敲鍵盤。
初稿
作家們一致反映,口述的初稿更放鬆、更誠實。鍵盤會製造一層無意識的編輯。語音繞過它。先把想法倒出來,之後再編輯。
行動:靈感來了就捕捉
好點子不會等你坐到桌前。它們在走路時冒出來,在洗澡時,在凌晨兩點,在排隊時。鎖屏小工具把捕捉的阻力降到幾乎為零。點一下,說,完成。想法在消失前就被存下來了。
鎖屏小工具
- •從口袋掏出手機到開始錄音只要 1 秒
- •即時動態顯示錄音時長
- •動態島顯示錄音狀態
- •不用開 App,不用輸密碼
解放雙手
- •戴手套、手濕、雙手提滿東西——都能用
- •AirPods 點擊手勢啟動 / 停止
- •低語級別的靈敏度,安靜的房間也行
- •戶外風噪和環境音處理
匯出到任何地方
- •複製到剪貼簿,馬上貼上
- •分享到備忘錄、訊息、郵件,任何 App
- •帶時間戳記匯出,方便回顧
- •SRT 格式用於影片字幕
凌晨兩點的靈感問題
睡前
「這個 API 設計是錯的。事件應該是不可變的。明天一早先重構成 event sourcing 模式。」
晨跑
「文章靈感:鍵盤是思維壓縮演算法。我們寫出來的和想的不一樣,因為打字太慢。」
散步
「會議卡住是因為我們在優化錯的指標。重新聚焦在留存率,不是互動率。」
為什麼離線很重要
你的音訊永遠不會離開你的裝置
- •不上傳伺服器——處理在 Neural Engine (iPhone) 或 Metal (Mac) 上完成
- •沒有資料保留政策,因為根本沒有資料傳輸
- •適合機密對話、HIPAA 敏感筆記、法律工作
- •你的錄音只存在於你擁有的硬體上
沒網路也能用
- •飛航模式、地鐵隧道、不穩定的 Wi-Fi——都能用
- •封鎖網路的安全設施——能用
- •延遲只是處理時間,不是網路往返
- •伺服器超載時效能也不會變差
買一次,永久使用
- •$4.99 買斷 iPhone 和 Mac。兩個。
- •不按分鐘收費,不限使用量,沒有「免費版」限制
- •重度語音使用者在別處一年花 $120-180
- •第一個月就回本
比較
| 功能 | Whisper Notes | Apple 聽寫 | SuperWhisper | Wispr Flow |
|---|---|---|---|---|
| 處理方式 | 100% 本地 | Apple 伺服器 | 100% 本地 | 雲端伺服器 |
| iPhone + Mac | $4.99 兩個都包 | 免費 | 只有 Mac | 只有 Mac |
| 鎖屏小工具 | 有 | 沒有 | 沒有 iPhone App | 沒有 iPhone App |
| 全系統 Fn 鍵 | 有 | 有 | 有 | 有 |
| 價格模式 | $4.99 買斷 | 免費 | $8.49/月 或 $249 | $10-15/月 |
| AI 模型 | Whisper Large-v3 Turbo | Apple 專有 | Whisper 變體 | GPT-4 + Whisper |
| 自訂詞彙 | 有 | 沒有 | 有 | 有 |
| 年度成本 | 總共 $4.99 | 免費 | $102/年 | $120-180/年 |
Whisper Notes 是唯一同時具備:兩個平台 + 100% 離線 + 鎖屏錄音 + 一次性付費的選項。
真誠的取捨
本地處理有真實的取捨。我們認為對大多數人來說值得,但你應該知道你會面對什麼:
模型下載
Mac 內建 580 MB 通用模型,所有 Apple Silicon Mac 都能跑。如果你的機器有更多算力,可以在 App 內下載 Whisper Large V3 Turbo(約 3 GB)獲得更高準確度。我們正在積極測試 Parakeet 等新架構,把本地轉錄推得更遠。
只支援 Apple
這是 Apple Silicon App。M1 或更新的 Mac,iOS 18+ 的 iPhone。沒有 Android。沒有 Windows。沒有 Intel Mac。如果你不在 Apple 生態系統裡,這不適合你。
速度 vs 雲端
本地推論比雲端 API 慢。10 分鐘音訊在 iPhone 15 上需要 1-2 分鐘處理。雲端服務幾秒鐘就回傳。如果你需要即時處理一小時的錄音,雲端可能更適合。
準確度上限
Whisper 在清晰語音上達到 95% 以上準確度。重口音、很吵的背景或含糊不清需要稍微編輯。如果你需要醫療紀錄 99.9% 的準確度,請雇用人工轉錄。如果你需要即時、私密的 95% 準確度,這個可以。
開始使用
iPhone
- 1.從 App Store 下載 Whisper Notes ($4.99)
- 2.打開一次——模型會自動下載
- 3.長按主畫面 → 點「+」→ 搜尋「Whisper Notes」→ 加入小工具
- 4.從鎖屏點擊小工具。開始錄音。
Mac
- 1.下載 Whisper Notes(iPhone 購買已包含)
- 2.打開一次——模型會自動下載
- 3.設定 → 鍵盤快捷鍵 → 啟用全域聽寫
- 4.授權輔助功能權限
- 5.在任何地方按住 Fn 開始說話
填補落差
通用購買:$4.99 買斷 iPhone 和 Mac。沒有訂閱。不按分鐘收費。說就對了。
Fn 鍵聽寫 · 鎖屏小工具 · 100+ 語言 · 100% 離線 · 買斷制