我想要能離線用、不用每月付$15的語音輸入。試了一輪——Siri(要網路)、Wispr Flow(訂閱制)、SuperWhisper(也是訂閱)——最後乾脆自己做了想要的東西:在Mac上跑,哪都能用的全域語音輸入。$4.99買斷。
按住Fn,開始說話
1.2.3版本加了大家一直要的功能:隨便在哪個應用程式裡——Gmail、Slack、VS Code、終端機,什麼都行——按住Fn鍵說話就搞定了。放開,文字就出來了。
底層跑的是Whisper Large-v3 Turbo,目前最準的本機語音模型。全在本機處理——不用網路,沒有伺服器,資料不出你的機器。
設定(30秒)
- 1. 開啟Whisper Notes
- 2. 進入設定 → 鍵盤快捷鍵
- 3. 啟用全域語音輸入
- 4. 授予輔助功能權限
就這樣。現在Fn鍵就是你Mac上隨處可用的語音輸入法。
介面變更好了
重新做了介面。現在更乾淨——視覺層級更好,互動更流暢,雜亂更少。用一段時間後你會注意到的那種打磨。
串流轉錄
結果準備好就串流出來,不用等整個檔案轉完。文字一段段出現——你能立刻開始讀和編輯。
自訂詞彙
Whisper挺好,但它會搞亂專業術語、公司名和縮寫。加你自己的詞彙,模型轉錄時就會用。對小眾行話有效,保留格式(比如「Claude Opus 4.5」而不是「claude opus four point five」),還能修那些煩人的名字錯誤。
語音活動偵測
長時間沉默過去會讓Whisper產生幻覺——重複短語或編文字來填空白。語音活動偵測(VAD)能抓這些沉默片段並正確處理。我們在有停頓的錄音中把幻覺問題砍了約70%。轉錄現在更乾淨、更準了。
效能提升
啟動更快,模型載入更快,記憶體佔用更低。整體感覺更敏捷。
和Wispr Flow比起來怎麼樣
| Whisper Notes | Wispr Flow | |
|---|---|---|
| 價格 | $4.99 一次性 | $10-15/月 |
| 離線 | 100%本機處理 | 需要連網 |
| 隱私 | 音訊不離開裝置 | 音訊傳送到雲端 |
| 延遲 | 即時(本機處理) | 網路延遲 |
| 準確率 | Whisper Large-v3 Turbo | 雲端API(稍微好一點) |
Wispr Flow的雲端方案代表某些情況下準確率稍微好一點。但這也代表你的音訊要去他們伺服器,需要網路,而且每月都要付錢。
如果你在意隱私——或者只是不想再多一個訂閱——選擇挺明確的。
試試看
$4.99就能同時拿到iOS和Mac。如果你已經有iPhone app,Mac版也包含在內——Apple的通用購買代表買一次,哪都能用。
有想法或回饋?發email到[email protected]。我真的會讀每條訊息並回覆。