音声入力:タイピングが思考を遅くする理由

あなたの思考速度は毎分150語。タイピングは40語。このギャップは現実で、毎日アイデアを奪っている。

Voice to Text Offline

タイピングが思考を遅くする理由

脳は話す速度で動く。キーボードは思考を指の動きに変換することを強いる。音声はこの変換をスキップする。Whisper NotesはMacではWhisper Large-v3 Turbo、iPhoneではNeural Engine最適化モデルを使って、ローカルで音声をテキストに変換。音声がサーバーに触れることはない。

  • Mac:Fnを押してどこでも音声入力——Claude、ChatGPT、Slack、VS Code、どこでも
  • iPhone:ロック画面ウィジェットで1秒で録音開始
  • すべてデバイス上で処理。アップロードなし。永遠に。
  • $4.99買い切り。両プラットフォーム。サブスクなし。

Mac (macOS 14+, Apple Silicon) · iPhone (iOS 18+)

Mac:どのアプリでも話せる

Macのすべてのテキスト入力欄が音声インターフェースになる。メール下書き、Slack返信、コードコメント、AIプロンプト——タイピングできる場所なら、話せる。Fnを押して、話して、離す。カーソル位置にテキストが現れる。アプリ切り替え不要。待ち時間なし。

システム全体の音声入力

Whisper Notesはグローバルショートカットをインストールする。どのアプリでも——Claude、ChatGPT、Gemini、Gmail、Notion、VS Code、ターミナルでも——Fnを押しながら話す。離すと、Whisper Large-v3 Turboがローカルで音声を処理。テキストがカーソル位置に現れる。クラウド遅延ゼロ。

  • すべてのMacアプリで動作。例外なし。
  • テキストがカーソル位置に即座に現れる
  • Whisper Large-v3 Turbo:15億パラメータ、ローカル動作
  • セットアップ30秒:設定 → キーボードショートカット → 有効化

Works in: Claude, ChatGPT, Gemini, Gmail, Slack, VS Code, Terminal, Notion

ストリーミング結果

ファイル全体の処理を待つ必要なし。結果が段落ごとに現れる。文字起こし中に読み始めて編集できる。

カスタム語彙

AIモデルは人名や専門用語でつまずく。語彙を追加——会社名、製品名、技術用語。大文字小文字はそのまま保持(「Claude Opus 4.5」は「Claude Opus 4.5」のまま、「claude opus」にならない)。

Claude, GPT-4, Gemini, Whisper · OAuth, TypeScript, Kubernetes · HIPAA, GDPR, SOC2

無音処理

Whisperは長い沈黙でハルシネーションを起こす——フレーズを繰り返したり、言葉を作り出したり。音声アクティビティ検出がこれらの無音区間を捕捉して適切に処理。自然な間がある音声で、ハルシネーション問題を70%削減。

どれくらい速い?

M4: 12倍リアルタイム(2時間の音声 → 10分)

M3/M2: 10倍リアルタイム

M1: 8倍リアルタイム

キラーユースケース:AIと話す

Claudeと話す

Fnを押して、問題を詳しく説明する。自然に話すと、タイピングより良いプロンプトが書ける。離して、送信。別のアプリからコピペする必要なし。あなたとAI、直接対話。

Slackとメール

長い返信は摩擦。音声は摩擦を消す。入力欄でFnを押して、言いたいことを言って、離す。キーボードを3分叩く代わりに、20秒で完了。

初稿

ライターは口述した初稿のほうがリラックスして正直だと言う。キーボードは潜在意識に編集レイヤーを作る。音声はそれを迂回する。まずアイデアを出して、後で編集。

モバイル:ひらめいた瞬間に捕まえる

良いアイデアはデスクに座るまで待ってくれない。散歩中、シャワー中、深夜2時、行列の中で襲ってくる。ロック画面ウィジェットがキャプチャの摩擦をほぼゼロにする。タップ、話す、終わり。消える前に思考が保存される。

ロック画面ウィジェット

  • ポケットの中のスマホから録音開始まで1秒
  • ライブアクティビティで話している時間を表示
  • Dynamic Islandで録音状態を表示
  • アプリを開く必要なし、パスワード入力不要

ハンズフリー

  • 手袋、濡れた手、両手が荷物でふさがっていても——全部使える
  • AirPodsでタップジェスチャーで開始/停止
  • 静かな部屋用のささやきレベル感度
  • 屋外用の風とアンビエントノイズ処理

どこにでもエクスポート

  • クリップボードにコピーして即ペースト
  • メモ、メッセージ、メール、どのアプリにも共有
  • タイムスタンプ付きでエクスポート
  • 動画字幕用SRT形式

深夜2時のアイデア問題

寝る前

「あのAPI設計は間違ってる。イベントはイミュータブルであるべき。明日一番でイベントソーシングパターンにリファクタ。」

朝ラン

「記事のアイデア:キーボードは思考圧縮アルゴリズム。タイピングが遅いから、書くことと考えることが違う。」

散歩中

「会議が行き詰まってるのは間違った指標を最適化してるから。エンゲージメントじゃなくリテンションで再定義。」

なぜオフラインが重要か

音声がデバイスから出ない

  • サーバーアップロードなし——処理はNeural Engine(iPhone)またはMetal(Mac)で行われる
  • データ保持ポリシーの心配なし、データ転送がないから
  • 機密会話、HIPAA対応メモ、法務作業も安心
  • 録音は自分が所有するハードウェアにのみ存在

ネットなしで動く

  • 機内モード、地下鉄トンネル、Wi-Fi不安定——全部動く
  • ネットワークアクセスを遮断するセキュア施設——動く
  • 遅延は処理時間だけ、ネットワーク往復なし
  • サーバー過負荷でパフォーマンスが落ちない

一度買えば、ずっと使える

  • $4.99買い切りでiPhoneとMac。両方。
  • 分単位課金なし、使用量上限なし、「無料版」制限なし
  • 音声ヘビーユーザーは他で年$120-180払ってる
  • 最初の月で元が取れる

比較

機能Whisper NotesApple音声入力SuperWhisperWispr Flow
処理場所100%オンデバイスAppleサーバー100%オンデバイスクラウドサーバー
iPhone + Mac$4.99で両方無料MacのみMacのみ
ロック画面ウィジェットありなしiPhoneアプリなしiPhoneアプリなし
システム全体Fnキーありありありあり
価格モデル$4.99買い切り無料$8.49/月 または $249$10-15/月
AIモデルWhisper Large-v3 TurboApple独自Whisper系GPT-4 + Whisper
カスタム語彙ありなしありあり
年間コスト合計$4.99無料$102/年$120-180/年

Whisper Notesは唯一の選択肢:両プラットフォーム + 100%オフライン + ロック画面キャプチャ + 買い切り。

正直なトレードオフ

ローカル処理には現実のトレードオフがある。ほとんどの人には価値があると思うが、何を手に入れるか知っておくべき:

モデルダウンロード

Macには580MBの汎用モデルが付属し、すべてのApple Silicon Macで動作する。マシンのパワーに余裕があれば、アプリ内でWhisper Large V3 Turbo(約3GB)をダウンロードして精度を上げられる。Parakeetなど新しいアーキテクチャもテスト中で、オンデバイス文字起こしの限界を押し広げている。

Appleのみ

これはApple Siliconアプリ。M1以降のMac、iOS 18以降のiPhoneが必要。Androidなし。Windowsなし。Intel Macなし。Appleエコシステムにいないなら、これは向いてない。

速度 vs クラウド

ローカル推論はクラウドAPIより遅い。10分の音声をiPhone 15で処理するのに1-2分かかる。クラウドサービスは秒で返す。1時間の録音に即座の結果が必要なら、クラウドのほうがいいかもしれない。

精度の天井

Whisperはクリアな音声で95%以上の精度。強いアクセント、うるさい背景、もごもご話すと編集が必要。医療記録用に99.9%の精度が必要なら、人間の転写者を雇って。95%の精度を即座にプライベートに必要なら、これが使える。

始め方

iPhone

  1. 1.App StoreからWhisper Notesをダウンロード ($4.99)
  2. 2.一度起動——モデルが自動ダウンロード
  3. 3.ホーム画面を長押し → '+' をタップ → 'Whisper Notes' を検索 → ウィジェット追加
  4. 4.ロック画面からウィジェットをタップ。録音開始。

Mac

  1. 1.Whisper Notesをダウンロード(iPhone購入に含まれる)
  2. 2.一度起動——モデルが自動ダウンロード
  3. 3.設定 → キーボードショートカット → グローバル音声入力を有効化
  4. 4.プロンプトでアクセシビリティ権限を許可
  5. 5.どこでもFnを押して話し始める

ギャップを埋める

ユニバーサル購入:iPhoneとMacで$4.99買い切り。サブスクなし。分単位課金なし。話すだけ。

Fnキー音声入力 · ロック画面ウィジェット · 100以上の言語 · 100%オフライン · 買い切り