Superwhisper vs Whisper Notes:技術的な徹底比較
価格、音声モデル、権限、アーキテクチャ — Macのオフライン文字起こしアプリ2つを詳細に比較。

Superwhisperはパイオニアでした。Apple Silicon上でOpenAIのWhisperモデルをローカル実行し、音声をクラウドに送信せずに文字起こしできることをMacコミュニティに示しました。
しばらくの間、それは私たちの多くが求めていたもの——シンプルで、高速で、ローカルな文字起こしツールでした。
そして、変わってしまった。
最近の方向性は「AIアシスタント」への転換です——コンテキスト認識、クラウド同期、あなたの言葉を単に文字起こしするのではなく解釈するエージェントモード。
この方針転換に伴い、3つの構造的変化が生じました:
• サブスクリプション:あなた自身のハードウェアで動くモデルに毎月料金を払う。
• 権限:すべてのキー入力を監視できる入力監視。
• アカウント:完全にオフラインで動作するソフトウェアへの強制ログイン。
このページはバグや一時的な問題についてではありません。アーキテクチャの設計思想についてです。
Whisper Notesは、かつてのSuperwhisperを好んでいた人のための代替として存在します:一つのことを確実にこなす、信頼性の高いオフラインユーティリティ。クイック比較:Whisper Notes vs Superwhisper
| 機能 | Whisper Notes | Superwhisper |
|---|---|---|
| 価格 | $6.99 買い切り | $8.49/月 または $250 永久 |
| macOS 権限 | アクセシビリティのみ | 入力監視 |
| アカウント必須 | いいえ | はい |
| iOSアプリ | $6.99(別途購入) | 別途サブスク |
| 音声モデル | Whisper + Parakeet V3 + Qwen3-ASR | Whisper(+ distil 変種) |
| 100% オフライン | はい | オプション(ハイブリッド) |
| ローカルAI編集 | はい(Gemma 4、オンデバイス) | はい(クラウド依存) |
| AIコンテキスト機能 | いいえ | はい |
音声モデル:3つのエンジン vs 1つ
日常的な使用において最も重要な技術的差異です。
SuperwhisperはWhisperとそのdistil変種を提供しています。Whisper Notesは3つの独立した音声エンジンを搭載し、それぞれ異なるシナリオに最適化されています:
音声モデル比較
| モデル | 速度 | WER | 最適な用途 |
|---|---|---|---|
| Whisper Large V3 Turbo | 10–15× リアルタイム | 7.44% | 100以上の言語、汎用 |
| Parakeet V3 | ~35× リアルタイム | 6.32% | 英語 — 最速、最低エラー率 |
| Qwen3-ASR | ストリーミング | — | 中国語、日本語、韓国語 + 27言語 |
Parakeet V3(NVIDIA製)はWhisperより3倍速く英語を文字起こしし、エラー率も低い — FLEURSベンチマークでWER 6.32% vs 7.44%。Whisperで3分かかる35分の会議が、Parakeet V3では20秒未満で完了します。
Qwen3-ASRはCJK言語(中国語、日本語、韓国語)に特化して構築されており、ストリーミング文字起こしを提供します — テキストは話し終わった後ではなく、話している最中に表示されます。
これらはペイウォールの裏にあるクラウドモデルではありません。$6.99の購入に含まれ、お使いのMacのNeural Engine上で完全に動作します。
Superwhisperが提供するのはWhisper変種のみです。英語中心またはCJKワークフローにおいて、モデル選択の差は大きいです。
入力監視という問題
これはプライバシーを重視するユーザーを躊躇させる権限です。
SuperwhisperはmacOSで入力監視アクセスを要求します。この権限により、アプリケーションはシステム全体のすべてのキーボードとマウスイベントを受信できます——どのアプリがフォーカスされているかに関係なく。
これはアクセシビリティツール、自動化ソフトウェア、そしてキーロガーが使用するのと同じ権限カテゴリです。
なぜSuperwhisperはこれを必要とするのか?「賢く」なるためです。彼らのAIコンテキスト機能は画面の内容を読み取り、使用中のアプリケーションを理解し、それに応じて動作を適応させます。環境を観察するには、観察権限が必要です。
アーキテクチャ上のトレードオフ:あなたはコンテキスト認識型の文字起こしを得ます。彼らはパスワード、プライベートメッセージ、機密文書を含む、あなたが入力するすべてを見る技術的能力を得ます。
悪意を示唆しているわけではありません——しかし、権限自体がアーキテクチャ的に監視可能です。
権限アーキテクチャ
入力監視(Superwhisper):
すべてのアプリケーションでのすべてのキーボードイベントを受信可能。「コンテキスト認識」に必要。
アクセシビリティ(Whisper Notes):
カーソル位置にテキストを挿入可能。キー入力の読み取りや他のアプリの監視は不可。出力のみ。
Whisper Notesはアクセシビリティ権限のみを使用します。カーソル位置にテキストを挿入できます——それは出力です。あなたが入力した内容や画面上の内容を読み取ることはできません。
私たちの立場:「賢く」ならないことを選びました。賢さには監視が必要だからです。文字起こしツールはあなたのパスワードの存在を知る必要はありません。あなたが話したことを入力するだけでいい。ハードウェアレンタル問題
これはパワーユーザーを苛立たせる価格決定です。
Superwhisperは、Nvidia ParakeetやWhisperバリアントを含むローカルAIモデルをサブスクリプションの有料壁の後ろに移動しました。ユーザーは今、完全に自分のデバイスで実行される処理をアンロックするために月額料金を支払っています。
何が起きているか正確に見てみましょう:• あなたのM3またはM4 MacBookにはNeural Engineがあります。
• Appleはこのシリコンをオンデバイス機械学習のために特別に設計しました。
• Whisperモデルの重みはオープンソースで、OpenAIによって公開されています。
• 電気代はあなたの電気メーターから来ています。
サブスクリプションは正確に何に対して支払っているのでしょうか?
| 期間 | Whisper Notes | Superwhisper(月額) | Superwhisper(買い切り) |
|---|---|---|---|
| 1年目 | $6.99 | $101.88 | $250 |
| 3年目 | $6.99 | $305.64 | $250 |
| 5年目 | $6.99 | $509.40 | $250 |
Superwhisperのクラウド機能——同期、AIアシスタント、外部API——があなたに価値を提供するなら、サブスクリプション価格は正当化できます。彼らのインフラに対して支払っているのです。
しかし、ローカルモデルを同じ有料壁の後ろに置く?それはあなたが既に所有するハードウェアで行われる計算に対してレンタル料を請求することです。
ユーザーレビューはこの不満を反映しています:「ローカルモデルを有料にしたの?意味がわからない。」
私たちの価格哲学:Whisper Notesは$6.99の一回払いです。クラウドインフラを運営していないからです。あなたのNeural Engineが仕事をします。私たちはインターフェースを提供します。それは一回限りの取引であり、継続的な関係ではありません。複雑さとその結果
このセクションは特定のバグについてではありません。アーキテクチャ上のトレードオフについてです。
ソフトウェアが多くのことをしようとするとき——クラウド同期、コンテキスト認識、エージェント的解釈、ハイブリッドローカル/クラウド処理——必然的に複雑になります。
複雑なシステムはシンプルなものより多くの障害モードを持ちます。これは批判ではありません。物理学です。Superwhisperユーザーは障害パターンを報告しています:
• 文字起こしが生成されない録音
• 消えてしまうように見える音声
• 長いセッション後の「音声が見つかりません」エラー
彼らのコードベースを診断することはできませんが、パターンを観察できます:アプリが管理する機能が多いほど、失敗する方法も多くなります。
ステートマシンの問題:コンテキスト認識アプリは多くの変数を追跡する必要があります。画面に何がある?ネットワークはクラウド処理に十分速い?この録音は同期すべき?どのAIモデルがこのコンテキストを処理すべき?
各決定ポイントは、期待される状態と実際の状態の間の潜在的な不一致です。
Whisper Notesは意図的にシンプルです:音声を録音 → ディスクに継続的に書き込み → Whisperで処理 → テキストを表示
線形データフロー。失敗するクラウド同期なし。誤作動するコンテキスト認識なし。ハイブリッドルーティング決定なし。
プログレッシブパーシスタンスを使用しています——録音中に数秒ごとに音声をディスクに書き込みます。アプリがクラッシュしても、バッテリーが切れても、失うのは最後の数秒だけです。前の20分はすでに安全にドライブに保存されています。
これは宣伝する機能ではありません。信頼性の高い録音ソフトウェアがそうあるべき方法です。
トレードオフは現実です:Superwhisperができることはできません。画面コンテキストを理解しません。デバイス間で同期しません。音声を再フォーマットするAIモードはありません。ただ文字起こしするだけです。正確に、確実に、ローカルで。それが製品のすべてです。

アカウント要件
Superwhisperはソフトウェアを使用するためにアカウント作成を要求します——自分のデバイスでのローカル文字起こしでさえも。
これは彼らのビジネスモデルに役立ちます:サブスクリプション管理、クラウド同期、使用分析にはユーザーIDが必要です。
しかし、単にローカル音声テキスト変換を望む人にとっては、メリットのない摩擦です。
Whisper Notesにはアカウントシステムがありません:• アプリをダウンロード
• アクセシビリティ権限を付与
• 話し始める
メールなし。パスワードなし。本人確認なし。
これは利便性だけの問題ではありません。データ最小化についてです:
• すべてのアカウントは管理すべきもう一つのパスワード
• すべてのデータベースエントリは漏洩の標的
• すべてのユーザーIDは保護すべきデータポイント
完全にあなたのデバイスで実行されるソフトウェアにとって、あなたが誰であるかを知る正当な理由はありません。Whisperモデルは音声をテキストに変換するためにあなたのメールアドレスを必要としません。
Superwhisperが適している場合
Whisper Notesが普遍的に優れていると主張しているわけではありません。Superwhisperは特定のユースケースに適したアーキテクチャの選択をしました。
Superwhisperを選ぶべき場合:• 画面を理解して出力を適応させるAIコンテキストモードが欲しい
• 複数のMac間でクラウド同期が必要
• 生の文字起こしより「アシスタント」体験を重視する
• サブスクリプションまたは$250の買い切り価格がワークフローの価値に見合う
• 入力監視権限が気にならない
• 3つの音声モデルが欲しい — Whisper、Parakeet V3(最速英語)、Qwen3-ASR(中国語/日本語/韓国語に最適)
• Gemma 4によるローカルAI編集が欲しい — 句読点の修正、フィラーワード除去、自動タイトル生成、すべてオンデバイス
• 最小限のシステム権限(アクセシビリティのみ)が欲しい
• 一度払い($6.99)でソフトウェアを所有したい
• アカウントを作りたくない
• iPhoneも使う(App Storeで$6.99、Mac版とは別途購入)
Superwhisperは、AIがあなたのコンピューティングコンテキスト全体を理解する未来に向けて構築しています。それは野心的であり、一部のユーザーはそれを望んでいます。
Whisper Notesは正反対を構築しています:まさに一つのことを行い、マイク入力以外のコンピュータについて何も知らず、毎回同じように動作するユーティリティ。
予測可能性を重視する人のための退屈なソフトウェア。
退屈なソフトウェアの価値
「退屈」はソフトウェアエンジニアリングでは否定的な言葉ではありません。退屈は予測可能を意味します。退屈はサプライズが少ないことを意味します。
退屈なソフトウェア:
• アカウントを必要としない
• コア機能にネットワーク接続を必要としない
• 厳密に必要な以上の権限を要求しない
• 求めていないものに進化しない
Superwhisperは退屈なソフトウェアとして始まりました。ローカル文字起こしユーティリティ。シンプル、高速、信頼性が高い。
そして野心を持ちました。AIアシスタントになりたい、コンテキストを理解したい、クラウド間で同期したい、あなたの言葉を解釈したい。
一部のユーザーは喜んでその進化についていきました。他の人はかつての姿を懐かしんでいます。
Whisper Notesは意図的に退屈です。一つのことだけをします:あなたのデバイスのNeural Engineを使って音声をテキストに変換します。画面を監視しません。データを同期しません。意図を解釈しません。ただ文字起こしするだけ。
プラットフォームごとに$6.99。アカウントなし。入力監視なし。サブスクリプションなし。信頼性以上の野心なし。
ローカル文字起こしツールの本来のビジョンを好む人のために——Whisper Notesはここにあります。
よくある質問
なぜSuperwhisperは入力監視権限を必要とするのですか?
Superwhisperは「コンテキスト認識」のために入力監視を使用します——画面上の内容を理解してAIの動作を適応させるためです。この権限により、すべてのアプリケーションでのすべてのキー入力を読み取ることができます。Whisper Notesはアクセシビリティ権限のみを使用し、テキストを挿入できますが入力や他のアプリを監視することはできません。
なぜSuperwhisperはサブスクリプション価格に移行したのですか?
Superwhisperは同期、アカウント、一部のAI機能のためにクラウドインフラを運営しています。サブスクリプションはそのインフラに資金を提供します。しかし、ローカルモデル(あなたのハードウェアで実行される)も同じ有料壁の後ろに置いています——これがユーザーが最も疑問視する価格決定です。
Whisper NotesはSuperwhisperと同じくらい正確ですか?
Whisper Notesは3つの音声モデルを提供しています。Parakeet V3はFLEURS英語ベンチマークでWhisper(7.44%)より低いワードエラー率(6.32%)を持ち、3倍速く動作します。中国語、日本語、韓国語にはQwen3-ASRがこれらの言語に特化して構築されています。Superwhisperが提供するのはWhisper変種のみです。
Whisper Notesはどの音声モデルをサポートしていますか?
3つのモデル:Whisper Large V3 Turbo(100以上の言語、汎用)、NVIDIAのParakeet V3(最速英語、最低エラー率)、AlibabaのQwen3-ASR(中国語、日本語、韓国語、およびストリーミング出力対応の27以上の言語に最適化)。すべてデバイス上でローカルに動作します。
Whisper NotesはSuperwhisperと比べていくらですか?
Whisper Notesはプラットフォームごとに$6.99の買い切りです(iOSとMacは別々に購入)。Superwhisperは$8.49/月または$250の永久ライセンスで、iOSアプリには別途サブスクリプションが必要です。3年間で比較すると:Whisper Notesはプラットフォームごとに$6.99、Superwhisper月額では$305.64になります。
Whisper Notesはデバイス間で同期できますか?
いいえ、設計上そうなっています。クラウドサーバーを運営していないため、同期するものがありません。録音は作成したデバイスに残ります。これにより同期の失敗がなくなり、音声データがハードウェアから離れることがありません。必要な場合はAirDropまたは手動エクスポートを使用してください。
なぜWhisper Notesはアカウントを必要としないのですか?
ローカル文字起こしには本人確認を必要とする技術的理由がありません。データ最小化を信じています——ソフトウェアを動作させるためにメールが必要ないなら、求めるべきではありません。アカウントなしは、管理するパスワードなし、漏洩するデータベースエントリなしを意味します。
入力監視とアクセシビリティ権限の違いは何ですか?
入力監視はシステム全体のすべてのキーボード/マウスイベントを受信できます(観察)。アクセシビリティはテキストを挿入しUIオートメーションを実行できます(アクション)。Whisper Notesはアクセシビリティを使用してカーソル位置に文字起こしテキストを入力します——出力のみで、入力の観察はありません。
3つの音声モデル。$6.99の一回払い。
Whisper + Parakeet V3 + Qwen3-ASR。ローカルAI編集。入力監視なし。サブスクリプションなし。アカウントなし。