Typeless の代替:Fn を押して話す。音声はデバイスから出ません。

Typeless は音声をクラウドサーバーに送信し、月額 $30 かかります。Whisper Notes は Neural Engine で動作し、$4.99 の買い切りです。

Whisper Notes の Fn キー音声入力設定画面 - Fn キーショートカット機能のテスト

Typeless と Whisper Notes は同じ問題を解決します:Fn を押しながら話し、離すとカーソル位置にテキストが表示されます。

違いはアーキテクチャにあります。

Typeless:音声 → インターネット → クラウド LLM → インターネット → テキスト($30/月)

Whisper Notes:音声 → Neural Engine → テキスト($4.99 買い切り)

Typeless は良いアプリ。でも……

Typeless は優れた製品です。数ヶ月間使いましたが、体験は非常にスムーズでした。認識精度が高く、LLM による修正でカジュアルなやりとりが簡潔でプロフェッショナルな文章になります。Fn を押して話し、離すと「えーと」「あのー」を自動で取り除き、すぐに送信できるテキストが出てきます。このシームレスな体験は本当に素晴らしいです。

しかし使っていくうちに、無視できない3つの問題を見つけました:

1. アップロードされた音声は削除できない

Fn キーを押すたびに、音声がクラウドサーバーに送信されます。Typeless はデータ保持ゼロを謳っていますが、それはポリシーの約束であり、アーキテクチャによる保証ではありません。法律文書、医療記録、ビジネス上の機密情報など、絶対的なプライバシーが必要な場面では、クラウドへのアップロードは受け入れられません。

Whisper Notes は Mac の Neural Engine または iPhone チップ上で OpenAI の Whisper large-v3-turbo をローカル実行します。音声データはデバイスの外に出ません。これはポリシーではなく、物理的な事実です。

2. 処理が遅い——音声認識の後、LLM の処理待ちが発生

Typeless のワークフロー:音声認識(ASR)→ クラウドにアップロード → LLM による修正 → テキスト返却。この一連の処理に時間がかかります。

20秒の音声入力(M4 Pro) 処理時間
Typeless 7〜10秒
Whisper Notes 2.5秒

Whisper Notes は Neural Engine 上で直接文字起こしを行い、リアルタイムの約10〜12倍の速度で処理します。ネットワーク遅延なし。サーバー待ちなし。60秒の録音が約5秒で完了します。

トレードオフ:Typeless は遅いが修正済みテキストを出力。Whisper Notes は速いがそのまま文字起こし。

3. 月額 $30 のサブスクリプション

利用期間 Typeless Whisper Notes
1年間 $360 $4.99
3年間 $1,080 $4.99
5年間 $1,800 $4.99

Typeless はクラウドインフラを運営しています。サーバー、サードパーティの LLM API には継続的なコストがかかります。サブスクリプションはそのインフラを支えるためのものであり、クラウドサービスとして合理的な価格設定です。

Whisper Notes にはクラウドバックエンドがありません。処理はあなたのハードウェア上で、あなたの電力で行われます。ランニングコストがなければ、継続課金も不要です。自分のデバイスでオープンソースモデル(Whisper)を動かすソフトウェア——なぜ買い切りではなくレンタルなのでしょうか?

Fn キー音声入力を超えて

両アプリとも Fn キーによるシステム全体の音声入力に対応しています。これが中核機能です。

Whisper Notes にはさらに以下の機能があります:

音声ファイルの取り込み:録音済みの音声・動画ファイルをドラッグ&ドロップ。インタビュー、会議、講義など、すでに録音されたコンテンツを文字起こしできます。Typeless はリアルタイムの音声入力のみに対応しています。

モデルの柔軟性:現在は Whisper large-v3-turbo を使用。今後のアップデートで追加モデル(Parakeet、Gemini ベースの音声モデル)に対応する可能性があります。Typeless は独自のクラウド LLM を使用しています。

エクスポート形式:テキスト、SRT、VTT、JSON。字幕や構造化データが必要なら Whisper Notes で対応できます。Typeless はカーソル位置へのテキスト挿入に特化しています。

メッセージやメールのリアルタイム音声入力だけなら、どちらのアプリでも対応できます。一括文字起こし、字幕生成、モデル選択が必要なら、Whisper Notes のほうが幅広いユースケースに対応します。

Whisper Notes のアプリ画面 - Fn キー音声入力と音声ファイル文字起こし機能の表示

Typeless が適しているケース

Typeless には本物の強みがあり、特定のユーザーにはより良い選択肢です:

カジュアルなやりとりの修正:Slack メッセージや簡単なメール作成がメインなら、Typeless の LLM クリーンアップは明らかにきれいな出力を生成します。口癖を自動で除去してくれます。逐語的な正確さより修正済みテキストを重視するユーザーにとって、これは大きなメリットです。

Windows 対応:Whisper Notes は Mac/iOS 専用です。Windows で作業しているなら、Typeless は両プラットフォームをカバーする数少ない高品質な選択肢の一つです。

コンテキスト認識型フォーマット:Typeless は対象アプリに応じてトーンや構造を調整します。Slack ではカジュアルなフォーマット、Gmail ではフォーマルなフォーマットになります。これは高度なソフトウェアエンジニアリングです。

充実した無料プラン:Typeless は週4,000ワードまで無料で使えます。ライトユーザーなら無料プランで十分かもしれません。Whisper Notes は $4.99 の初期費用がかかります(わずかですが無料ではありません)。

クラウド処理を信頼し、AI による修正出力を重視し、クロスプラットフォームで作業するなら、Typeless はよくできたソフトウェアです。劣っているのではなく、アーキテクチャが異なるのです。

今後の計画:ローカル LLM による修正

オプションとしてローカル LLM 後処理の追加を検討しています。ローカル ASR → ローカル LLM 修正という流れです。デバイス上のモデル(Llama や Mistral など)を使い、プライバシーを維持しながらカジュアルな発話を修正できるようになります。音声もテキストもアップロードされません。修正済みの出力とアーキテクチャで保証されるプライバシー、両方の良いとこ取りが実現します。

私たちが受け入れている正直なトレードオフ

Whisper Notes は発話内容を修正しません。「えーと」「あのー」を繰り返せば、文字起こしにそのまま含まれます。これは逐語的な文字起こしです。

専門的な文書——法律上の証言録取、医療記録、ジャーナリストのインタビュー——では、逐語的が唯一の受け入れられるモードです。話された内容がそのまま文字起こしに反映されなければなりません。

カジュアルなやりとりでは、逐語的だと粗く感じることがあります。「えーと、あのー、つまり、たぶんこれ試した方がいいんじゃないかなって思うんですけど」と口述すれば、そのまま出力されます。Typeless なら「これを試した方がいいと思います」ときれいにしてくれます。

今後の検討事項:オプションとしてローカル LLM 後処理(デバイス上で Llama や Mistral などのモデルを使用)の追加を検討しています。クラウドにアップロードせずに修正したいユーザー向けです。プライバシーを保ちながら修正機能を追加できますが、現時点では未実装です。

現状:カジュアルな場面で修正済みの出力が必要なら、Typeless のほうがユーザー体験は上です。逐語的な正確さが必要、またはクラウドへのアップロードを拒否するなら、Whisper Notes が合理的な選択です。

私たちはプライバシーと速度の最適化を選びました。カジュアルな用途では出力の修正度が下がることを受け入れています。戦略的な正直さ:利便性と引き換えに、データの主権を守ります。

よくある質問

Typeless はオフラインで使えますか?

いいえ。Typeless はすべての処理にインターネット接続が必要です。Whisper Notes は機内モードでも動作します。Whisper モデルが Neural Engine 上でローカル実行されるためです。

Whisper Notes で本当に音声のプライバシーは守られますか?

音声データはデバイスの外に一切出ません。これはポリシーの約束ではなく、アーキテクチャ上の事実です。Whisper モデルは Mac の Neural Engine または iPhone チップ上で動作し、ネットワークリクエストはゼロです。Typeless は話すたびに音声をクラウドサーバーに送信します。

なぜ Typeless は月額 $30 で、Whisper Notes は $4.99 の買い切りなのですか?

Typeless はクラウドインフラ(サーバー、サードパーティの LLM API)を運営しており、継続的なコストが発生します。サブスクリプションはそのインフラを支えるためです。Whisper Notes にはクラウドバックエンドがありません。処理はあなたのハードウェア上で、あなたの電力で行われます。ランニングコストがなければ、継続課金も不要です。

Whisper Notes は Typeless のようにフィラーワードを除去しますか?

いいえ。Whisper Notes は逐語的な文字起こしを行います。「えーと」「あのー」と言えば、そのまま文字起こしに含まれます。Typeless はクラウド LLM でフィラーワードを除去し、出力を修正します。カジュアルな場面ではきれいなテキストになりますが、実際の発話内容と異なる可能性があります。法律、医療、ジャーナリズムなど正確な記録が必要な場面では、逐語的が唯一の受け入れられるモードです。

Typeless と Whisper Notes、どちらが速いですか?

Whisper Notes は設計上、より高速です。Neural Engine 上で動作し、ネットワーク遅延がありません。M シリーズ Mac では、リアルタイムの約10〜12倍の速度で文字起こしが行われます。Typeless はインターネットの往復時間とクラウド LLM の処理時間が加わります。トレードオフ:Whisper Notes は速いがそのまま出力、Typeless は遅いがテキストを修正。

Whisper Notes にボイスメモや会議の録音などの音声ファイルを取り込めますか?

はい。Whisper Notes は録音済みの音声・動画ファイルの取り込みに対応しています。インタビュー、会議、講義など、すでに録音されたコンテンツをドラッグ&ドロップできます。Typeless はリアルタイムの Fn キー音声入力に特化しており、既存ファイルの一括文字起こしには対応していません。

Whisper Notes は Windows に対応していますか?

いいえ。Whisper Notes は Mac と iOS 専用です(Apple Silicon 最適化)。Windows が必要な場合、Typeless は Mac と Windows の両方をカバーする選択肢の一つです。

Whisper Notes にカジュアルな発話の LLM クリーンアップ機能は追加されますか?

検討中です。オプションとしてローカル LLM 後処理(Llama や Mistral などのデバイス上モデル)の追加を検討しています。クラウドにアップロードせずに修正したいユーザー向けです。プライバシーを保ちながら修正機能を追加できますが、現時点では未実装です。現状:Whisper Notes は逐語的な文字起こしのみを提供します。

ローカル処理を試してみませんか

$4.99 買い切り。Fn を押して話し、離す。音声は一切アップロードされません。サブスクなし。クラウドサーバーなし。