Superwhisper vs Whisper Notes: perbandingan teknis
Harga, model ucapan, izin, dan arsitektur — perbandingan detail dua aplikasi transkripsi offline untuk Mac

Superwhisper adalah pelopor. Ini menunjukkan kepada komunitas Mac apa yang mungkin: menjalankan model Whisper OpenAI secara lokal di Apple Silicon, mentranskrip ucapan tanpa mengirim audio ke cloud.
Untuk sementara waktu, itu persis seperti yang banyak dari kami inginkan—utilitas transkripsi lokal yang sederhana dan cepat.
Lalu berubah.
Arah terbaru menuju menjadi "Asisten AI"—kesadaran konteks, sinkronisasi cloud, mode agen yang menafsirkan kata-kata Anda daripada sekadar mentranskrip.
Dengan perubahan ini datang tiga perubahan struktural:
• Langganan: Membayar sewa bulanan untuk model yang berjalan di perangkat keras Anda sendiri.
• Izin: Pemantauan input yang dapat mengamati semua ketukan tombol Anda.
• Akun: Login wajib untuk software yang bekerja sepenuhnya offline.
Halaman ini bukan tentang bug atau masalah sementara. Ini tentang filosofi arsitektur.
Whisper Notes ada sebagai alternatif bagi mereka yang lebih suka apa yang dulu Superwhisper: utilitas offline yang andal yang melakukan satu hal dengan baik.Perbandingan Cepat: Whisper Notes vs Superwhisper
| Fitur | Whisper Notes | Superwhisper |
|---|---|---|
| Harga | $6.99 sekali | $8.49/bulan atau $250 seumur hidup |
| Izin macOS | Hanya Accessibility | Pemantauan input |
| Akun Diperlukan | Tidak | Ya |
| Aplikasi iOS | $6.99 (pembelian terpisah) | Langganan terpisah |
| Model Suara | Whisper + Parakeet V3 + Qwen3-ASR | Whisper (+ varian distil) |
| 100% Offline | Ya | Opsional (hybrid) |
| Pengeditan AI Lokal | Ya (Gemma 4, di perangkat) | Ya (bergantung cloud) |
| Fitur AI Context | Tidak | Ya |
Model Ucapan: Tiga Mesin vs Satu
Ini adalah perbedaan teknis yang paling penting untuk penggunaan sehari-hari.
Superwhisper menawarkan Whisper dan varian distilnya. Whisper Notes hadir dengan tiga mesin ucapan independen, masing-masing dioptimalkan untuk skenario berbeda:
Perbandingan Model Ucapan
| Model | Kecepatan | WER | Terbaik Untuk |
|---|---|---|---|
| Whisper Large V3 Turbo | 10–15× realtime | 7.44% | 100+ bahasa, umum |
| Parakeet V3 | ~35× realtime | 6.32% | Inggris — tercepat, tingkat kesalahan terendah |
| Qwen3-ASR | Streaming | — | Mandarin, Jepang, Korea + 27 bahasa |
Parakeet V3 (oleh NVIDIA) mentranskrip bahasa Inggris 3× lebih cepat dari Whisper dengan tingkat kesalahan lebih rendah — 6.32% vs 7.44% WER pada benchmark FLEURS. Rapat 35 menit yang membutuhkan 3 menit dengan Whisper selesai dalam kurang dari 20 detik dengan Parakeet V3.
Qwen3-ASR dirancang khusus untuk bahasa CJK (Mandarin, Jepang, Korea) dan memberikan transkripsi streaming — teks muncul saat Anda berbicara, bukan setelah selesai.
Ini bukan model cloud di balik paywall. Semuanya berjalan di Neural Engine Mac Anda, termasuk dalam pembelian $6.99.
Superwhisper hanya menawarkan varian Whisper. Untuk alur kerja yang berfokus pada bahasa Inggris atau CJK, perbedaan pemilihan model signifikan.
Pertanyaan Pemantauan input
Ini adalah izin yang membuat pengguna yang sadar privasi berhenti sejenak.
Superwhisper meminta akses Pemantauan input di macOS. Izin ini memungkinkan aplikasi menerima semua kejadian keyboard dan mouse di seluruh sistem—terlepas dari aplikasi mana yang sedang fokus.
Ini adalah kategori izin yang sama yang digunakan oleh alat aksesibilitas, software otomatisasi, dan ya, keylogger.
Mengapa Superwhisper membutuhkannya?Untuk menjadi "pintar". Fitur AI Context mereka membaca konten layar Anda, memahami aplikasi mana yang Anda gunakan, dan menyesuaikan perilaku mereka. Untuk mengamati lingkungan Anda, mereka membutuhkan izin pengamatan.
Trade-off arsitektur:Anda mendapat transkripsi yang sadar konteks. Mereka mendapat kemampuan teknis untuk melihat semua yang Anda ketik, termasuk kata sandi, pesan pribadi, dan dokumen rahasia.
Kami tidak menyarankan niat jahat—tetapi izin itu sendiri secara arsitektur mampu melakukan pengawasan.
Arsitektur Izin
Pemantauan input (Superwhisper):
Dapat menerima semua kejadian keyboard di semua aplikasi. Diperlukan untuk "kesadaran konteks".
Accessibility (Whisper Notes):
Dapat menyisipkan teks di posisi kursor. Tidak dapat membaca ketukan tombol Anda atau mengamati aplikasi lain. Hanya output.
Whisper Notes menggunakan izin Accessibility secara eksklusif. Kami dapat menyisipkan teks di mana kursor Anda berada—itu output. Kami tidak dapat membaca apa yang Anda ketik atau apa yang ada di layar Anda.
Posisi kami: Kami memilih untuk tidak menjadi "pintar" karena pintar memerlukan pengamatan. Alat transkripsi tidak perlu tahu kata sandi Anda ada. Itu hanya perlu mengetik apa yang Anda katakan.Masalah Sewa Perangkat Keras
Ini adalah keputusan harga yang membuat pengguna mahir frustrasi.
Superwhisper telah memindahkan model AI lokal—termasuk Nvidia Parakeet dan varian Whisper—di belakang paywall langganan. Pengguna sekarang membayar biaya bulanan untuk membuka pemrosesan yang berjalan sepenuhnya di perangkat mereka.
Mari kita tepat tentang apa yang terjadi:• MacBook M3 atau M4 Anda memiliki Neural Engine.
• Apple mendesain silikon ini khusus untuk pembelajaran mesin di perangkat.
• Bobot model Whisper adalah open-source, dirilis oleh OpenAI.
• Listrik datang dari stopkontak Anda.
Apa sebenarnya yang dibayar oleh langganan?
| Periode Waktu | Whisper Notes | Superwhisper (Bulanan) | Superwhisper (Seumur Hidup) |
|---|---|---|---|
| Tahun 1 | $6.99 | $101.88 | $250 |
| Tahun 3 | $6.99 | $305.64 | $250 |
| Pengeditan AI Lokal | Ya (Gemma 4, di perangkat) | Ya (bergantung cloud) | |
| Tahun 5 | $6.99 | $509.40 | $250 |
Jika fitur cloud Superwhisper—sinkronisasi, asisten AI, API eksternal—memberikan nilai bagi Anda, harga langganan dapat dipertahankan. Anda membayar untuk infrastruktur mereka.
Tetapi mengunci model lokal di belakang paywall yang sama? Itu menagih sewa untuk komputasi yang terjadi di perangkat keras yang sudah Anda miliki.
Ulasan pengguna mencerminkan frustrasi ini: "Kalian benar-benar menaruh model lokal di belakang paywall? Tidak masuk akal."
Filosofi harga kami: Whisper Notes seharga $6.99 sekali karena kami tidak mengoperasikan infrastruktur cloud. Neural Engine Anda melakukan pekerjaan. Kami menyediakan antarmuka. Itu adalah transaksi sekali, bukan hubungan berkelanjutan.Kompleksitas dan Konsekuensinya
Bagian ini bukan tentang bug tertentu. Ini tentang trade-off arsitektur.
Ketika software mencoba melakukan banyak hal—sinkronisasi cloud, kesadaran konteks, interpretasi agen, pemrosesan hybrid lokal/cloud—ia pasti menjadi kompleks.
Sistem kompleks memiliki lebih banyak mode kegagalan daripada yang sederhana. Ini bukan kritik; ini fisika.Pengguna Superwhisper telah melaporkan pola kegagalan:
• Rekaman yang tidak menghasilkan transkrip
• Audio yang tampaknya menghilang
• Kesalahan "Tidak Ditemukan Suara" setelah sesi panjang
Kami tidak dapat mendiagnosis codebase mereka, tetapi kami dapat mengamati polanya: semakin banyak fitur yang dikelola aplikasi, semakin banyak cara untuk gagal.
Masalah state machine:Aplikasi yang sadar konteks harus melacak banyak variabel. Apa yang ada di layar? Apakah jaringan cukup cepat untuk pemrosesan cloud? Haruskah rekaman ini disinkronkan? Model AI mana yang harus menangani konteks ini?
Setiap titik keputusan adalah ketidakcocokan potensial antara keadaan yang diharapkan dan aktual.
Whisper Notes sengaja sederhana:Rekam audio → Tulis ke disk secara terus-menerus → Proses dengan Whisper → Tampilkan teks
Aliran data linear. Tidak ada sinkronisasi cloud yang gagal. Tidak ada kesadaran konteks yang salah tembak. Tidak ada keputusan routing hybrid.
Kami menggunakan persistensi progresif—menulis audio ke disk setiap beberapa detik selama perekaman. Jika aplikasi crash, atau baterai habis, Anda kehilangan paling banyak beberapa detik terakhir. 20 menit sebelumnya sudah aman di drive Anda.
Ini bukan fitur yang kami promosikan; ini hanya cara software perekaman yang andal seharusnya bekerja.
Trade-off-nya nyata: Kami tidak dapat melakukan apa yang Superwhisper lakukan. Kami tidak memahami konteks layar Anda. Kami tidak menyinkronkan antar perangkat. Kami tidak memiliki mode AI yang memformat ulang ucapan Anda.Kami hanya mentranskrip. Secara akurat, andal, lokal. Itulah seluruh produknya.

Persyaratan Akun
Superwhisper memerlukan pembuatan akun untuk menggunakan software—bahkan untuk transkripsi lokal di perangkat Anda sendiri.
Ini melayani model bisnis mereka: manajemen langganan, sinkronisasi cloud, dan analitik penggunaan memerlukan identitas pengguna.
Tetapi bagi mereka yang hanya ingin suara-ke-teks lokal, itu adalah gesekan tanpa manfaat.
Whisper Notes tidak memiliki sistem akun:• Anda ingin tiga model ucapan — Whisper, Parakeet V3 (Inggris tercepat), dan Qwen3-ASR (terbaik untuk Mandarin/Jepang/Korea)
• Anda ingin pengeditan AI lokal dengan Gemma 4 — perbaikan tanda baca, penghapusan kata pengisi, judul otomatis, semua di perangkat
• Unduh aplikasi
• Mulai berbicara
Tidak ada email. Tidak ada kata sandi. Tidak ada verifikasi identitas.
Ini bukan hanya tentang kenyamanan. Ini tentang minimalisasi data:
• Setiap akun adalah kata sandi lain untuk dikelola
• Setiap entri database adalah target pelanggaran lain
• Setiap identitas pengguna adalah titik data lain untuk dilindungi
Untuk software yang berjalan sepenuhnya di perangkat Anda, kami tidak melihat pembenaran untuk mengetahui siapa Anda. Model Whisper tidak memerlukan email Anda untuk mengubah ucapan menjadi teks.
Kapan Superwhisper Tepat untuk Anda
Kami tidak mengklaim Whisper Notes lebih baik secara universal. Superwhisper membuat pilihan arsitektur yang melayani kasus penggunaan tertentu dengan baik.
Pilih Superwhisper jika:• Anda ingin mode AI Context yang memahami layar dan menyesuaikan output
• Anda memerlukan sinkronisasi cloud antar beberapa Mac
• Anda menghargai pengalaman "asisten" lebih dari transkripsi mentah
• Langganan atau harga seumur hidup $250 sesuai dengan nilai alur kerja Anda
• Izin Pemantauan input tidak mengkhawatirkan Anda
• Anda ingin izin sistem minimal (hanya Accessibility)
• Anda lebih suka transkripsi verbatim tanpa interpretasi AI
• Anda ingin membayar sekali ($6.99) dan memiliki software
• Anda tidak ingin membuat akun
• Arsitektur privasi lebih penting daripada fitur kenyamanan
• Anda juga menggunakan iPhone ($6.99 di App Store, pembelian terpisah dari versi Mac)
Superwhisper sedang membangun menuju masa depan di mana AI memahami seluruh konteks komputasi Anda. Itu ambisius dan beberapa pengguna menginginkannya.
Whisper Notes membangun kebalikannya: utilitas yang melakukan tepat satu hal, tidak tahu apa-apa tentang komputer Anda selain input mikrofon, dan bekerja dengan cara yang sama setiap kali.
Software membosankan untuk orang yang menghargai prediktabilitas.
Argumen untuk Software Membosankan
"Membosankan" bukan penghinaan dalam rekayasa software. Membosankan berarti dapat diprediksi. Membosankan berarti lebih sedikit kejutan.
Software membosankan:
• Tidak memerlukan akun
• Tidak memerlukan konektivitas jaringan untuk fungsi inti
• Tidak meminta izin di luar apa yang benar-benar diperlukan
• Tidak berkembang menjadi sesuatu yang tidak Anda minta
Superwhisper dimulai sebagai software membosankan. Utilitas transkripsi lokal. Sederhana, cepat, andal.
Lalu ia memiliki ambisi. Ia ingin menjadi asisten AI, memahami konteks, menyinkronkan lintas cloud, menafsirkan kata-kata Anda.
Beberapa pengguna mengikuti evolusi itu dengan senang hati. Yang lain merindukan apa yang dulu.
Whisper Notes sengaja membosankan. Kami melakukan satu hal: mengubah ucapan menjadi teks menggunakan Neural Engine perangkat Anda. Kami tidak menonton layar Anda. Kami tidak menyinkronkan data Anda. Kami tidak menafsirkan niat Anda. Kami hanya mentranskrip.
$6.99 per platform. Tidak ada akun. Tidak ada Pemantauan input. Tidak ada langganan. Tidak ada ambisi di luar keandalan.
Bagi mereka yang lebih suka visi asli tentang apa yang bisa menjadi alat transkripsi lokal—Whisper Notes ada di sini.
Pertanyaan yang Sering Diajukan
Mengapa Superwhisper memerlukan izin Pemantauan input?
Superwhisper menggunakan Pemantauan input untuk 'kesadaran konteks'—memahami apa yang ada di layar Anda untuk menyesuaikan perilaku AI. Izin ini memungkinkan membaca semua ketukan tombol di semua aplikasi. Whisper Notes hanya menggunakan izin Accessibility, yang dapat menyisipkan teks tetapi tidak dapat mengamati input Anda atau aplikasi lain.
Mengapa Superwhisper beralih ke harga langganan?
Superwhisper mengoperasikan infrastruktur cloud untuk sinkronisasi, akun, dan beberapa fitur AI. Langganan mendanai infrastruktur itu. Namun, mereka juga menempatkan model lokal (yang berjalan di perangkat keras Anda) di belakang paywall yang sama—dan itulah keputusan harga yang paling dipertanyakan pengguna.
Apakah Whisper Notes seakurat Superwhisper?
Whisper Notes menawarkan tiga model ucapan. Parakeet V3 memiliki tingkat kesalahan kata lebih rendah (6.32%) dibanding Whisper (7.44%) pada benchmark FLEURS bahasa Inggris, dan berjalan 3× lebih cepat. Untuk bahasa Mandarin, Jepang, dan Korea, Qwen3-ASR dirancang khusus untuk bahasa-bahasa ini. Superwhisper hanya menawarkan varian Whisper.
Model ucapan apa yang didukung Whisper Notes?
Tiga model: Whisper Large V3 Turbo (100+ bahasa, umum), Parakeet V3 oleh NVIDIA (Inggris tercepat, tingkat kesalahan terendah), dan Qwen3-ASR oleh Alibaba (dioptimalkan untuk Mandarin, Jepang, Korea, dan 27 bahasa lain dengan output streaming). Semua berjalan secara lokal di perangkat Anda.
Berapa harga Whisper Notes dibandingkan Superwhisper?
Whisper Notes $6.99 per platform (iOS dan Mac dijual terpisah). Superwhisper $8.49/bulan atau $250 seumur hidup, dengan aplikasi iOS memerlukan langganan terpisah. Selama 3 tahun: Whisper Notes $6.99 per platform, Superwhisper bulanan $305.64.
Bisakah Whisper Notes menyinkronkan antar perangkat?
Tidak, secara desain. Kami tidak mengoperasikan server cloud, jadi tidak ada yang bisa disinkronkan. Rekaman Anda tetap di perangkat tempat Anda membuatnya. Ini menghilangkan kegagalan sinkronisasi dan memastikan data suara Anda tidak pernah meninggalkan perangkat keras Anda. Gunakan AirDrop atau ekspor manual jika diperlukan.
Mengapa Whisper Notes tidak memerlukan akun?
Transkripsi lokal tidak memiliki alasan teknis untuk memerlukan verifikasi identitas. Kami percaya pada minimalisasi data—jika kami tidak memerlukan email Anda untuk software bekerja, kami tidak harus memintanya. Tidak ada akun berarti tidak ada kata sandi untuk dikelola, tidak ada entri database untuk dilanggar.
Apa perbedaan antara izin Pemantauan input dan Accessibility?
Pemantauan input dapat menerima semua kejadian keyboard/mouse di seluruh sistem (pengamatan). Accessibility dapat menyisipkan teks dan melakukan otomatisasi UI (tindakan). Whisper Notes menggunakan Accessibility untuk mengetik teks yang ditranskrip di posisi kursor Anda—hanya output, tidak ada pengamatan tentang apa yang Anda ketik.
Tiga Model Suara. $6.99 Sekali.
Whisper + Parakeet V3 + Qwen3-ASR. Pengeditan AI lokal. Tanpa Input Monitoring. Tanpa langganan. Tanpa akun.