Privasi Suara: Mengapa Kami Memilih Arsitektur Lokal
Anda tidak harus memilih antara kenyamanan dan kontrol.
Catatan suara itu berbeda
Catatan suara sering kali berantakan, tanpa filter, dan sangat personal. Mereka menangkap pikiran yang sedang terbentuk—ide sebelum dipoles, frustrasi sebelum dicerna, pengamatan sebelum distrukturkan. Keaslian mentah inilah yang membuatnya berharga.
Rasanya berbeda dari dokumen yang sudah rapi. Perasaan itu penting.
Ketika Anda merekam catatan suara, sering kali Anda berbicara dengan diri sendiri. Keintiman momen itu—kalimat yang tidak selesai, pemikiran yang mengembara, kejujuran tanpa perlindungan—layak mendapat penghormatan tertentu dalam cara penanganan teknisnya.
Soal kebersihan digital
Suara Anda adalah pengenal biometrik yang unik. Berbeda dengan kata sandi, Anda tidak bisa mengatur ulangnya. Berbeda dengan nomor kartu kredit, Anda tidak bisa meminta yang baru. Ini bukan untuk menakut-nakuti—ini hanya karakteristik data suara yang patut disadari.
Untuk sebagian besar rekaman sehari-hari, pemrosesan cloud sangat bisa diterima. Tapi untuk konten sensitif—refleksi pribadi, catatan profesional, percakapan dengan klien—menyimpan file audio mentah di luar cloud adalah kebersihan digital yang baik. Prinsipnya sama dengan tidak menyimpan kata sandi dalam teks biasa: bukan karena bencana akan datang, tapi karena arsitektur yang dipikirkan dengan matang mencegah masalah sebelum muncul.
Kami membangun Whisper Notes berdasarkan prinsip ini. Audio Anda tetap di perangkat Anda—bukan karena kami menganggap layanan cloud berbahaya, tapi karena Anda seharusnya punya pilihan.
Arsitekturnya
Whisper Notes menjalankan model pengenalan ucapan Whisper dari OpenAI langsung di perangkat keras Anda. Tidak ada komponen server. Rekaman Anda diproses secara lokal dan tidak pernah dikirim ke mana pun.
Implementasinya berbeda antar platform untuk mengoptimalkan kemampuan setiap perangkat:
Mac: Whisper Large-v3 Turbo
Di Mac, kami menjalankan Whisper Large-v3 Turbo—model dengan 1,5 miliar parameter yang dioptimalkan untuk Apple Silicon. Ini memberikan akurasi yang sebanding dengan layanan transkripsi cloud, dengan tanda baca yang benar dan pemformatan paragraf yang cerdas.
Kecepatan pemrosesan meningkat seiring chip Anda: mesin M4 mencapai sekitar 12x real-time, sementara chip M1 beroperasi sekitar 8x real-time.
iPhone: Model Whisper yang Dioptimalkan untuk Mobile
Perangkat mobile memiliki batasan berbeda—batas termal, daya tahan baterai, bandwidth memori. Kami menggunakan model Whisper yang dioptimalkan untuk mobile, disetel untuk Neural Engine pada chip A dan M.
Meskipun lebih kecil dari model Mac, ia menghasilkan teks terstruktur dengan tanda baca yang konsisten mengalahkan dikte standar. Komprominya jujur: untuk akurasi maksimal pada rekaman panjang, proses di Mac. Untuk penangkapan cepat, model mobile bekerja dengan baik.
Dirancang untuk kecepatan
Ide bagus tidak menunggu. Mereka datang saat Anda menyetir, berjalan, atau tepat sebelum tidur. Widget layar kunci dirancang untuk meminimalkan hambatan antara pikiran dan rekaman.
Widget layar kunci dengan Live Activity
- • Aktivasi satu ketukan: Mulai merekam langsung dari layar kunci
- • Live Activity: Konfirmasi visual durasi rekaman di Dynamic Island
- • Integrasi Face ID: Widget bekerja lancar dengan autentikasi Face ID
- • Ramah hands-free: Bekerja dengan sarung tangan, tangan basah, atau gerakan ketuk AirPods
Alur kerja tangkap-tinjau
Alur kerja paling efektif untuk catatan suara memisahkan penangkapan dari peninjauan. Perangkat mobile unggul dalam perekaman cepat; lingkungan desktop dalam pengeditan mendalam.
iPhone: Tangkap
Gunakan iPhone untuk menangkap pikiran saat muncul. Widget layar kunci mengurangi hambatan menjadi satu ketukan. Model mobile langsung mentranskripsi, memberikan teks yang bisa digunakan di tempat.
Mac: Tinjau
Di Mac, Whisper Notes menawarkan alat untuk pekerjaan mendalam:
- • Pemrosesan Large-v3 Turbo: Transkripsi ulang rekaman dengan akurasi maksimal
- • Paragraf dengan timestamp: Klik paragraf mana pun untuk melompat ke momen itu di audio
- • Pemutaran tersinkronisasi: Teks disorot saat audio diputar
- • Ekspor fleksibel: Teks polos, format timestamp, atau subtitle SRT
- • Dikte sistem: Tahan Fn untuk mendikte langsung ke aplikasi apa pun
Transkripsi dengan timestamp dan pemutaran audio tersinkronisasi
Ketenangan pikiran
Manfaat sebenarnya bukan hanya keamanan teknis—ini psikologis.
Mengetahui bahwa audio Anda tidak pernah meninggalkan perangkat memberi Anda kebebasan untuk berbicara sepenuhnya bebas, tanpa sensor diri. Anda bisa merekam pikiran yang setengah terbentuk, meluapkan frustrasi, melakukan brainstorming liar, atau mendokumentasikan masalah profesional yang sensitif—semuanya tanpa bertanya-tanya siapa yang mungkin akhirnya mengakses audio itu.
Alasannya sama mengapa beberapa orang lebih suka menulis di buku catatan fisik: bukan karena catatan digital berbahaya, tapi karena perasaan privasi mengubah seberapa bebas Anda berpikir.
Model ekonominya
Karena semua pemrosesan terjadi di perangkat Anda, tidak ada biaya server yang berkembang seiring penggunaan. Ini memungkinkan model pembelian sekali: $4.99 untuk iPhone dan Mac, selamanya.
Tanpa langganan. Tanpa biaya per menit. Tanpa batas penggunaan.
Kompromi yang jujur
Pemrosesan lokal membawa kompromi nyata yang perlu dipahami:
Pertimbangan
- • Kecepatan pemrosesan: Inferensi di perangkat lebih lambat dari API cloud. Rekaman 10 menit membutuhkan 1-2 menit di iPhone 15. Layanan cloud merespons dalam hitungan detik.
- • Batas akurasi: Whisper mencapai 95%+ akurasi pada ucapan yang jelas. Aksen kuat atau kebisingan latar belakang yang signifikan mungkin memerlukan beberapa pengeditan.
- • Platform: Hanya Apple Silicon—Mac M1 atau lebih baru, iPhone dengan iOS 18+. Tidak ada Android atau Windows.
- • Transkripsi pasca-rekaman: Whisper Notes mentranskripsi setelah merekam, bukan selama. Ini menghasilkan hasil yang lebih akurat.
Kapan pendekatan ini cocok
Whisper Notes cocok untuk:
- • Profesional yang peduli privasi: Hukum, medis, jurnalisme, terapi
- • Refleksi pribadi: Jurnal, menangkap ide, memproses pikiran
- • Lingkungan offline: Pesawat, fasilitas aman, koneksi tidak stabil
- • Pengguna yang lelah langganan: Satu pembayaran, akses permanen
Kapan mempertimbangkan alternatif
Layanan cloud mungkin lebih cocok jika Anda membutuhkan:
- • Transkripsi real-time yang dibagikan dengan tim
- • Pemrosesan instan untuk rekaman yang sangat panjang
- • Dukungan Android atau Windows
Ringkasan
Whisper Notes dibangun di atas premis sederhana: catatan suara itu personal, dan Anda seharusnya mengontrol di mana audio itu berada. Kami memilih arsitektur local-first bukan karena layanan cloud buruk, tapi karena konten tertentu layak tetap di perangkat Anda.
Whisper Large-v3 Turbo di Mac untuk akurasi. Model yang dioptimalkan untuk mobile di iPhone untuk penangkapan cepat. Kedua platform memproses sepenuhnya offline.
$4.99 sekali. iPhone dan Mac. Audio Anda milik Anda.