Privasi Suara: Mengapa Kami Memilih Arkitektur Lokal
Anda tidak perlu memilih antara kemudahan dan kawalan.
Memo suara adalah berbeza
Memo suara sering kali tidak tersusun, tanpa tapisan, dan sangat peribadi. Ia menangkap pemikiran yang sedang terbentuk—idea sebelum diasah, kekecewaan sebelum diproses, pemerhatian sebelum distrukturkan. Keaslian mentah inilah yang menjadikannya bernilai.
Ia terasa berbeza daripada dokumen yang telah digilap. Perasaan itu penting.
Apabila anda merakam memo suara, anda sering bercakap dengan diri sendiri. Keintiman momen itu—ayat yang tidak lengkap, pemikiran yang merayau, kejujuran tanpa perlindungan—layak mendapat penghormatan tertentu dalam cara ia dikendalikan secara teknikal.
Soal kebersihan digital
Suara anda adalah pengenal biometrik yang unik. Berbeza dengan kata laluan, anda tidak boleh menetapkannya semula. Berbeza dengan nombor kad kredit, anda tidak boleh meminta yang baru. Ini bukan untuk menakut-nakutkan—ia hanya sifat data suara yang perlu diakui.
Untuk kebanyakan rakaman harian, pemprosesan awan adalah boleh diterima sepenuhnya. Tetapi untuk kandungan sensitif—refleksi peribadi, nota profesional, perbualan dengan klien—menyimpan fail audio mentah di luar awan adalah kebersihan digital yang baik. Prinsipnya sama dengan tidak menyimpan kata laluan dalam teks biasa: bukan kerana bencana akan datang, tetapi kerana arkitektur yang difikirkan dengan matang mencegah masalah sebelum timbul.
Kami membina Whisper Notes berdasarkan prinsip ini. Audio anda kekal di peranti anda—bukan kerana kami menganggap perkhidmatan awan berbahaya, tetapi kerana anda sepatutnya mempunyai pilihan.
Arkitekturnya
Whisper Notes menjalankan model pengecaman pertuturan Whisper daripada OpenAI terus pada perkakasan anda. Tiada komponen pelayan. Rakaman anda diproses secara lokal dan tidak pernah dihantar ke mana-mana.
Pelaksanaan berbeza antara platform untuk mengoptimumkan keupayaan setiap peranti:
Mac: Whisper Large-v3 Turbo
Di Mac, kami menjalankan Whisper Large-v3 Turbo—model dengan 1.5 bilion parameter yang dioptimumkan untuk Apple Silicon. Ini memberikan ketepatan yang setanding dengan perkhidmatan transkripsi awan, dengan tanda baca yang betul dan pemformatan perenggan yang pintar.
Kelajuan pemprosesan meningkat mengikut cip anda: mesin M4 mencapai kira-kira 12x masa nyata, manakala cip M1 beroperasi pada kira-kira 8x masa nyata.
iPhone: Model Whisper yang Dioptimumkan untuk Mudah Alih
Peranti mudah alih mempunyai kekangan yang berbeza—had terma, ketahanan bateri, lebar jalur memori. Kami menggunakan model Whisper yang dioptimumkan untuk mudah alih, dilaraskan untuk Neural Engine pada cip A dan M.
Walaupun lebih kecil daripada model Mac, ia menghasilkan teks berstruktur dengan tanda baca yang secara konsisten mengatasi imlak standard. Komprominya jujur: untuk ketepatan maksimum pada rakaman panjang, proses di Mac. Untuk tangkapan pantas, model mudah alih berfungsi dengan baik.
Direka untuk kelajuan
Idea yang baik tidak menunggu. Ia datang semasa anda memandu, berjalan, atau tepat sebelum tidur. Widget skrin kunci direka untuk meminimumkan geseran antara pemikiran dan rakaman.
Widget skrin kunci dengan Live Activity
- • Pengaktifan satu ketukan: Mula merakam terus dari skrin kunci
- • Live Activity: Pengesahan visual tempoh rakaman pada Dynamic Island
- • Face ID yang lancar: Widget berfungsi dengan lancar dengan pengesahan Face ID
- • Mesra bebas tangan: Berfungsi dengan sarung tangan, tangan basah, atau gerak isyarat ketuk AirPods
Aliran kerja tangkap-semak
Aliran kerja paling berkesan untuk memo suara memisahkan tangkapan daripada semakan. Peranti mudah alih cemerlang dalam rakaman pantas; persekitaran desktop dalam penyuntingan mendalam.
iPhone: Tangkap
Gunakan iPhone untuk menangkap pemikiran apabila ia muncul. Widget skrin kunci mengurangkan geseran kepada satu ketukan. Model mudah alih terus mentranskripsi, memberikan teks yang boleh digunakan di tempat kejadian.
Mac: Semak
Di Mac, Whisper Notes menawarkan alat untuk kerja mendalam:
- • Pemprosesan Large-v3 Turbo: Transkripsi semula rakaman dengan ketepatan maksimum
- • Perenggan dengan cap masa: Klik mana-mana perenggan untuk melompat ke momen itu dalam audio
- • Main balik segerak: Teks diserlahkan semasa audio dimainkan
- • Eksport fleksibel: Teks biasa, format cap masa, atau sari kata SRT
- • Imlak sistem: Tahan Fn untuk berimlak terus ke mana-mana aplikasi
Transkripsi dengan cap masa dan main balik audio segerak
Ketenangan fikiran
Manfaat sebenar bukan hanya keselamatan teknikal—ia psikologi.
Mengetahui bahawa audio anda tidak pernah meninggalkan peranti memberikan anda kebebasan untuk bercakap dengan bebas sepenuhnya, tanpa penapisan diri. Anda boleh merakam pemikiran separuh terbentuk, meluahkan kekecewaan, sumbang saran secara liar, atau mendokumentasikan perkara profesional sensitif—semuanya tanpa tertanya-tanya siapa yang mungkin akhirnya mengakses audio itu.
Sebab yang sama mengapa sesetengah orang lebih suka menulis di buku nota fizikal: bukan kerana nota digital berbahaya, tetapi kerana perasaan privasi mengubah seberapa bebas anda berfikir.
Model ekonomi
Kerana semua pemprosesan berlaku pada peranti anda, tiada kos pelayan yang meningkat mengikut penggunaan. Ini membolehkan model pembelian sekali: $4.99 untuk iPhone dan Mac, selama-lamanya.
Tiada langganan. Tiada caj per minit. Tiada had penggunaan.
Kompromi yang jujur
Pemprosesan lokal membawa kompromi sebenar yang perlu difahami:
Pertimbangan
- • Kelajuan pemprosesan: Inferens pada peranti lebih perlahan daripada API awan. Rakaman 10 minit mengambil 1-2 minit pada iPhone 15. Perkhidmatan awan bertindak balas dalam saat.
- • Siling ketepatan: Whisper mencapai ketepatan 95%+ pada pertuturan yang jelas. Aksen kuat atau bunyi latar yang ketara mungkin memerlukan sedikit penyuntingan.
- • Platform: Hanya Apple Silicon—Mac M1 atau lebih baharu, iPhone dengan iOS 18+. Tiada Android atau Windows.
- • Transkripsi selepas rakaman: Whisper Notes mentranskripsi selepas merakam, bukan semasa. Ini menghasilkan keputusan yang lebih tepat.
Bila pendekatan ini sesuai
Whisper Notes berfungsi dengan baik untuk:
- • Profesional yang mementingkan privasi: Undang-undang, perubatan, kewartawanan, terapi
- • Refleksi peribadi: Jurnal, menangkap idea, memproses pemikiran
- • Persekitaran luar talian: Kapal terbang, kemudahan selamat, sambungan tidak stabil
- • Pengguna yang letih dengan langganan: Satu pembayaran, akses kekal
Bila perlu pertimbangkan alternatif
Perkhidmatan awan mungkin lebih sesuai jika anda memerlukan:
- • Transkripsi masa nyata yang dikongsi dengan pasukan
- • Pemprosesan segera untuk rakaman yang sangat panjang
- • Sokongan Android atau Windows
Ringkasan
Whisper Notes dibina atas premis mudah: memo suara adalah peribadi, dan anda sepatutnya mengawal di mana audio itu berada. Kami memilih arkitektur local-first bukan kerana perkhidmatan awan buruk, tetapi kerana kandungan tertentu layak untuk kekal di peranti anda.
Whisper Large-v3 Turbo di Mac untuk ketepatan. Model yang dioptimumkan untuk mudah alih di iPhone untuk tangkapan pantas. Kedua-dua platform memproses sepenuhnya luar talian.
$4.99 sekali. iPhone dan Mac. Audio anda milik anda.