Transkripsi Offline

Mengapa Akhirnya Bisa Berfungsi

Selama bertahun-tahun, transkripsi lokal berarti lebih lambat dan lebih buruk. Itu sudah berubah.

Perangkat Lunak Transkripsi Offline

Sedikit Konteks

Beberapa tahun lalu, jika Anda menginginkan transkripsi yang akurat, Anda harus mengunggah audio ke server orang lain. Opsi lokal ada, tetapi jelas lebih buruk. Komprominya nyata.

Lalu beberapa hal terjadi. OpenAI merilis Whisper sebagai model terbuka. Apple mulai mengirimkan chip dengan hardware AI khusus. Tiba-tiba model yang sama yang menggerakkan layanan cloud bisa berjalan di laptop.

Kami mulai membangun Whisper Notes sekitar waktu itu, terutama karena kami sendiri membutuhkannya. Ternyata banyak orang yang mencari hal yang sama.

Apa yang Berubah

Tiga hal yang dulu membuat transkripsi cloud menjadi pilihan yang jelas. Ketiganya sudah berubah.

Daya Komputasi

Model AI yang melakukan transkripsi itu besar—ratusan juta parameter. Menjalankannya lambat dan menguras baterai di hardware konsumen.

Neural Engine Apple mengubah itu. Ini adalah chip khusus untuk beban kerja AI, dan ada di setiap Mac seri M dan iPhone terbaru. Whisper Large v3 Turbo sekarang berjalan dengan nyaman di MacBook Air.

Di ponsel, kami menggunakan model yang lebih kecil yang dioptimalkan untuk chip mobile. Mereka tidak seakurat model besar, tetapi masih lebih baik dari sebagian besar dikte bawaan.

Akurasi

Ini mengejutkan kami. Kami mengharapkan model lokal akan "cukup baik". Ternyata mereka cukup bagus.

Whisper Large v3 memiliki tingkat kesalahan kata yang lebih rendah dari sebagian besar dikte sistem. Dan gap antara API lokal dan cloud sudah menjadi cukup kecil. Untuk sebagian besar kasus penggunaan, Anda mungkin tidak akan menyadari perbedaannya.

Itu mengubah perhitungan. Jika akurasi sebanding, alasan utama untuk mengunggah audio menghilang.

Privasi

Kami tidak di sini untuk menakut-nakuti Anda tentang layanan cloud. Sebagian besar menangani data dengan bertanggung jawab.

Tetapi ada perbedaan antara "mereka berjanji tidak akan menyalahgunakan" dan "mereka tidak pernah memilikinya". Suara Anda adalah biometrik—tidak seperti kata sandi, Anda tidak bisa mengubahnya jika ada yang salah.

Dengan transkripsi lokal, audio Anda tetap di perangkat Anda. Bukan dienkripsi-lalu-diunggah. Hanya... tetap. Untuk beberapa orang itu sangat penting. Untuk yang lain, mungkin tidak. Kami membangun untuk kelompok pertama.

Kapan Menggunakan Apa

Lokal tidak selalu pilihan yang tepat. Begini cara kami memikirkannya.

Butuh kolaborasi real-time?

Alat cloud seperti Otter dibangun untuk itu. Banyak orang mengedit transkrip yang sama membutuhkan server pusat. Itu penggunaan cloud yang bagus.

Menggunakan Windows atau Android?

AI lokal lebih sulit di platform tersebut—dukungan hardware belum matang. Dragon berfungsi untuk Windows. Di Android, layanan cloud biasanya pilihan praktis.

Perlu tahu siapa yang mengatakan apa?

Identifikasi pembicara (diarization) membutuhkan model tambahan. Layanan cloud seperti Rev menangani ini dengan baik. Alat lokal sedang mengejar, tetapi ini masih area di mana cloud memiliki keunggulan.

Hanya butuh transkripsi privat dan akurat?

Itulah yang kami fokuskan. Jika kekhawatiran utama Anda adalah privasi dan akurasi, dan Anda di hardware Apple, lokal sekarang berfungsi dengan baik.

Apa yang Dilakukan Whisper Notes

Ini menjalankan Whisper Large v3 Turbo di Mac Anda, atau model yang lebih kecil yang dioptimalkan di iPhone Anda. Audio Anda tidak pernah meninggalkan perangkat.

Di Mac, transkripsi berjalan sekitar 10-15 kali kecepatan real-time menggunakan Neural Engine. Rekaman satu jam memakan waktu beberapa menit. Di iPhone lebih lambat, tetapi praktis untuk sebagian besar rekaman.

$4.99 sekali, untuk kedua platform. Kami tidak menjalankan server, jadi kami tidak butuh langganan. Hanya itu.

$4.99Pembelian sekali. Mac dan iPhone. Tanpa langganan. Tanpa pengumpulan data.
Apple App Store logoDapatkan Whisper Notes

Singkatnya

Transkripsi lokal dulu adalah kompromi. Sekarang ini adalah default yang masuk akal untuk banyak orang.

Jika Anda butuh kolaborasi atau bekerja di platform non-Apple, layanan cloud masih masuk akal. Jika Anda terutama menginginkan transkripsi akurat dan privat di Mac atau iPhone, opsi lokal sudah menjadi cukup bagus.

Kami sendiri menggunakan Whisper Notes setiap hari. Ini melakukan apa yang kami butuhkan.

Coba

Anda bisa menguji dalam mode pesawat jika ingin memverifikasi bahwa tidak ada yang diunggah. Semuanya bekerja sama.

App Store • $4.99 • Mac dan iPhone

Satu pembelian mencakup kedua platform.