Transkripsi Luar Talian
Mengapa Ia Akhirnya Berfungsi
Selama bertahun-tahun, transkripsi tempatan bermaksud lebih perlahan dan lebih teruk. Itu telah berubah.

Sedikit Konteks
Beberapa tahun lalu, jika anda mahukan transkripsi yang tepat, anda perlu memuat naik audio anda ke pelayan seseorang. Pilihan tempatan wujud, tetapi ia jelas lebih teruk. Pertukaran itu nyata.
Kemudian beberapa perkara berlaku. OpenAI mengeluarkan Whisper sebagai model terbuka. Apple mula menghantar cip dengan perkakasan AI khusus. Tiba-tiba model yang sama yang menggerakkan perkhidmatan awan boleh berjalan pada komputer riba.
Kami mula membina Whisper Notes sekitar masa itu, terutamanya kerana kami sendiri memerlukannya. Ternyata ramai orang mencari perkara yang sama.
Apa Yang Berubah
Tiga perkara menjadikan transkripsi awan pilihan yang jelas. Ketiga-tiganya telah berubah.
Kuasa Pengiraan
Model AI yang melakukan transkripsi adalah besar—beratus juta parameter. Menjalankannya perlahan dan menghabiskan bateri pada perkakasan pengguna.
Neural Engine Apple mengubah itu. Ia adalah cip khusus untuk beban kerja AI, dan ia ada dalam setiap Mac siri M dan iPhone terkini. Whisper Large v3 Turbo kini berjalan dengan selesa pada MacBook Air.
Pada telefon, kami menggunakan model yang lebih kecil yang dioptimumkan untuk cip mudah alih. Mereka tidak setepat model besar, tetapi masih lebih baik daripada kebanyakan dikte terbina dalam.
Ketepatan
Ini mengejutkan kami. Kami menjangkakan model tempatan akan "cukup baik". Sebenarnya mereka agak baik.
Whisper Large v3 mempunyai kadar ralat perkataan yang lebih rendah daripada kebanyakan dikte sistem. Dan jurang antara API tempatan dan awan telah menjadi agak kecil. Untuk kebanyakan kes penggunaan, anda mungkin tidak akan perasan perbezaannya.
Itu mengubah pengiraan. Jika ketepatan boleh dibandingkan, sebab utama untuk memuat naik audio hilang.
Privasi
Kami bukan di sini untuk menakutkan anda tentang perkhidmatan awan. Kebanyakannya mengendalikan data dengan bertanggungjawab.
Tetapi ada perbezaan antara "mereka berjanji tidak akan menyalahgunakan" dan "mereka tidak pernah memilikinya". Suara anda adalah biometrik—tidak seperti kata laluan, anda tidak boleh mengubahnya jika sesuatu menjadi salah.
Dengan transkripsi tempatan, audio anda kekal pada peranti anda. Bukan disulitkan-kemudian-dimuat naik. Hanya... kekal. Bagi sesetengah orang itu sangat penting. Bagi yang lain, mungkin tidak. Kami membina untuk kumpulan pertama.
Bila Guna Apa
Tempatan tidak selalu pilihan yang betul. Begini cara kami memikirkannya.
Perlukan kerjasama masa nyata?
Alat awan seperti Otter dibina untuk itu. Ramai orang mengedit transkrip yang sama memerlukan pelayan pusat. Itu penggunaan awan yang baik.
Guna Windows atau Android?
AI tempatan lebih sukar pada platform tersebut—sokongan perkakasan belum matang. Dragon berfungsi untuk Windows. Pada Android, perkhidmatan awan biasanya pilihan praktikal.
Perlu tahu siapa berkata apa?
Pengenalan penutur (diarisasi) memerlukan model tambahan. Perkhidmatan awan seperti Rev mengendalikan ini dengan baik. Alat tempatan sedang mengejar, tetapi ia masih kawasan di mana awan mempunyai kelebihan.
Hanya perlukan transkripsi peribadi dan tepat?
Itulah yang kami fokuskan. Jika kebimbangan utama anda adalah privasi dan ketepatan, dan anda pada perkakasan Apple, tempatan kini berfungsi dengan baik.
Apa Yang Whisper Notes Lakukan
Ia menjalankan Whisper Large v3 Turbo pada Mac anda, atau model yang lebih kecil yang dioptimumkan pada iPhone anda. Audio anda tidak pernah meninggalkan peranti.
Pada Mac, transkripsi berjalan pada kira-kira 10-15 kali kelajuan masa nyata menggunakan Neural Engine. Rakaman satu jam mengambil masa beberapa minit. Pada iPhone lebih perlahan, tetapi praktikal untuk kebanyakan rakaman.
$4.99 sekali, untuk kedua-dua platform. Kami tidak menjalankan pelayan, jadi kami tidak memerlukan langganan. Itu sahaja.
Ringkasnya
Transkripsi tempatan dahulu adalah pertukaran. Kini ia adalah pilihan lalai yang munasabah untuk ramai orang.
Jika anda memerlukan kerjasama atau bekerja pada platform bukan Apple, perkhidmatan awan masih masuk akal. Jika anda terutamanya mahukan transkripsi yang tepat dan peribadi pada Mac atau iPhone, pilihan tempatan telah menjadi agak baik.
Kami sendiri menggunakan Whisper Notes setiap hari. Ia melakukan apa yang kami perlukan.
Cuba
Anda boleh menguji dalam mod kapal terbang jika anda mahu mengesahkan tiada apa yang dimuat naik. Semuanya berfungsi sama.
App Store • $4.99 • Mac dan iPhone
Satu pembelian meliputi kedua-dua platform.