Parakeet V3 vs Whisper: 10x lebih pantas, ketepatan lebih baik (Benchmark)

7 Mac 2026
·
6 min read
·Whisper Notes Team

TL;DR

Parakeet V3 Whisper Large V3
Kelajuan 10×
Bahasa yang disokong 25 100+
Kadar ralat Inggeris (WER) 6.32% 7.44%
Purata kadar ralat 25 bahasa (WER) 12.0% 12.6%
Halusinasi Tiada Semasa senyap
Terbaik untuk Inggeris & Eropah Asia, Arab, 100+

* Kelajuan: audio 35 min, Apple Silicon. WER Inggeris: Open ASR Leaderboard. Purata 25 bahasa: penanda aras FLEURS.

Bermula dari versi 1.3.2, Whisper Notes untuk Mac menggunakan NVIDIA Parakeet TDT 0.6B sebagai enjin pengecaman suara lalai. Ia 10x lebih pantas daripada Whisper Large V3 Turbo untuk bahasa Inggeris, dan lebih tepat juga. Model Whisper masih boleh digunakan kalau anda perlukan bahasa lain.

Kenapa Kami Tukar Model Lalai

Whisper memang bagus, tapi ia direka sebagai model serba guna. Ia boleh mengendalikan 100+ bahasa, menterjemah, menjana timestamp — macam pisau Swiss Army. Tukarannya ialah kelajuan. Untuk dikte bahasa Inggeris, di mana anda cuma nak perkataan muncul di skrin dengan pantas, ia berlebihan.

Ada satu benda yang mengganggu saya: bila guna dikte seluruh sistem melalui kekunci Fn dengan Whisper, habis bercakap ~1 minit kena tunggu 3–5 saat baru transkrip muncul. Jeda tu merosakkan aliran kerja. Berhenti bercakap, tunggu, tengok kursor — ia membunuh keajaiban voice typing.

Parakeet ubah semua tu. Kelajuannya begitu pantas sehingga transkrip muncul serta-merta bila anda berhenti bercakap. Bercakap, dan perkataan terus ada di situ. Sekali anda rasa pengalaman tu — aliran lancar tanpa menunggu — memang susah nak balik ke Whisper.

Berapa Pantas Parakeet V3?

Nombor bercakap lebih kuat daripada kata-kata. Ini perbandingan sebenar menggunakan fail audio 35 minit pada Mac yang sama:

Model Audio 35 minit
Whisper Large V3 Turbo 3 minit
Parakeet TDT 0.6B v3 18 saat

10x lebih pantas. Dan kerana model lebih kecil (600M berbanding 800M parameter), ia guna memori dan bateri yang lebih sedikit juga.

Apa yang Buat Parakeet v3 Begitu Pantas

Whisper mendengar audio macam anda membaca buku dengan kuat — perkataan demi perkataan, frame demi frame, tak pernah melompat ke hadapan. Walaupun masa senyap, ia masih memproses, masih meneka apa yang datang seterusnya. Teliti memang teliti, tapi lambat.

Parakeet guna pendekatan yang berbeza secara asas. Ia memampatkan isyarat audio 8x sebelum memproses, jadi model hanya nampak apa yang penting. Kemudian, daripada mengisar setiap frame satu per satu, ia meramal bukan sahaja perkataan apa yang anda sebut, tapi juga berapa lama perkataan itu berlangsung — dan terus melompat ke hadapan. Senyap? Dilangkau terus. Vokal yang panjang? Satu ramalan sahaja, bukan berpuluh-puluh.

Hasilnya ialah model yang memproses pertuturan macam cara otak anda bekerja — fokus pada perkataan, abaikan ruang kosong. Itulah sebabnya ia 10x lebih pantas dengan parameter lebih sedikit dan ketepatan lebih tinggi.

Penanda Aras: Parakeet v3 vs Whisper

Perbandingan Kadar Ralat Perkataan: Parakeet TDT 0.6B v3 vs Whisper Large V3 vs Seamless M4T merentasi beberapa set data penanda aras

Parakeet v3 menyamai atau mengatasi model 2-4x lebih besar merentasi penanda aras FLEURS, CoVoST dan MLS

Di Hugging Face Open ASR Leaderboard, Parakeet v3 menduduki puncak carta dengan hanya 600M parameter — kurang daripada separuh 1.55B Whisper Large V3:

Model Parameter WER Purata Kelajuan (RTFx)
Parakeet TDT 0.6B v3 0.6B 6.32% 3,333x
Canary 1B v2 1.0B 7.15% 749x
Whisper Large V3 1.55B 7.44% 146x
Whisper Large V3 Turbo 0.8B 7.6% 350x

WER lebih rendah = kurang ralat. RTFx lebih tinggi = lebih pantas. Parakeet menang kedua-duanya. Dengan 600M parameter, ia juga model paling kecil dalam senarai tu — bermakna ia berjalan dengan cantik di Apple Silicon dengan penggunaan memori dan bateri yang minimum.

WER Pelbagai Bahasa: Kesemua 25 Bahasa

Carta kedudukan di atas hanya meliputi bahasa Inggeris. Ini gambaran penuh — bagaimana tiga model yang tersedia dalam Whisper Notes dibandingkan merentasi kesemua 25 bahasa yang disokong Parakeet, diukur pada penanda aras FLEURS. WER lebih rendah = kurang ralat transkripsi. Nilai terbaik antara Large V3 dan Parakeet disorot setiap baris:

Bahasa Whisper Small Whisper Large V3 Parakeet V3
Bulgaria 37.3 12.9 12.6
Croatia 33.4 11.1 12.5
Czech 37.6 11.3 11.0
Denmark 32.8 12.6 18.4
Belanda 16.4 5.6 7.5
Inggeris 6.1 4.3 4.9
Estonia 51.3 19.1 17.7
Finland 24.0 7.7 13.2
Perancis 15.0 6.3 5.2
Jerman 10.2 4.3 5.0
Greek 30.8 27.0 20.7
Hungary 38.9 14.1 15.7
Itali 9.8 2.3 3.0
Latvia 53.2 18.3 22.8
Lithuania 65.6 22.3 20.4
Malta 92.2 68.9 20.5
Poland 14.7 4.7 7.3
Portugis 7.3 3.7 4.8
Romania 29.8 8.2 12.4
Rusia 11.4 4.2 5.5
Slovakia 33.3 8.4 8.8
Slovenia 49.3 19.9 24.0
Sepanyol 5.6 3.1 3.5
Sweden 20.8 7.9 15.1
Ukraine 19.3 6.5 6.8
Purata 29.8 12.6 12.0

WER (%) pada FLEURS. Data Whisper Small daripada Radford et al.; data Large V3 dan Parakeet V3 daripada kertas kerja NVIDIA Canary-1B-v2.

Whisper Large V3 mendahului dalam kebanyakan bahasa individu — ia 2.5x lebih besar. Tapi Parakeet V3 menyamainya secara purata (12.0% berbanding 12.6%), menang jelas dalam bahasa Greek, Perancis, Estonia dan Malta, serta menghancurkan Whisper Small secara menyeluruh (purata 60% kurang ralat). Cerita sebenar bukan tentang pecahan peratusan dalam WER — ia tentang pakej keseluruhan: ketepatan tahap Large V3 pada kelajuan 23x, dengan 40% memori, sifar halusinasi, dan semuanya berjalan secara tempatan di Mac anda.

Tiada Lagi Halusinasi

Kalau anda pernah guna Whisper untuk dikte, anda mungkin pernah nampak ia berhalusinasi masa senyap — mengulang frasa, mereka kata, atau tiba-tiba keluarkan "Subtitles by Amara.org" entah dari mana. Ini berlaku kerana decoder autoregressive Whisper sentiasa mengharapkan untuk menghasilkan teks, walaupun tiada apa untuk ditranskrip.

NVIDIA melatih Parakeet dengan 36,000 jam audio bukan-pertuturan tulen (bunyi latar, batuk, senyap) yang dipasangkan dengan sasaran rentetan kosong. Model belajar macam mana bunyi senyap dan kekal diam. Untuk dikte seluruh sistem yang sentiasa aktif, ini pengubah permainan — tiada lagi teks sampah muncul bila anda berhenti seketika untuk berfikir.

Bahasa yang Disokong Parakeet

Parakeet v3 menyokong 25 bahasa: Bulgaria, Croatia, Czech, Denmark, Belanda, Inggeris, Estonia, Finland, Perancis, Jerman, Greek, Hungary, Itali, Latvia, Lithuania, Malta, Poland, Portugis, Romania, Rusia, Slovakia, Slovenia, Sepanyol, Sweden dan Ukraine.

Itu meliputi hampir seluruh Eropah, tapi ia tidak menyokong bahasa Mandarin, Jepun, Korea, Arab atau Hindi. Sebab itulah kami kekalkan model Whisper sebagai pilihan muat turun. Kalau anda mendikte dalam bahasa Jepun atau Mandarin, pilih Whisper Large V3 Turbo dari pemilih model. Untuk bahasa Inggeris dan bahasa Eropah, Parakeet v3 memang enjin yang lebih baik.

Pemilih model Whisper Notes Mac menunjukkan Parakeet V3 sebagai lalai, dengan Whisper Small dan Whisper Large V3 Turbo boleh dimuat turun

Pemilih model: Parakeet V3 (lalai), Whisper Small dan Whisper Large V3 Turbo — semuanya berjalan secara tempatan

Pemilih Model dalam Whisper Notes

Buka Tetapan untuk bertukar antara model:

  • Parakeet V3 (lalai) — Paling pantas, terbaik untuk bahasa Inggeris & bahasa Eropah
  • Whisper Small — Ringan, 100+ bahasa
  • Whisper Large V3 Turbo — Model pelbagai bahasa paling tepat

Semua model berjalan 100% secara tempatan di Mac anda. Tanpa internet, tanpa awan, tiada data meninggalkan peranti anda.

Bagaimana dengan Parakeet V2?

Jika anda pernah menggunakan V2, mungkin anda tertanya-tanya bagaimana perbandingannya. V2 adalah model untuk Bahasa Inggeris sahaja — dan ketepatan Bahasa Inggerisnya sebenarnya sedikit lebih baik daripada V3 (WER 6.05% vs 6.32%). V3 menukar perbezaan kecil itu dengan sokongan 25 bahasa. Kedua-duanya jauh lebih tepat daripada Whisper.

Parakeet V2 Parakeet V3 Whisper Large V3
WER Inggeris 6.05% 6.32% 7.44%
Bahasa Inggeris sahaja 25 100+

Ringkasnya: jika anda hanya perlukan Bahasa Inggeris, V2 dan V3 kedua-duanya cemerlang. V3 adalah lalai dalam Whisper Notes kerana sokongan berbilang bahasa penting bagi kebanyakan pengguna — dan perbezaan ketepatan Bahasa Inggeris boleh diabaikan.

Cuba Sekarang

Parakeet v3 sudah tersedia dalam versi Mac — cuma muat turun DMG terkini. (Kemas kini: Parakeet kini turut tersedia dalam versi iOS terkini.)

Ada soalan atau maklum balas? Emel ke support@whispernotes.app.