Parakeet V3 vs Whisper: 10x brži, veća točnost (Benchmark)

7. ožujka 2026.
·
6 min read
·Whisper Notes Team

TL;DR

Parakeet V3 Whisper Large V3
Brzina 10×
Podržani jezici 25 100+
Stopa grešaka engl. (WER) 6.32% 7.44%
Prosj. stopa grešaka 25 jezika (WER) 12.0% 12.6%
Halucinacije Nema Pri tišini
Najbolje za Engleski i europske Azijske, arapski, 100+

* Brzina: 35 min zvuka, Apple Silicon. Engleski WER: Open ASR Leaderboard. Prosj. 25 jezika: FLEURS benchmark.

Od verzije 1.3.2, Whisper Notes za Mac koristi NVIDIA Parakeet TDT 0.6B kao zadani engine za prepoznavanje govora. 10x je brži od Whisper Large V3 Turbo za engleski i pritom precizniji. Whisper modeli su i dalje dostupni ako ti trebaju drugi jezici.

Zašto smo promijenili zadani model

Whisper je odličan, ali je dizajniran kao univerzalni alat. Podržava 100+ jezika, prevodi, generira vremenske oznake — pravi švicarski nožić. Cijena za to je brzina. Za diktiranje na engleskom, kad jednostavno želiš riječi na ekranu što brže, to je previše.

Evo što me smetalo: kad koristiš sistemsko diktiranje preko Fn tipke s Whisperom, nakon otprilike minutnog govora trebaš čekati 3–5 sekundi da se pojavi transkript. Ta pauza lomi ritam. Prestaneš govoriti, čekaš, gledaš u kursor — i čarolija glasovnog tipkanja nestane.

Parakeet je to potpuno promijenio. Brzina je toliko velika da se transkript pojavi u trenutku kad prestaneš govoriti. Govoriš i riječi su jednostavno tu. Kad jednom osjetiš to — taj bešavni tok bez čekanja — jako se teško vratiti na Whisper.

Koliko je brz Parakeet V3?

Brojke govore sve. Evo stvarne usporedbe na 35-minutnoj audio datoteci na istom Macu:

Model 35 min audio
Whisper Large V3 Turbo 3 minute
Parakeet TDT 0.6B v3 18 sekundi

10x brže. A budući da je model manji (600M naspram 800M parametara), troši i manje memorije i baterije.

Što Parakeet v3 čini tako brzim

Whisper obrađuje audio kao da čitaš knjigu naglas — riječ po riječ, okvir po okvir, nikad ne preskače unaprijed. Čak i tijekom tišine nastavlja obrađivati i pogađati što dolazi sljedeće. To je temeljito, ali sporo.

Parakeet ima fundamentalno drugačiji pristup. Komprimira audio signal 8x prije obrade, tako da model vidi samo ono što je bitno. Zatim, umjesto da melje svaki pojedinačni okvir, predviđa ne samo koju si riječ rekao, nego i koliko dugo ta riječ traje — i preskače naprijed. Tišina? Potpuno preskočena. Dugi samoglasnik? Jedna predikcija umjesto desetaka.

Rezultat je model koji obrađuje govor onako kako to radi tvoj mozak — fokusira se na riječi, ignorira praznine. Zato je 10x brži s manje parametara i višom preciznošću.

Benchmarkovi: Parakeet v3 vs. Whisper

Usporedba Word Error Rate: Parakeet TDT 0.6B v3 naspram Whisper Large V3 i Seamless M4T na više benchmark skupova podataka

Parakeet v3 izjednačuje ili nadmašuje modele 2-4x veće na benchmarkovima FLEURS, CoVoST i MLS

Na Hugging Face Open ASR Leaderboard ljestvici, Parakeet v3 je na vrhu sa samo 600M parametara — to je manje od polovice 1.55B koliko ima Whisper Large V3:

Model Parametri Prosječni WER Brzina (RTFx)
Parakeet TDT 0.6B v3 0.6B 6.32% 3,333x
Canary 1B v2 1.0B 7.15% 749x
Whisper Large V3 1.55B 7.44% 146x
Whisper Large V3 Turbo 0.8B 7.6% 350x

Niži WER = manje grešaka. Viši RTFx = brže. Parakeet pobjeđuje u oboje. Sa 600M parametara, to je ujedno i najmanji model na cijelom popisu — što znači da prekrasno radi na Apple Siliconu s minimalnom potrošnjom memorije i baterije.

Višejezični WER: svih 25 jezika

Gornja ljestvica pokriva samo engleski. Evo cjelovite slike — kako se tri modela dostupna u Whisper Notes uspoređuju na svih 25 jezika koje Parakeet podržava, mjereno na benchmarku FLEURS. Niži WER = manje grešaka u transkripciji. Najbolja vrijednost između Large V3 i Parakeet istaknuta je u svakom retku:

Jezik Whisper Small Whisper Large V3 Parakeet V3
Bugarski 37.3 12.9 12.6
Hrvatski 33.4 11.1 12.5
Češki 37.6 11.3 11.0
Danski 32.8 12.6 18.4
Nizozemski 16.4 5.6 7.5
Engleski 6.1 4.3 4.9
Estonski 51.3 19.1 17.7
Finski 24.0 7.7 13.2
Francuski 15.0 6.3 5.2
Njemački 10.2 4.3 5.0
Grčki 30.8 27.0 20.7
Mađarski 38.9 14.1 15.7
Talijanski 9.8 2.3 3.0
Latvijski 53.2 18.3 22.8
Litvanski 65.6 22.3 20.4
Malteški 92.2 68.9 20.5
Poljski 14.7 4.7 7.3
Portugalski 7.3 3.7 4.8
Rumunjski 29.8 8.2 12.4
Ruski 11.4 4.2 5.5
Slovački 33.3 8.4 8.8
Slovenski 49.3 19.9 24.0
Španjolski 5.6 3.1 3.5
Švedski 20.8 7.9 15.1
Ukrajinski 19.3 6.5 6.8
Prosjek 29.8 12.6 12.0

WER (%) na FLEURS. Podaci za Whisper Small iz Radford et al.; podaci za Large V3 i Parakeet V3 iz NVIDIA Canary-1B-v2 članka.

Whisper Large V3 vodi na većini pojedinačnih jezika — naposljetku je 2,5x veći. Ali Parakeet V3 mu se izjednačuje u prosjeku (12,0% naspram 12,6%), uvjerljivo pobjeđuje na grčkom, francuskom, estonskom i malteškom, te potpuno uništava Whisper Small po cijeloj liniji (60% manje grešaka u prosjeku). Bit nije u djeliću postotka WER — nego u cjelokupnom paketu: preciznost razine Large V3 pri 23x većoj brzini, s 40% memorije, nula halucinacija, i sve radi lokalno na tvom Macu.

Nema više halucinacija

Ako si koristio Whisper za diktiranje, vjerojatno si vidio kako halucinira tijekom tišine — ponavlja fraze, izmišlja riječi ili iz ničega izbaci „Subtitles by Amara.org". To se događa jer autoregresivni dekoder Whispera uvijek očekuje da će generirati tekst, čak i kad nema ništa za transkribirati.

NVIDIA je trenirala Parakeet na 36 000 sati čistog negovornog audia (pozadinska buka, kašljanje, tišina) s praznim stringovima kao ciljnim tekstom. Model je naučio prepoznati tišinu i šutjeti. Za režim stalnog sistemskog diktiranja to je presudna promjena — nema više besmislenog teksta kad se zaustavljaš da razmisliš.

Koje jezike Parakeet podržava

Parakeet v3 podržava 25 jezika: bugarski, hrvatski, češki, danski, nizozemski, engleski, estonski, finski, francuski, njemački, grčki, mađarski, talijanski, latvijski, litvanski, malteški, poljski, portugalski, rumunjski, ruski, slovački, slovenski, španjolski, švedski i ukrajinski.

To pokriva veći dio Europe, ali ne podržava kineski, japanski, korejski, arapski ni hindi. Zato smo Whisper modele ostavili kao opcije za preuzimanje. Ako diktiraš na japanskom ili mandarinskom, odaberi Whisper Large V3 Turbo u izborniku modela. Za engleski i europske jezike, Parakeet v3 je jednostavno bolji engine.

Izbornik modela u Whisper Notes za Mac: Parakeet V3 kao zadani, Whisper Small i Whisper Large V3 Turbo dostupni za preuzimanje

Izbornik modela: Parakeet V3 (zadani), Whisper Small i Whisper Large V3 Turbo — sve radi lokalno

Izbornik modela u Whisper Notes

Otvori Postavke za prebacivanje između modela:

  • Parakeet V3 (zadani) — Najbrži, najbolji izbor za engleski i europske jezike
  • Whisper Small — Lagani, 100+ jezika
  • Whisper Large V3 Turbo — Najprecizniji višejezični model

Svi modeli rade 100% lokalno na tvom Macu. Bez interneta, bez clouda, podaci ne napuštaju tvoj uređaj.

A što s Parakeet V2?

Ako ste koristili V2, vjerojatno vas zanima usporedba. V2 je bio model samo za engleski — a njegova točnost na engleskom je zapravo nešto bolja od V3 (WER 6,05 % naspram 6,32 %). V3 zamjenjuje tu malu razliku za podršku za 25 jezika. Oba su znatno točnija od Whispera.

Parakeet V2 Parakeet V3 Whisper Large V3
WER (engleski) 6.05% 6.32% 7.44%
Jezici Samo engleski 25 100+

Ukratko: ako vam treba samo engleski, i V2 i V3 su izvrsni. V3 je zadani model u Whisper Notes jer je višejezična podrška važna većini korisnika — a razlika u točnosti engleskog je zanemariva.

Isprobaj

Parakeet v3 je dostupan odmah u verziji za Mac — samo preuzmi najnoviji DMG. (Ažuriranje: Parakeet je sada dostupan i u najnovijoj iOS verziji.)

Pitanja ili povratne informacije? Piši na support@whispernotes.app.