Parakeet V3 vs Whisper: 10x sneller, betere nauwkeurigheid (Benchmark)

7 maart 2026
·
6 min read
·Whisper Notes Team

TL;DR

Parakeet V3 Whisper Large V3
Snelheid 10×
Ondersteunde talen 25 100+
Engelse foutmarge (WER) 6.32% 7.44%
Gem. foutmarge 25 talen (WER) 12.0% 12.6%
Hallucinaties Geen Bij stilte
Beste voor Engels & Europees Aziatisch, Arabisch, 100+

* Snelheid: 35 min audio op Apple Silicon. Engels WER: Open ASR Leaderboard. Gem. 25 talen: FLEURS-benchmark.

Vanaf versie 1.3.2 wordt Whisper Notes voor Mac geleverd met NVIDIA Parakeet TDT 0.6B als standaard spraakmodel. Het is 10x sneller dan Whisper Large V3 Turbo voor Engels, en nauwkeuriger. Whisper-modellen blijven beschikbaar als je andere talen nodig hebt.

Waarom we het standaardmodel hebben vervangen

Whisper is geweldig, maar het is ontworpen als een alleskunner. Het ondersteunt meer dan 100 talen, vertaalt, genereert timestamps — een echt Zwitsers zakmes. Het nadeel is snelheid. Voor Engels dicteren, waarbij je gewoon snel woorden op je scherm wilt zien, is het overkill.

Wat me echt dwars zat: als ik de systeembrede Fn-toets dicteerfunctie met Whisper gebruikte, moest ik na een opname van ~1 minuut 3–5 seconden wachten voordat de tekst verscheen. Die pauze breekt je flow. Je stopt met praten, je wacht, je staart naar de cursor — het maakt de magie van stemtypen kapot.

Parakeet heeft dat volledig veranderd. Het is zo snel dat de tekst verschijnt op het moment dat je stopt met praten. Je praat, en de woorden zijn er gewoon meteen. Als je dat gevoel eenmaal hebt ervaren — die naadloze, wachtvrije flow — dan is het heel moeilijk om terug te gaan naar Whisper.

Hoe snel is Parakeet V3?

Cijfers zeggen meer dan woorden. Hier is een echte vergelijking met een audiobestand van 35 minuten op dezelfde Mac:

Model 35 min. audio
Whisper Large V3 Turbo 3 minuten
Parakeet TDT 0.6B v3 18 seconden

Dat is 10x sneller. En omdat het model kleiner is (600M vs. 800M parameters), verbruikt het ook minder geheugen en minder batterij.

Wat Parakeet v3 zo snel maakt

Whisper luistert naar audio zoals je een boek hardop zou voorlezen — woord voor woord, frame voor frame, zonder ooit vooruit te springen. Zelfs tijdens stilte is het aan het verwerken, aan het raden wat er komt. Grondig, maar traag.

Parakeet pakt het fundamenteel anders aan. Het comprimeert het audiosignaal 8x voordat het wordt verwerkt, zodat het model alleen ziet wat er toe doet. Vervolgens, in plaats van elk frame door te ploegen, voorspelt het niet alleen welk woord je zei, maar ook hoe lang dat woord duurt — en springt vooruit. Stilte? Helemaal overgeslagen. Een lange klinker? Eén voorspelling in plaats van tientallen.

Het resultaat is een model dat spraak verwerkt zoals je brein dat doet — focussen op de woorden, de stiltes negeren. Daarom is het 10x sneller met minder parameters en hogere nauwkeurigheid.

Benchmarks: Parakeet v3 vs. Whisper

Vergelijking van woordfoutpercentage: Parakeet TDT 0.6B v3 vs. Whisper Large V3 vs. Seamless M4T over meerdere benchmarkdatasets

Parakeet v3 evenaart of verslaat modellen die 2-4x zo groot zijn op FLEURS-, CoVoST- en MLS-benchmarks

Op het Hugging Face Open ASR Leaderboard staat Parakeet v3 bovenaan met slechts 600M parameters — minder dan de helft van Whisper Large V3's 1,55B:

Model Parameters Gem. WER Snelheid (RTFx)
Parakeet TDT 0.6B v3 0.6B 6.32% 3,333x
Canary 1B v2 1.0B 7.15% 749x
Whisper Large V3 1.55B 7.44% 146x
Whisper Large V3 Turbo 0.8B 7.6% 350x

Lagere WER = minder fouten. Hogere RTFx = sneller. Parakeet wint op beide vlakken. Met 600M parameters is het ook het kleinste model in de lijst — wat betekent dat het prachtig draait op Apple Silicon met minimaal geheugen- en batterijverbruik.

Meertalige WER: Alle 25 talen

Het bovenstaande leaderboard dekt alleen Engels. Hier is het volledige plaatje — hoe de drie modellen in Whisper Notes presteren in alle 25 talen die Parakeet ondersteunt, gemeten op de FLEURS-benchmark. Lagere WER = minder transcriptiefouten. De beste waarde tussen Large V3 en Parakeet wordt per rij gemarkeerd:

Taal Whisper Small Whisper Large V3 Parakeet V3
Bulgaars 37.3 12.9 12.6
Kroatisch 33.4 11.1 12.5
Tsjechisch 37.6 11.3 11.0
Deens 32.8 12.6 18.4
Nederlands 16.4 5.6 7.5
Engels 6.1 4.3 4.9
Ests 51.3 19.1 17.7
Fins 24.0 7.7 13.2
Frans 15.0 6.3 5.2
Duits 10.2 4.3 5.0
Grieks 30.8 27.0 20.7
Hongaars 38.9 14.1 15.7
Italiaans 9.8 2.3 3.0
Lets 53.2 18.3 22.8
Litouws 65.6 22.3 20.4
Maltees 92.2 68.9 20.5
Pools 14.7 4.7 7.3
Portugees 7.3 3.7 4.8
Roemeens 29.8 8.2 12.4
Russisch 11.4 4.2 5.5
Slowaaks 33.3 8.4 8.8
Sloveens 49.3 19.9 24.0
Spaans 5.6 3.1 3.5
Zweeds 20.8 7.9 15.1
Oekraïens 19.3 6.5 6.8
Gemiddelde 29.8 12.6 12.0

WER (%) op FLEURS. Whisper Small-data van Radford et al.; Large V3- en Parakeet V3-data van NVIDIAs Canary-1B-v2-paper.

Whisper Large V3 scoort iets beter op de meeste individuele talen — het is tenslotte 2,5x groter. Maar Parakeet V3 houdt het gemiddeld bij (12,0% vs 12,6%), wint overtuigend bij Grieks, Frans, Ests en Maltees, en verplettert Whisper Small over de hele lijn (gemiddeld 60% minder fouten). Het echte verhaal is niet een fractie van een procent in WER — het is het totaalpakket: Large V3-niveau nauwkeurigheid bij 23x de snelheid, met 40% van het geheugen, nul hallucinaties, en alles draait lokaal op je Mac.

Geen hallucinaties meer

Als je Whisper voor dicteren hebt gebruikt, heb je het waarschijnlijk wel eens zien hallucineren tijdens stilte — zinnen herhalen, woorden verzinnen, of uit het niets "Subtitles by Amara.org" uitspugen. Dit gebeurt omdat Whispers autoregressieve decoder altijd verwacht tekst te produceren, zelfs als er niets te transcriberen valt.

NVIDIA heeft Parakeet getraind op 36.000 uur puur niet-spraak audio (achtergrondgeluid, hoesten, stilte) gekoppeld aan lege string-targets. Het model heeft geleerd hoe stilte klinkt en houdt zijn mond. Voor systeembreed dicteren dat altijd aan staat, is dit een gamechanger — geen rommel-tekst meer als je even nadenkt.

Welke talen Parakeet ondersteunt

Parakeet v3 ondersteunt 25 talen: Bulgaars, Deens, Duits, Engels, Ests, Fins, Frans, Grieks, Hongaars, Italiaans, Kroatisch, Lets, Litouws, Maltees, Nederlands, Oekraïens, Pools, Portugees, Roemeens, Russisch, Slowaaks, Sloveens, Spaans, Tsjechisch en Zweeds.

Dat dekt het grootste deel van Europa, maar Chinese, Japanse, Koreaanse, Arabische en Hindi worden niet ondersteund. Daarom hebben we de Whisper-modellen als downloadbare opties behouden. Als je dicteert in het Japans of Mandarijn, kies dan Whisper Large V3 Turbo in de modelkiezer. Voor Engels en Europese talen is Parakeet v3 simpelweg de betere engine.

Whisper Notes Mac modelkiezer met Parakeet V3 als standaard, en Whisper Small en Whisper Large V3 Turbo als downloadbare opties

Modelkiezer: Parakeet V3 (standaard), Whisper Small en Whisper Large V3 Turbo — allemaal lokaal draaiend

Modelkiezer in Whisper Notes

Open Instellingen om tussen modellen te wisselen:

  • Parakeet V3 (standaard) — Snelste, beste keuze voor Engels en Europese talen
  • Whisper Small — Lichtgewicht, meer dan 100 talen
  • Whisper Large V3 Turbo — Meest nauwkeurige meertalige model

Alle modellen draaien 100% lokaal op je Mac. Geen internet, geen cloud, geen data verlaat je apparaat.

Hoe zit het met Parakeet V2?

Als je V2 gebruikte, vraag je je misschien af hoe het zich verhoudt. V2 was een puur Engels model — en de Engelse nauwkeurigheid is zelfs iets beter dan V3 (WER 6,05 % vs 6,32 %). V3 ruilt dat kleine verschil in voor ondersteuning van 25 talen. Beide zijn aanzienlijk nauwkeuriger dan Whisper.

Parakeet V2 Parakeet V3 Whisper Large V3
Engelse WER 6.05% 6.32% 7.44%
Talen Alleen Engels 25 100+

Kort gezegd: als je alleen Engels nodig hebt, zijn V2 en V3 allebei uitstekend. V3 is standaard in Whisper Notes omdat meertaligheid voor de meeste gebruikers belangrijk is — en het verschil in Engelse nauwkeurigheid is verwaarloosbaar.

Probeer het

Parakeet v3 is nu beschikbaar in de Mac-versie — download gewoon de nieuwste DMG. (Update: Parakeet is nu ook beschikbaar in de nieuwste iOS-versie.)

Vragen of feedback? Mail naar support@whispernotes.app.