Vanaf versie 1.3.2 wordt Whisper Notes voor Mac geleverd met NVIDIA Parakeet TDT 0.6B als standaard spraakmodel. Het is 10x sneller dan Whisper Large V3 Turbo voor Engels, en nauwkeuriger. Whisper-modellen blijven beschikbaar als je andere talen nodig hebt.
Waarom we het standaardmodel hebben vervangen
Whisper is geweldig, maar het is ontworpen als een alleskunner. Het ondersteunt meer dan 100 talen, vertaalt, genereert timestamps — een echt Zwitsers zakmes. Het nadeel is snelheid. Voor Engels dicteren, waarbij je gewoon snel woorden op je scherm wilt zien, is het overkill.
Wat me echt dwars zat: als ik de systeembrede Fn-toets dicteerfunctie met Whisper gebruikte, moest ik na een opname van ~1 minuut 3–5 seconden wachten voordat de tekst verscheen. Die pauze breekt je flow. Je stopt met praten, je wacht, je staart naar de cursor — het maakt de magie van stemtypen kapot.
Parakeet heeft dat volledig veranderd. Het is zo snel dat de tekst verschijnt op het moment dat je stopt met praten. Je praat, en de woorden zijn er gewoon meteen. Als je dat gevoel eenmaal hebt ervaren — die naadloze, wachtvrije flow — dan is het heel moeilijk om terug te gaan naar Whisper.
Hoe snel is Parakeet V3?
Cijfers zeggen meer dan woorden. Hier is een echte vergelijking met een audiobestand van 35 minuten op dezelfde Mac:
| Model | 35 min. audio |
|---|---|
| Whisper Large V3 Turbo | 3 minuten |
| Parakeet TDT 0.6B v3 | 18 seconden |
Dat is 10x sneller. En omdat het model kleiner is (600M vs. 800M parameters), verbruikt het ook minder geheugen en minder batterij.
Wat Parakeet v3 zo snel maakt
Whisper luistert naar audio zoals je een boek hardop zou voorlezen — woord voor woord, frame voor frame, zonder ooit vooruit te springen. Zelfs tijdens stilte is het aan het verwerken, aan het raden wat er komt. Grondig, maar traag.
Parakeet pakt het fundamenteel anders aan. Het comprimeert het audiosignaal 8x voordat het wordt verwerkt, zodat het model alleen ziet wat er toe doet. Vervolgens, in plaats van elk frame door te ploegen, voorspelt het niet alleen welk woord je zei, maar ook hoe lang dat woord duurt — en springt vooruit. Stilte? Helemaal overgeslagen. Een lange klinker? Eén voorspelling in plaats van tientallen.
Het resultaat is een model dat spraak verwerkt zoals je brein dat doet — focussen op de woorden, de stiltes negeren. Daarom is het 10x sneller met minder parameters en hogere nauwkeurigheid.
Benchmarks: Parakeet v3 vs. Whisper
Parakeet v3 evenaart of verslaat modellen die 2-4x zo groot zijn op FLEURS-, CoVoST- en MLS-benchmarks
Op het Hugging Face Open ASR Leaderboard staat Parakeet v3 bovenaan met slechts 600M parameters — minder dan de helft van Whisper Large V3's 1,55B:
| Model | Parameters | Gem. WER | Snelheid (RTFx) |
|---|---|---|---|
| Parakeet TDT 0.6B v3 | 0.6B | 6.32% | 3,333x |
| Canary 1B v2 | 1.0B | 7.15% | 749x |
| Whisper Large V3 | 1.55B | 7.44% | 146x |
| Whisper Large V3 Turbo | 0.8B | 7.6% | 350x |
Lagere WER = minder fouten. Hogere RTFx = sneller. Parakeet wint op beide vlakken. Met 600M parameters is het ook het kleinste model in de lijst — wat betekent dat het prachtig draait op Apple Silicon met minimaal geheugen- en batterijverbruik.
Geen hallucinaties meer
Als je Whisper voor dicteren hebt gebruikt, heb je het waarschijnlijk wel eens zien hallucineren tijdens stilte — zinnen herhalen, woorden verzinnen, of uit het niets "Subtitles by Amara.org" uitspugen. Dit gebeurt omdat Whispers autoregressieve decoder altijd verwacht tekst te produceren, zelfs als er niets te transcriberen valt.
NVIDIA heeft Parakeet getraind op 36.000 uur puur niet-spraak audio (achtergrondgeluid, hoesten, stilte) gekoppeld aan lege string-targets. Het model heeft geleerd hoe stilte klinkt en houdt zijn mond. Voor systeembreed dicteren dat altijd aan staat, is dit een gamechanger — geen rommel-tekst meer als je even nadenkt.
Welke talen Parakeet ondersteunt
Parakeet v3 ondersteunt 25 talen: Bulgaars, Deens, Duits, Engels, Ests, Fins, Frans, Grieks, Hongaars, Italiaans, Kroatisch, Lets, Litouws, Maltees, Nederlands, Oekraïens, Pools, Portugees, Roemeens, Russisch, Slowaaks, Sloveens, Spaans, Tsjechisch en Zweeds.
Dat dekt het grootste deel van Europa, maar Chinese, Japanse, Koreaanse, Arabische en Hindi worden niet ondersteund. Daarom hebben we de Whisper-modellen als downloadbare opties behouden. Als je dicteert in het Japans of Mandarijn, kies dan Whisper Large V3 Turbo in de modelkiezer. Voor Engels en Europese talen is Parakeet v3 simpelweg de betere engine.
Modelkiezer: Parakeet V3 (standaard), Whisper Small en Whisper Large V3 Turbo — allemaal lokaal draaiend
Modelkiezer in Whisper Notes
Open Instellingen om tussen modellen te wisselen:
- Parakeet V3 (standaard) — Snelste, beste keuze voor Engels en Europese talen
- Whisper Small — Lichtgewicht, meer dan 100 talen
- Whisper Large V3 Turbo — Meest nauwkeurige meertalige model
Alle modellen draaien 100% lokaal op je Mac. Geen internet, geen cloud, geen data verlaat je apparaat.
Probeer het
Parakeet v3 is nu beschikbaar in de Mac-versie — download gewoon de nieuwste DMG. Als de feedback positief is, brengen we Parakeet in een toekomstige update ook naar de iOS-versie.
Vragen of feedback? Mail naar support@whispernotes.app.