Parakeet V3 je teraz predvolený engine na Mac — 10x rýchlejší ako Whisper

7. marca 2026
·
6 min read
·Whisper Notes Team

Od verzie 1.3.2 používa Whisper Notes pre Mac ako predvolený engine rozpoznávania reči NVIDIA Parakeet TDT 0.6B. Je 10x rýchlejší ako Whisper Large V3 Turbo pre angličtinu a navyše presnejší. Modely Whisper sú stále dostupné, ak potrebuješ iné jazyky.

Prečo sme zmenili predvolený model

Whisper je skvelý, ale bol navrhnutý ako univerzálny nástroj. Zvláda 100+ jazykov, prekladá, generuje časové značky — taký švajčiarsky nožík. Daňou za to je rýchlosť. Na diktovanie v angličtine, keď jednoducho chceš slová na obrazovke čo najrýchlejšie, je to zbytočne veľa.

Toto ma štvalo: pri používaní systémového diktovania cez Fn s Whisperom som po asi minútovom úseku čakal 3–5 sekúnd, kým sa objavil prepis. Tá pauza rozbíja flow. Prestaneš hovoriť, čakáš, pozeráš na kurzor — a kúzlo hlasového písania je preč.

Parakeet to úplne zmenil. Rýchlosť je taká vysoká, že prepis sa objaví v momente, keď prestaneš hovoriť. Hovoríš a slová tam jednoducho . Keď raz zažiješ ten pocit — plynulý, okamžitý tok bez čakania — vrátiť sa na Whisper je naozaj ťažké.

Aký rýchly je Parakeet V3?

Čísla hovoria za všetko. Tu je reálne porovnanie na 35-minútovom audio súbore na tom istom Macu:

Model 35 min audio
Whisper Large V3 Turbo 3 minúty
Parakeet TDT 0.6B v3 18 sekúnd

10x rýchlejšie. A keďže model je menší (600M vs. 800M parametrov), spotrebuje aj menej pamäte a batérie.

Čím je Parakeet v3 taký rýchly

Whisper spracováva audio rovnako, ako by si čítal knihu nahlas — slovo po slove, snímok po snímku, nikdy nepredbieha. Aj počas ticha stále spracováva a háda, čo príde ďalej. Je to dôkladné, ale pomalé.

Parakeet má zásadne odlišný prístup. Pred spracovaním skomprimuje audio signál 8x, takže model vidí len to podstatné. Potom, namiesto toho aby drvil každý jeden snímok, predpovedá nielen aké slovo si povedal, ale aj ako dlho to slovo trvá — a preskočí dopredu. Ticho? Preskočené. Dlhá samohláska? Jedna predikcia namiesto desiatok.

Výsledkom je model, ktorý spracováva reč tak, ako to robí tvoj mozog — sústreďuje sa na slová a ignoruje medzery. Preto je 10x rýchlejší s menším počtom parametrov a vyššou presnosťou.

Benchmarky: Parakeet v3 vs. Whisper

Porovnanie Word Error Rate: Parakeet TDT 0.6B v3 vs. Whisper Large V3 a Seamless M4T na viacerých benchmarkových datasetoch

Parakeet v3 vyrovná alebo prekoná modely 2–4x väčšie na benchmarkoch FLEURS, CoVoST a MLS

Na Hugging Face Open ASR Leaderboard vedie Parakeet v3 rebríček s iba 600M parametrami — to je menej ako polovica z 1.55B u Whisper Large V3:

Model Parametre Priemerný WER Rýchlosť (RTFx)
Parakeet TDT 0.6B v3 0.6B 6.32% 3,333x
Canary 1B v2 1.0B 7.15% 749x
Whisper Large V3 1.55B 7.44% 146x
Whisper Large V3 Turbo 0.8B 7.6% 350x

Nižší WER = menej chýb. Vyšší RTFx = rýchlejšie. Parakeet vyhráva v oboch. S 600M parametrami je to navyše najmenší model v celom zozname — čo znamená, že na Apple Silicon beží krásne s minimálnou spotrebou pamäte a batérie.

Žiadne halucinácie

Ak si Whisper používal na diktovanie, pravdepodobne si videl, ako počas ticha halucinuje — opakuje frázy, vymýšľa slová alebo odniekiaľ vypľuje „Subtitles by Amara.org". Deje sa to preto, lebo autoregresívny dekodér Whisperu vždy očakáva, že vygeneruje text, aj keď nie je čo prepisovať.

NVIDIA natrénovala Parakeet na 36 000 hodinách čisto nerečového audia (šum na pozadí, kašľanie, ticho) s prázdnymi reťazcami ako cieľovým textom. Model sa naučil rozpoznať ticho a mlčať. Pre režim stáleho systémového diktovania je to zásadná zmena — žiaden nezmyselný text, keď sa zastavíš a premýšľaš.

Aké jazyky Parakeet podporuje

Parakeet v3 podporuje 25 jazykov: bulharčinu, chorvátčinu, češtinu, dánčinu, holandčinu, angličtinu, estónčinu, fínčinu, francúzštinu, nemčinu, gréčtinu, maďarčinu, taliančinu, lotyštinu, litovčinu, maltčinu, poľštinu, portugalčinu, rumunčinu, ruštinu, slovenčinu, slovinčinu, španielčinu, švédčinu a ukrajinčinu.

To pokrýva väčšinu Európy, ale nepodporuje čínštinu, japončinu, kórejčinu, arabčinu ani hindčinu. Preto sme modely Whisper nechali ako voliteľné na stiahnutie. Ak diktuješ v japončine alebo mandarínčine, vyber si Whisper Large V3 Turbo v prepínači modelov. Pre angličtinu a európske jazyky je Parakeet v3 jednoducho lepší engine.

Prepínač modelov vo Whisper Notes pre Mac: Parakeet V3 ako predvolený, Whisper Small a Whisper Large V3 Turbo na stiahnutie

Prepínač modelov: Parakeet V3 (predvolený), Whisper Small a Whisper Large V3 Turbo — všetko beží lokálne

Prepínač modelov vo Whisper Notes

Otvor Nastavenia a prepínaj medzi modelmi:

  • Parakeet V3 (predvolený) — Najrýchlejší, najlepšia voľba pre angličtinu a európske jazyky
  • Whisper Small — Ľahký, 100+ jazykov
  • Whisper Large V3 Turbo — Najpresnejší viacjazyčný model

Všetky modely bežia na 100 % lokálne na tvojom Macu. Bez internetu, bez cloudu, žiadne dáta neopúšťajú tvoje zariadenie.

Vyskúšaj to

Parakeet v3 je dostupný hneď teraz vo verzii pre Mac — stačí stiahnuť najnovší DMG. Ak budú ohlasy pozitívne, prinesieme Parakeet aj do iOS verzie v niektorom z budúcich updateov.

Otázky alebo spätná väzba? Napíš na support@whispernotes.app.