Whisper prepis: kompletný sprievodca prevodom reči na text (2026)

2. júla 2026
·
9 min read
·Whisper Notes Team

Whisper prepis znamená prevod reči na text pomocou modelu Whisper od OpenAI — open-source AI modelu, ktorý môžete spustiť v cloude, na serveri alebo úplne na vlastnom zariadení. Tento sprievodca vysvetľuje, ako Whisper funguje, ktorú veľkosť modelu si vybrať, aký presný v skutočnosti je a ako ho najrýchlejšie spustiť offline na Macu alebo iPhone.

Čo je vlastne Whisper?

Whisper je model automatického rozpoznávania reči (ASR), ktorý OpenAI vydala v septembri 2022 pod licenciou MIT. Ide o encoder-decoder transformer natrénovaný na viac ako 680 000 hodinách viacjazyčného zvuku a zvláda prepis približne v 100 jazykoch plus preklad do angličtiny.

Podstatné pre vás: váhy modelu sú otvorené. Na rozdiel od rečových API od Googlu či Amazonu nemusí Whisper bežať na cudzom serveri. Existuje celý ekosystém na jeho lokálne spustenie — whisper.cpp, faster-whisper a natívne aplikácie ako Whisper Notes. Práve to umožňuje skutočne offline a súkromný prepis.

Veľkosti modelu Whisper: ktorú použiť

Whisper existuje v šiestich hlavných veľkostiach. Väčší znamená presnejší a pomalší:

Model Parametre Rýchlosť Najlepší pre
tiny 39M Najrýchlejší Rýchle koncepty, slabší hardvér
base 74M Veľmi rýchly Jednoduchý, čistý zvuk
small 244M Rýchly Dobrý pomer rýchlosti a presnosti na mobile
medium 769M Stredná Dnes už len zriedka správna voľba
large-v3 1.55B Najpomalší Maximálna presnosť, náročný zvuk
large-v3-turbo 809M ~5x rýchlejší než large-v3 Predvolená voľba v roku 2026

Pre takmer každého je odpoveďou large-v3-turbo: zachováva encoder z large-v3, ale znižuje počet dekódovacích vrstiev z 32 na 4, čím dosahuje takmer rovnakú presnosť pri zlomku výpočtového výkonu. Podrobne sme ho zmerali v článku Whisper Large V3 Turbo vs V3.

Aký presný je Whisper prepis?

Na čistom anglickom zvuku dosahujú veľké modely chybovosť slov (WER) približne 5–8 % — na väčšinu praktických účelov porovnateľnú s profesionálnym ľudským prepisom. Presnosť klesá pri hluku v pozadí, výrazných prízvukoch, prekrývajúcej sa reči a jazykoch s malým množstvom dát.

Jedna známa slabina Whisperu: halucinácie počas ticha. Jeho autoregresívny dekóder si niekedy vymýšľa opakované frázy alebo titulkové kredity, keď nikto nehovorí. Novšie modely to riešia — Parakeet V3 od NVIDIA bol výslovne trénovaný aj na zvuku bez reči a v našich testoch nevytvára žiadne halucinácie (kompletný benchmark Parakeet V3 vs Whisper).

Pre čínštinu, japončinu, kórejčinu a kantončinu poráža Whisper špecializovaný model v rýchlosti aj interpunkcii: pozrite si SenseVoice vs Whisper pre jazyky CJK.

5 spôsobov, ako spustiť Whisper prepis

Metóda Cena Súkromie Nastavenie
OpenAI API Platba za minútu zvuku Zvuk sa nahráva na server API kľúč + kód
openai-whisper (referenčný Python) Zadarmo 100 % lokálne Python prostredie, odporúčané GPU
whisper.cpp / faster-whisper Zadarmo 100 % lokálne Príkazový riadok
Natívna aplikácia (Whisper Notes) $6.99 jednorazovo, bezplatná skúšobná verzia na Macu 100 % na zariadení Žiadne
Webové demo nástroje Bezplatné úrovne Zvuk sa nahráva na server Žiadne

Zlaté pravidlo: ak žijete v termináli, faster-whisper je vynikajúci. Ak staviate produkt, dáva zmysel API. Ak chcete len súkromne prepísať svoje nahrávky bez dotyku s Pythonom, použite natívnu aplikáciu — presne preto existujú Whisper aplikácie pre Mac.

Zvažujete offline nástroje v širšom zábere — vrátane možností pre Windows a Android? Pozrite si nášho kompletného sprievodcu offline prevodom reči na text.

Whisper vs novšie lokálne modely (2026)

Whisper odštartoval éru lokálneho prepisu, ale už nie je sám. Rýchlosti nižšie boli merané na Macu s M4 Pro:

Model Jazyky Rýchlosť Silná stránka
Whisper Large V3 Turbo 100+ ~12x realtime Najširšie jazykové pokrytie
Parakeet V3 25 (európske) ~100x realtime 6,32 % WER, žiadne halucinácie počas ticha
SenseVoice Small zh, ja, ko, yue, en ~52x realtime Najlepší pre čínštinu, japončinu, kórejčinu

Všetky tri bežia lokálne vo Whisper Notes a pri každej nahrávke ich môžete prepínať. Porovnávacie benchmarky nájdete na našej stránke porovnania Whisper modelov.

Ako spustiť Whisper prepis offline na Macu a iPhone

Žiadny príkazový riadok, žiadny Python, žiadny cloud:

  1. Stiahnite si Whisper Notes pre Mac (bezplatná skúšobná verzia) alebo pre iPhone ($6.99 jednorazovo).
  2. Vyberte model: Whisper Large V3 Turbo pre široké jazykové pokrytie, Parakeet V3 pre rýchlosť v angličtine, SenseVoice pre jazyky CJK. Stiahne sa raz a potom funguje navždy offline.
  3. Nahrávajte priamo, diktujte kdekoľvek v systéme podržaním Fn, alebo vložte audio a video súbory (MP3, WAV, M4A, MP4).
  4. Text sa zobrazuje priebežne počas spracovania. Exportujte ako TXT alebo SRT.

Pochybujete o slove „offline“? Najprv zapnite letový režim. Prepis pobeží plnou rýchlosťou — nič sa nikdy nenahráva na server.

Aký presný je Whisper prepis v slovenčine? Ktorý model si vybrať?

Slovenčina patrí medzi 25 európskych jazykov, ktoré pokrýva Parakeet V3 — s chybovosťou v triede 6,32 % WER a približne 10x vyššou rýchlosťou než Whisper. Práve preto je Parakeet V3 predvoleným modelom vo Whisper Notes a pre slovenské nahrávky je najlepšou voľbou. Whisper Large V3 Turbo (100+ jazykov, ~1,5 GB) sa oplatí ako záloha pri veľmi náročnom zvuku alebo pri jazykoch, ktoré Parakeet nepokrýva. Oba modely bežia úplne offline na Macu aj iPhone.

Často kladené otázky

Je Whisper prepis zadarmo?

Samotný model je bezplatný a open source (licencia MIT). Jeho spustenie cez nástroje príkazového riadka ako whisper.cpp nestojí nič, ale vyžaduje nastavenie. API od OpenAI účtuje za minútu zvuku. Natívne aplikácie balia modely za malý poplatok — Whisper Notes stojí $6.99 jednorazovo, s bezplatnou skúšobnou verziou na Macu.

Môže Whisper prepis bežať offline?

Áno — presne to je zmyslom otvorených váh. Keď je súbor modelu vo vašom zariadení, internet už nie je potrebný. Whisper Notes spúšťa Whisper Large V3 Turbo na Apple Silicon cez CoreML/Metal, úplne offline. Overiť si to môžete letovým režimom.

Ktorý Whisper model je najpresnejší?

large-v3 má najlepšiu surovú presnosť. large-v3-turbo sa mu vyrovnáva s rozdielom zlomku percenta WER a beží asi 5x rýchlejšie, preto je dnes vo väčšine nástrojov predvolený.

Podporuje Whisper môj jazyk?

Whisper pokrýva približne 100 jazykov, najsilnejší je v tých s množstvom dát (angličtina, španielčina, nemčina, francúzština atď.). Pre čínštinu, japončinu, kórejčinu a kantončinu ponúka SenseVoice lepšiu interpunkciu a oveľa vyššiu rýchlosť na Apple Silicon.

Existuje aplikácia na Whisper prepis pre iPhone?

Áno. Whisper Notes spúšťa Whisper modely optimalizované pre Neural Engine iPhonu (iPhone 12 a novšie) — nahrávajte, importujte z Diktafónu alebo Súborov a prepisujte úplne na zariadení za $6.99, bez predplatného.