Whisper prepis znamená prevod reči na text pomocou modelu Whisper od OpenAI — open-source AI modelu, ktorý môžete spustiť v cloude, na serveri alebo úplne na vlastnom zariadení. Tento sprievodca vysvetľuje, ako Whisper funguje, ktorú veľkosť modelu si vybrať, aký presný v skutočnosti je a ako ho najrýchlejšie spustiť offline na Macu alebo iPhone.
Čo je vlastne Whisper?
Whisper je model automatického rozpoznávania reči (ASR), ktorý OpenAI vydala v septembri 2022 pod licenciou MIT. Ide o encoder-decoder transformer natrénovaný na viac ako 680 000 hodinách viacjazyčného zvuku a zvláda prepis približne v 100 jazykoch plus preklad do angličtiny.
Podstatné pre vás: váhy modelu sú otvorené. Na rozdiel od rečových API od Googlu či Amazonu nemusí Whisper bežať na cudzom serveri. Existuje celý ekosystém na jeho lokálne spustenie — whisper.cpp, faster-whisper a natívne aplikácie ako Whisper Notes. Práve to umožňuje skutočne offline a súkromný prepis.
Veľkosti modelu Whisper: ktorú použiť
Whisper existuje v šiestich hlavných veľkostiach. Väčší znamená presnejší a pomalší:
| Model | Parametre | Rýchlosť | Najlepší pre |
|---|---|---|---|
| tiny | 39M | Najrýchlejší | Rýchle koncepty, slabší hardvér |
| base | 74M | Veľmi rýchly | Jednoduchý, čistý zvuk |
| small | 244M | Rýchly | Dobrý pomer rýchlosti a presnosti na mobile |
| medium | 769M | Stredná | Dnes už len zriedka správna voľba |
| large-v3 | 1.55B | Najpomalší | Maximálna presnosť, náročný zvuk |
| large-v3-turbo | 809M | ~5x rýchlejší než large-v3 | Predvolená voľba v roku 2026 |
Pre takmer každého je odpoveďou large-v3-turbo: zachováva encoder z large-v3, ale znižuje počet dekódovacích vrstiev z 32 na 4, čím dosahuje takmer rovnakú presnosť pri zlomku výpočtového výkonu. Podrobne sme ho zmerali v článku Whisper Large V3 Turbo vs V3.
Aký presný je Whisper prepis?
Na čistom anglickom zvuku dosahujú veľké modely chybovosť slov (WER) približne 5–8 % — na väčšinu praktických účelov porovnateľnú s profesionálnym ľudským prepisom. Presnosť klesá pri hluku v pozadí, výrazných prízvukoch, prekrývajúcej sa reči a jazykoch s malým množstvom dát.
Jedna známa slabina Whisperu: halucinácie počas ticha. Jeho autoregresívny dekóder si niekedy vymýšľa opakované frázy alebo titulkové kredity, keď nikto nehovorí. Novšie modely to riešia — Parakeet V3 od NVIDIA bol výslovne trénovaný aj na zvuku bez reči a v našich testoch nevytvára žiadne halucinácie (kompletný benchmark Parakeet V3 vs Whisper).
Pre čínštinu, japončinu, kórejčinu a kantončinu poráža Whisper špecializovaný model v rýchlosti aj interpunkcii: pozrite si SenseVoice vs Whisper pre jazyky CJK.
5 spôsobov, ako spustiť Whisper prepis
| Metóda | Cena | Súkromie | Nastavenie |
|---|---|---|---|
| OpenAI API | Platba za minútu zvuku | Zvuk sa nahráva na server | API kľúč + kód |
| openai-whisper (referenčný Python) | Zadarmo | 100 % lokálne | Python prostredie, odporúčané GPU |
| whisper.cpp / faster-whisper | Zadarmo | 100 % lokálne | Príkazový riadok |
| Natívna aplikácia (Whisper Notes) | $6.99 jednorazovo, bezplatná skúšobná verzia na Macu | 100 % na zariadení | Žiadne |
| Webové demo nástroje | Bezplatné úrovne | Zvuk sa nahráva na server | Žiadne |
Zlaté pravidlo: ak žijete v termináli, faster-whisper je vynikajúci. Ak staviate produkt, dáva zmysel API. Ak chcete len súkromne prepísať svoje nahrávky bez dotyku s Pythonom, použite natívnu aplikáciu — presne preto existujú Whisper aplikácie pre Mac.
Zvažujete offline nástroje v širšom zábere — vrátane možností pre Windows a Android? Pozrite si nášho kompletného sprievodcu offline prevodom reči na text.
Whisper vs novšie lokálne modely (2026)
Whisper odštartoval éru lokálneho prepisu, ale už nie je sám. Rýchlosti nižšie boli merané na Macu s M4 Pro:
| Model | Jazyky | Rýchlosť | Silná stránka |
|---|---|---|---|
| Whisper Large V3 Turbo | 100+ | ~12x realtime | Najširšie jazykové pokrytie |
| Parakeet V3 | 25 (európske) | ~100x realtime | 6,32 % WER, žiadne halucinácie počas ticha |
| SenseVoice Small | zh, ja, ko, yue, en | ~52x realtime | Najlepší pre čínštinu, japončinu, kórejčinu |
Všetky tri bežia lokálne vo Whisper Notes a pri každej nahrávke ich môžete prepínať. Porovnávacie benchmarky nájdete na našej stránke porovnania Whisper modelov.
Ako spustiť Whisper prepis offline na Macu a iPhone
Žiadny príkazový riadok, žiadny Python, žiadny cloud:
- Stiahnite si Whisper Notes pre Mac (bezplatná skúšobná verzia) alebo pre iPhone ($6.99 jednorazovo).
- Vyberte model: Whisper Large V3 Turbo pre široké jazykové pokrytie, Parakeet V3 pre rýchlosť v angličtine, SenseVoice pre jazyky CJK. Stiahne sa raz a potom funguje navždy offline.
- Nahrávajte priamo, diktujte kdekoľvek v systéme podržaním Fn, alebo vložte audio a video súbory (MP3, WAV, M4A, MP4).
- Text sa zobrazuje priebežne počas spracovania. Exportujte ako TXT alebo SRT.
Pochybujete o slove „offline“? Najprv zapnite letový režim. Prepis pobeží plnou rýchlosťou — nič sa nikdy nenahráva na server.
Aký presný je Whisper prepis v slovenčine? Ktorý model si vybrať?
Slovenčina patrí medzi 25 európskych jazykov, ktoré pokrýva Parakeet V3 — s chybovosťou v triede 6,32 % WER a približne 10x vyššou rýchlosťou než Whisper. Práve preto je Parakeet V3 predvoleným modelom vo Whisper Notes a pre slovenské nahrávky je najlepšou voľbou. Whisper Large V3 Turbo (100+ jazykov, ~1,5 GB) sa oplatí ako záloha pri veľmi náročnom zvuku alebo pri jazykoch, ktoré Parakeet nepokrýva. Oba modely bežia úplne offline na Macu aj iPhone.
Často kladené otázky
Je Whisper prepis zadarmo?
Samotný model je bezplatný a open source (licencia MIT). Jeho spustenie cez nástroje príkazového riadka ako whisper.cpp nestojí nič, ale vyžaduje nastavenie. API od OpenAI účtuje za minútu zvuku. Natívne aplikácie balia modely za malý poplatok — Whisper Notes stojí $6.99 jednorazovo, s bezplatnou skúšobnou verziou na Macu.
Môže Whisper prepis bežať offline?
Áno — presne to je zmyslom otvorených váh. Keď je súbor modelu vo vašom zariadení, internet už nie je potrebný. Whisper Notes spúšťa Whisper Large V3 Turbo na Apple Silicon cez CoreML/Metal, úplne offline. Overiť si to môžete letovým režimom.
Ktorý Whisper model je najpresnejší?
large-v3 má najlepšiu surovú presnosť. large-v3-turbo sa mu vyrovnáva s rozdielom zlomku percenta WER a beží asi 5x rýchlejšie, preto je dnes vo väčšine nástrojov predvolený.
Podporuje Whisper môj jazyk?
Whisper pokrýva približne 100 jazykov, najsilnejší je v tých s množstvom dát (angličtina, španielčina, nemčina, francúzština atď.). Pre čínštinu, japončinu, kórejčinu a kantončinu ponúka SenseVoice lepšiu interpunkciu a oveľa vyššiu rýchlosť na Apple Silicon.
Existuje aplikácia na Whisper prepis pre iPhone?
Áno. Whisper Notes spúšťa Whisper modely optimalizované pre Neural Engine iPhonu (iPhone 12 a novšie) — nahrávajte, importujte z Diktafónu alebo Súborov a prepisujte úplne na zariadení za $6.99, bez predplatného.