Přepis Whisper znamená převod řeči na text pomocí Whisperu od OpenAI — open-source AI modelu, který můžete spustit v cloudu, na serveru, nebo zcela na vlastním zařízení. Tento průvodce vysvětluje, jak Whisper funguje, kterou velikost modelu zvolit, jak přesný ve skutečnosti je a jak jej nejrychleji spustit offline na Macu nebo iPhonu.
Co přesně je Whisper?
Whisper je model automatického rozpoznávání řeči (ASR), který OpenAI vydala v září 2022 pod licencí MIT. Jde o transformer typu encoder-decoder natrénovaný na více než 680 000 hodinách vícejazyčného audia; zvládá přepis zhruba ve 100 jazycích a překlad do angličtiny.
Podstatné pro vás je toto: váhy modelu jsou otevřené. Na rozdíl od hlasových API Googlu nebo Amazonu nemusí Whisper běžet na cizím serveru. Existuje celý ekosystém pro jeho lokální provoz — whisper.cpp, faster-whisper a nativní aplikace jako Whisper Notes. Právě to umožňuje skutečně offline a soukromý přepis.
Velikosti modelu Whisper: kterou zvolit
Whisper existuje v šesti hlavních velikostech. Větší znamená přesnější a pomalejší:
| Model | Parametry | Rychlost | Nejlepší pro |
|---|---|---|---|
| tiny | 39M | Nejrychlejší | Rychlé koncepty, slabší hardware |
| base | 74M | Velmi rychlý | Jednoduché, čisté nahrávky |
| small | 244M | Rychlý | Dobrý poměr rychlosti a přesnosti na mobilu |
| medium | 769M | Střední | Dnes už jen zřídka správná volba |
| large-v3 | 1.55B | Nejpomalejší | Maximální přesnost, náročné audio |
| large-v3-turbo | 809M | ~5x rychlejší než large-v3 | Výchozí volba v roce 2026 |
Pro téměř každého je odpovědí large-v3-turbo: zachovává encoder z large-v3, ale snižuje počet vrstev decoderu z 32 na 4, takže nabízí téměř totožnou přesnost při zlomku výpočetního výkonu. Podrobné benchmarky najdete v článku Whisper Large V3 Turbo vs V3.
Jak přesný je přepis Whisper?
Na čistém anglickém audiu dosahují velké modely chybovosti slov (WER) zhruba 5-8 % — pro většinu praktických účelů srovnatelné s profesionálním lidským přepisem. Přesnost klesá s hlukem na pozadí, silnými přízvuky, překrývajícími se hlasy a jazyky s malým množstvím dat.
Nejznámější slabina Whisperu: halucinace během ticha. Jeho autoregresivní decoder si občas vymýšlí opakované fráze nebo titulkové kredity, když nikdo nemluví. Novější modely to řeší — Parakeet V3 od NVIDIA byl cíleně trénován na audiu bez řeči a v našich testech neprodukuje žádné halucinace (kompletní benchmark Parakeet V3 vs Whisper).
Pro čínštinu, japonštinu, korejštinu a kantonštinu poráží Whisper specializovaný model, a to v rychlosti i interpunkci: viz SenseVoice vs Whisper pro jazyky CJK.
5 způsobů, jak spustit přepis Whisper
| Metoda | Cena | Soukromí | Nastavení |
|---|---|---|---|
| API OpenAI | Platba za minutu audia | Audio se nahrává na server | API klíč + kód |
| openai-whisper (referenční Python) | Zdarma | 100% lokálně | Prostředí Pythonu, doporučeno GPU |
| whisper.cpp / faster-whisper | Zdarma | 100% lokálně | Příkazová řádka |
| Nativní aplikace (Whisper Notes) | $6.99 jednorázově, zkušební verze na Macu zdarma | 100% na zařízení | Žádné |
| Webové demo nástroje | Bezplatné tarify | Audio se nahrává na server | Žádné |
Praktické pravidlo: pokud žijete v terminálu, faster-whisper je skvělý. Pokud stavíte produkt, dává smysl API. Pokud chcete jen soukromě přepsat své nahrávky, aniž byste sahali na Python, použijte nativní aplikaci — přesně proto aplikace Whisper pro Mac existují.
Chcete offline nástroje porovnat šířeji — včetně možností pro Windows a Android? Podívejte se na našeho kompletního průvodce offline převodem řeči na text.
Whisper vs. novější lokální modely (2026)
Whisper odstartoval éru lokálního přepisu, ale už není sám. Rychlosti níže byly naměřeny na Macu s M4 Pro:
| Model | Jazyky | Rychlost | Silná stránka |
|---|---|---|---|
| Whisper Large V3 Turbo | 100+ | ~12x reálný čas | Nejširší jazykové pokrytí |
| Parakeet V3 | 25 (evropské) | ~100x reálný čas | 6,32 % WER, žádné halucinace při tichu |
| SenseVoice Small | zh, ja, ko, yue, en | ~52x reálný čas | Nejlepší pro čínštinu, japonštinu, korejštinu |
Všechny tři běží lokálně ve Whisper Notes a lze je přepínat u každé nahrávky. Srovnávací benchmarky najdete na naší stránce porovnání modelů Whisper.
Jak spustit přepis Whisper offline na Macu a iPhonu
Bez příkazové řádky, bez Pythonu, bez cloudu:
- Stáhněte si Whisper Notes pro Mac (zkušební verze zdarma) nebo pro iPhone ($6.99 jednorázově).
- Zvolte model: Whisper Large V3 Turbo pro široké jazykové pokrytí, Parakeet V3 pro rychlost v angličtině, SenseVoice pro CJK. Stáhne se jednou a pak funguje offline napořád.
- Nahrávejte přímo, diktujte kdekoli v systému podržením klávesy Fn, nebo přetáhněte audio a video soubory (MP3, WAV, M4A, MP4).
- Text naskakuje průběžně během zpracování. Exportujte jako TXT nebo SRT.
Nevěříte tomu "offline"? Nejdřív zapněte režim letadla. Přepis poběží plnou rychlostí — nic se nikam neodesílá, nikdy.
Jak přesný je přepis Whisper v češtině? Který model zvolit?
Pro české audio zní krátká odpověď: Parakeet V3 — výchozí model Whisper Notes na Macu i iPhonu. Pokrývá 25 evropských jazyků včetně češtiny, přepisuje s přesností ve třídě 6,32 % WER a běží zhruba 10x rychleji než Whisper — hodinová nahrávka v češtině je textem za pár minut, celá na vašem zařízení. Pokud vaše nahrávky obsahují jazyky mimo seznam Parakeetu, přepněte na Whisper Large V3 Turbo (~1,5 GB, přes 100 jazyků); model lze měnit u každé nahrávky.
Časté dotazy
Je přepis Whisper zdarma?
Samotný model je zdarma a open source (licence MIT). Provoz přes nástroje příkazové řádky jako whisper.cpp nic nestojí, ale vyžaduje nastavení. API OpenAI účtuje za minutu audia. Nativní aplikace balí modely za malý poplatek — Whisper Notes stojí $6.99 jednorázově, se zkušební verzí na Macu zdarma.
Může přepis Whisper běžet offline?
Ano — v tom je smysl otevřených vah. Jakmile je soubor modelu na vašem zařízení, internet není potřeba. Whisper Notes spouští Whisper Large V3 Turbo na Apple Silicon přes CoreML/Metal, zcela offline. Ověřit si to můžete v režimu letadla.
Který model Whisper je nejpřesnější?
Nejlepší hrubou přesnost má large-v3. large-v3-turbo se mu vyrovnává s rozdílem zlomku procentního bodu WER a běží přitom asi 5x rychleji — proto je dnes ve většině nástrojů výchozí volbou.
Podporuje Whisper můj jazyk?
Whisper pokrývá zhruba 100 jazyků, nejsilnější je v těch s velkým množstvím dat (angličtina, španělština, němčina, francouzština atd.). Pro čínštinu, japonštinu, korejštinu a kantonštinu nabízí SenseVoice lepší interpunkci a mnohem vyšší rychlost na Apple Silicon.
Existuje aplikace pro přepis Whisper na iPhone?
Ano. Whisper Notes spouští modely Whisper optimalizované pro Neural Engine iPhonu (iPhone 12 a novější) — nahrávejte, importujte z Diktafonu nebo aplikace Soubory a přepisujte zcela na zařízení za $6.99, bez předplatného.