Whisper transcriptie: de complete gids — API, apps & offline (2026)

2 juli 2026
·
9 min read
·Whisper Notes Team

Whisper transcriptie betekent spraak omzetten naar tekst met Whisper van OpenAI — een open-source AI-model dat je in de cloud, op een server of volledig op je eigen apparaat kunt draaien. In deze gids lees je hoe Whisper werkt, welke modelgrootte je kiest, hoe nauwkeurig het echt is, en wat de snelste manier is om het offline te draaien op een Mac of iPhone.

Wat is Whisper precies?

Whisper is een automatisch spraakherkenningsmodel (ASR) dat OpenAI in september 2022 uitbracht onder de MIT-licentie. Het is een encoder-decoder-transformer, getraind op meer dan 680.000 uur meertalige audio, en het kan transcriberen in ongeveer 100 talen — Nederlands incluis — plus vertalen naar het Engels.

Het deel dat voor jou telt: de modelgewichten zijn open. Anders dan de spraak-API's van Google of Amazon hoeft Whisper niet op andermans server te draaien. Er bestaat een compleet ecosysteem om het lokaal te draaien — whisper.cpp, faster-whisper, en native apps zoals Whisper Notes. Dat is wat écht offline, privé transcriberen mogelijk maakt.

Whisper-modelgroottes: welke moet je kiezen?

Whisper is er in zes hoofdformaten. Groter betekent nauwkeuriger én langzamer:

Model Parameters Snelheid Beste voor
tiny 39M Snelst Snelle concepten, zwakke hardware
base 74M Zeer snel Eenvoudige, schone audio
small 244M Snel Goede balans snelheid/nauwkeurigheid op mobiel
medium 769M Gemiddeld Tegenwoordig zelden de juiste keuze
large-v3 1,55B Langzaamst Maximale nauwkeurigheid, lastige audio
large-v3-turbo 809M ~5x sneller dan large-v3 De standaardkeuze in 2026

Voor bijna iedereen is large-v3-turbo het antwoord: het behoudt de encoder van large-v3 maar reduceert de decoderlagen van 32 naar 4, met vrijwel identieke nauwkeurigheid tegen een fractie van de rekenkracht. We hebben het uitgebreid gebenchmarkt in Whisper Large V3 Turbo vs V3.

Hoe nauwkeurig is Whisper transcriptie?

Op schone Engelse audio halen de grote modellen een woordfoutpercentage (WER) van ongeveer 5-8% — voor de meeste praktische doeleinden vergelijkbaar met professionele menselijke transcriptie. De nauwkeurigheid daalt bij achtergrondgeluid, zware accenten, door elkaar pratende mensen en talen met weinig trainingsdata.

Whisper heeft één berucht zwak punt: hallucinaties tijdens stilte. De autoregressieve decoder verzint soms herhaalde zinnen of ondertitelcredits wanneer niemand spreekt. Nieuwere modellen lossen dit op — NVIDIA's Parakeet V3 is expliciet getraind op niet-spraakaudio en produceert in onze tests nul hallucinaties (volledige Parakeet V3 vs Whisper benchmark).

Voor Chinees, Japans, Koreaans en Kantonees verslaat een gespecialiseerd model Whisper op zowel snelheid als interpunctie: zie SenseVoice vs Whisper voor CJK-talen.

5 manieren om Whisper transcriptie te gebruiken

Methode Kosten Privacy Installatie
OpenAI API Betalen per audiominuut ($0,006/min) Audio wordt geüpload API-sleutel + code
openai-whisper (referentie-Python) Gratis 100% lokaal Python-omgeving, GPU aanbevolen
whisper.cpp / faster-whisper Gratis 100% lokaal Command line
Native app (Whisper Notes) Eenmalig $6.99, gratis proefperiode op Mac 100% op je apparaat Geen
Webdemo-tools Gratis instapniveaus Audio wordt geüpload Geen

De vuistregel: leef je in een terminal, dan is faster-whisper uitstekend. Bouw je een product, dan is de API logisch. Wil je gewoon je opnames privé getranscribeerd hebben zonder Python aan te raken, gebruik dan een native app — dat is precies waarom Whisper-apps voor Mac bestaan.

Wil je offline tools breder vergelijken — inclusief opties voor Windows en Android? Zie onze complete gids voor offline spraak-naar-tekst.

Whisper vs nieuwere lokale modellen (2026)

Whisper begon het tijdperk van lokale transcriptie, maar staat er niet meer alleen voor. Onderstaande snelheden zijn gemeten op een M4 Pro Mac:

Model Talen Snelheid Sterkste punt
Whisper Large V3 Turbo 100+ ~12x realtime Breedste taaldekking
Parakeet V3 25 (Europees, incl. Nederlands) ~100x realtime 6,32% WER, geen hallucinaties bij stilte
SenseVoice Small zh, ja, ko, yue, en ~52x realtime Beste voor Chinees, Japans, Koreaans

Alle drie draaien lokaal in Whisper Notes, en je kunt per opname wisselen. Uitgebreide benchmarks naast elkaar vind je op onze vergelijkingspagina van Whisper-modellen.

Whisper transcriptie offline gebruiken op Mac & iPhone

Geen command line, geen Python, geen cloud:

  1. Download Whisper Notes voor Mac (gratis proefperiode) of voor iPhone (eenmalig $6.99).
  2. Kies een model: Whisper Large V3 Turbo voor brede taaldekking, Parakeet V3 voor snelheid in Europese talen, SenseVoice voor CJK. Het model download je één keer en daarna werkt het voor altijd offline.
  3. Neem direct op, dicteer systeemwijd door Fn ingedrukt te houden, of sleep audio- en videobestanden erin (MP3, WAV, M4A, MP4).
  4. De tekst verschijnt terwijl het model verwerkt. Exporteer als TXT of SRT.

Sceptisch over "offline"? Zet eerst de vliegtuigmodus aan. De transcriptie draait op volle snelheid — er wordt nooit iets geüpload.

Hoe nauwkeurig is Whisper transcriptie in het Nederlands? Welk model kiezen?

Goed nieuws voor Nederlandstalige gebruikers: je hoeft niet eens per se Whisper te kiezen. In Whisper Notes is Parakeet V3 het standaardmodel, en dat dekt 25 Europese talen — Nederlands incluis — met een gemiddeld woordfoutpercentage van 6,32% en zo'n 10x de snelheid van Whisper. Voor gesproken Nederlands (vergaderingen, dictaat, interviews) is dat in de praktijk de beste startkeuze. Wissel je vaak tussen Nederlands en talen buiten Europa, kies dan Whisper Large V3 Turbo: ruim 100 talen in een download van ongeveer 1,5 GB.

Jouw situatie Beste model voor Nederlands
Nederlands (en andere Europese talen) Parakeet V3 — standaard, 6,32% WER, 10x sneller dan Whisper
Nederlands + talen buiten Europa Whisper Large V3 Turbo — 100+ talen, ~1,5 GB

Werk je met een dictafoon of voicerecorder — bijvoorbeeld als advocaat, arts of journalist? We hebben een aparte stap-voor-stap-gids voor het offline uitwerken van dictafoon-opnames.

Veelgestelde vragen

Is Whisper transcriptie gratis?

Het model zelf is gratis en open source (MIT-licentie). Draaien via command-line-tools zoals whisper.cpp kost niets, maar vergt installatie. De API van OpenAI rekent per audiominuut ($0,006/min). Native apps verpakken de modellen voor een klein bedrag — Whisper Notes kost eenmalig $6.99, met een gratis proefperiode op de Mac.

Werkt Whisper transcriptie offline?

Ja — dat is precies het punt van open gewichten. Zodra het modelbestand op je apparaat staat, is er geen internet meer nodig. Whisper Notes draait Whisper Large V3 Turbo op Apple Silicon via CoreML/Metal, volledig offline. Controleer het zelf met de vliegtuigmodus.

Welk Whisper-model is het nauwkeurigst?

large-v3 heeft de beste ruwe nauwkeurigheid. large-v3-turbo zit daar binnen een fractie van een procent WER bij, terwijl het ongeveer 5x sneller draait — daarom is het tegenwoordig in de meeste tools de standaard.

Ondersteunt Whisper transcriptie Nederlands?

Ja, Whisper dekt ongeveer 100 talen en Nederlands hoort bij de goed ondersteunde talen. Voor Nederlands is Parakeet V3 vaak nog de betere keuze: het dekt 25 Europese talen met 6,32% WER en is zo'n 10x sneller dan Whisper. Voor Chinees, Japans, Koreaans en Kantonees levert SenseVoice betere interpunctie en veel hogere snelheid op Apple Silicon.

Is er een Whisper transcriptie-app voor iPhone?

Ja. Whisper Notes draait Whisper-modellen die geoptimaliseerd zijn voor de Neural Engine van de iPhone (iPhone 12 en nieuwer) — opnemen, importeren uit Dictafoon of Bestanden, en volledig op het apparaat transcriberen voor eenmalig $6.99, zonder abonnement.