Parakeet V3 vs Whisper : 10x plus rapide, meilleure précision (Benchmark)

TL;DR

	Parakeet V3	Comparaison Whisper
Vitesse	10× vs Turbo ; ~23× vs V3	Référence Turbo / Large V3
Langues prises en charge	25	100+
Taux d'erreur anglais (WER)	6.32%	Turbo 7.83% ; V3 7.44%
Taux d'erreur moy. 25 langues (WER)	12.0%	12.6%
Hallucinations	Quasi aucune sur les silences dans nos tests	Peuvent apparaître sur les silences
Idéal pour	Anglais & européen	Asiatique, arabe, 100+

* Vitesse : le même audio de 35 min sur Apple Silicon. WER anglais : Open ASR Leaderboard de Hugging Face. Moyenne 25 langues : benchmark FLEURS. Le comportement sur les silences est notre observation produit, pas une garantie zéro erreur.

Depuis la version 1.3.2 (Téléchargement direct / DMG), Whisper Notes pour Mac est livré avec NVIDIA Parakeet TDT 0.6B comme moteur de reconnaissance vocale par défaut. Il est 10 fois plus rapide que Whisper Large V3 Turbo pour l'anglais, et plus précis. Les modèles Whisper restent disponibles si vous avez besoin d'autres langues.

Pourquoi on a changé le modèle par défaut

Whisper est super, mais c'est un modèle généraliste. Il gère plus de 100 langues, traduit, génère des horodatages — un vrai couteau suisse. Le revers de la médaille, c'est la vitesse. Pour la dictée en anglais, quand on veut juste voir les mots s'afficher rapidement, c'est trop lourd.

Un truc me gênait vraiment : en utilisant la dictée système avec la touche Fn avec Whisper, terminer une phrase d'environ 1 minute voulait dire attendre 3 à 5 secondes avant que la transcription n'apparaisse. Cette pause casse le rythme. On arrête de parler, on attend, on fixe le curseur — ça tue la magie de l'écriture vocale.

Parakeet a tout changé. La vitesse est telle que la transcription apparaît à l'instant même où vous arrêtez de parler. Vous parlez, et les mots sont tout simplement là. Une fois qu'on a goûté à cette fluidité — ce flux continu, sans aucune attente — c'est vraiment difficile de revenir à Whisper.

Parakeet V3, à quelle vitesse exactement ?

Les chiffres parlent d'eux-mêmes. Voici une comparaison concrète avec un fichier audio de 35 minutes sur le même Mac :

Modèle	Audio de 35 min
Whisper Large V3 Turbo	3 minutes
Parakeet TDT 0.6B v3	18 secondes

10 fois plus rapide. Et comme le modèle est plus petit (600M contre 800M de paramètres), il consomme moins de mémoire et moins de batterie.

Ce qui rend Parakeet v3 si rapide

Whisper écoute l'audio comme on lirait un livre à voix haute — mot par mot, image par image, sans jamais sauter de passage. Même pendant les silences, il continue de traiter, de deviner ce qui vient après. C'est minutieux, mais lent.

Parakeet adopte une approche fondamentalement différente. Il compresse le signal audio 8 fois avant de le traiter, de sorte que le modèle ne voit que l'essentiel. Ensuite, au lieu de passer en revue chaque image une par une, il prédit non seulement quel mot vous avez dit, mais aussi combien de temps ce mot dure — et saute en avant. Du silence ? Ignoré. Une voyelle longue ? Une seule prédiction au lieu de dizaines.

Le résultat est un modèle qui traite la parole comme votre cerveau — en se concentrant sur les mots et en ignorant les blancs. C'est pour ça qu'il est 10 fois plus rapide avec moins de paramètres et une meilleure précision.

Benchmarks : Parakeet v3 vs Whisper

Comparaison du taux d'erreur par mot : Parakeet TDT 0.6B v3 vs Whisper Large V3 vs Seamless M4T sur plusieurs jeux de données de référence

Parakeet v3 égale ou dépasse des modèles 2 à 4 fois plus gros sur les benchmarks FLEURS, CoVoST et MLS

Sur le classement Open ASR de Hugging Face, Parakeet v3 arrive en tête avec seulement 600M de paramètres — moins de la moitié des 1,55 milliard de Whisper Large V3 :

Modèle	Paramètres	WER moyen	Vitesse (RTFx)
Parakeet TDT 0.6B v3	0.6B	6.32%	3,333x
Canary 1B v2	1.0B	7.15%	749x
Whisper Large V3	1.55B	7.44%	146x
Whisper Large V3 Turbo	0.8B	7.83%	350x

WER plus bas = moins d'erreurs. RTFx plus élevé = plus rapide. Parakeet gagne sur les deux tableaux. Avec 600M de paramètres, c'est aussi le modèle le plus petit de la liste — ce qui veut dire qu'il tourne parfaitement sur Apple Silicon avec une consommation minimale de mémoire et de batterie.

WER multilingue : les 25 langues

Le classement ci-dessus ne concerne que l'anglais. Voici le tableau complet — comment les trois modèles disponibles dans Whisper Notes se comparent sur les 25 langues prises en charge par Parakeet, mesurées sur le benchmark FLEURS. WER plus bas = moins d'erreurs de transcription. La meilleure valeur entre Large V3 et Parakeet est mise en évidence par ligne :

Langue	Whisper Small	Whisper Large V3	Parakeet V3
Bulgare	37.3	12.9	12.6
Croate	33.4	11.1	12.5
Tchèque	37.6	11.3	11.0
Danois	32.8	12.6	18.4
Néerlandais	16.4	5.6	7.5
Anglais	6.1	4.3	4.9
Estonien	51.3	19.1	17.7
Finnois	24.0	7.7	13.2
Français	15.0	6.3	5.2
Allemand	10.2	4.3	5.0
Grec	30.8	27.0	20.7
Hongrois	38.9	14.1	15.7
Italien	9.8	2.3	3.0
Letton	53.2	18.3	22.8
Lituanien	65.6	22.3	20.4
Maltais	92.2	68.9	20.5
Polonais	14.7	4.7	7.3
Portugais	7.3	3.7	4.8
Roumain	29.8	8.2	12.4
Russe	11.4	4.2	5.5
Slovaque	33.3	8.4	8.8
Slovène	49.3	19.9	24.0
Espagnol	5.6	3.1	3.5
Suédois	20.8	7.9	15.1
Ukrainien	19.3	6.5	6.8
Moyenne	29.8	12.6	12.0

WER (%) sur FLEURS. Données Whisper Small issues de Radford et al. ; données Large V3 et Parakeet V3 issues de l'article NVIDIA Canary-1B-v2.

Whisper Large V3 garde une légère avance sur la plupart des langues prises individuellement, mais Parakeet V3 reste proche en moyenne (12,0 % contre 12,6 %), mène sur le grec, le français, l'estonien et le maltais, et réduit d'environ 60 % le taux d'erreur moyen de Whisper Small. L'avantage pratique, c'est la combinaison : une précision multilingue de niveau Large V3 à environ 23× la vitesse, une empreinte d'exécution plus petite et une gestion des silences bien plus fiable dans nos tests de dictée.

Pourquoi il hallucine moins sur les silences

Si vous avez déjà utilisé Whisper pour la dictée, vous l'avez sûrement vu halluciner pendant les silences — répéter des phrases, inventer des mots ou sortir un "Subtitles by Amara.org" de nulle part. Ça arrive parce que le décodeur autorégressif de Whisper s'attend toujours à produire du texte, même quand il n'y a rien à transcrire.

L'architecture à transducteur de Parakeet peut émettre des sorties vides au lieu de forcer un token de texte. Dans nos tests de dictée système, cela le rend bien moins susceptible que Whisper de remplir une pause avec du texte répété ou sans rapport. Cela reste un modèle vocal : « moins susceptible » est l'affirmation exacte, pas « jamais ».

Langues prises en charge par Parakeet

Parakeet v3 prend en charge 25 langues : bulgare, croate, tchèque, danois, néerlandais, anglais, estonien, finnois, français, allemand, grec, hongrois, italien, letton, lituanien, maltais, polonais, portugais, roumain, russe, slovaque, slovène, espagnol, suédois et ukrainien.

Ça couvre la majeure partie de l'Europe, mais pas le chinois, le japonais, le coréen, l'arabe ni l'hindi. Pour le chinois, le japonais, le coréen et le cantonais, choisissez SenseVoice ; pour l'arabe, l'hindi et les autres langues hors du périmètre de Parakeet, utilisez Whisper Large V3 Turbo.

Sélecteur de modèles de Whisper Notes pour Mac montrant Parakeet V3, SenseVoice Small, Whisper Small et Whisper Large V3 Turbo

Sélecteur de modèles : Parakeet V3 (par défaut), SenseVoice Small, Whisper Small et Whisper Large V3 Turbo — tous en local

Sélecteur de modèles dans Whisper Notes

Ouvrez les Réglages pour changer de modèle :

Parakeet V3 (par défaut) — Le plus rapide, idéal pour l'anglais et les langues européennes
SenseVoice Small — Le plus rapide pour le chinois, le japonais, le coréen et le cantonais
Whisper Small — Léger, plus de 100 langues
Whisper Large V3 Turbo — Large couverture de plus de 100 langues

Tous les modèles tournent à 100 % en local sur votre Mac. Pas d'Internet, pas de cloud, aucune donnée ne quitte votre appareil.

Et Parakeet V2 ?

Si vous utilisiez V2, vous vous demandez peut-être comment il se compare. V2 était un modèle anglais uniquement — et sa précision en anglais est en fait légèrement supérieure à celle de V3 (WER 6,05 % vs 6,32 %). V3 échange cette infime marge contre la prise en charge de 25 langues. Les deux sont nettement plus précis que Whisper.

	Parakeet V2	Parakeet V3	Whisper Large V3
WER anglais	6.05%	6.32%	7.44%
Langues	Anglais uniquement	25	100+

En résumé : si vous n'avez besoin que de l'anglais, V2 et V3 sont tous les deux excellents. V3 est le modèle par défaut dans Whisper Notes car le support multilingue compte pour la plupart des utilisateurs — et la différence de précision en anglais est négligeable.

Et WhisperKit ?

WhisperKit est le framework Swift open source d'Argmax pour exécuter les modèles Whisper sur les appareils Apple. C'est une boîte à outils pour développeurs, pas une app grand public — et il exécute Whisper, pas Parakeet (qui est la famille de modèles de NVIDIA). Si vous voulez une transcription sur appareil à la WhisperKit sans écrire de Swift vous-même, Whisper Notes empaquette la même idée en app prête à l'emploi : Parakeet V3, Whisper Large V3 Turbo et SenseVoice, tous exécutés localement sur Mac et iPhone.

Vous comparez toutes les options locales ? Chaque modèle de reconnaissance vocale sur appareil — les variantes de Whisper, Parakeet V3, SenseVoice et Voxtral — est comparé côte à côte sur notre page de comparaison des modèles Whisper. Vous découvrez Whisper ? Commencez par le guide de transcription Whisper — ce qu'est le modèle, toutes les façons de l'exécuter et ce que cela coûte.

Questions fréquentes

Parakeet V3 est-il meilleur que Whisper ?

Pour l'anglais et les langues européennes, souvent oui. Dans notre test de 35 minutes, Parakeet était 10× plus rapide que Whisper Turbo, et l'Open ASR Leaderboard rapporte 6,32 % de WER en anglais pour Parakeet contre 7,83 % pour Turbo. Whisper couvre toujours bien plus de langues : plus de 100 contre 25 pour Parakeet.

Quelles langues Parakeet V3 prend-il en charge ?

Parakeet V3 prend en charge 25 langues : bulgare, croate, tchèque, danois, néerlandais, anglais, estonien, finnois, français, allemand, grec, hongrois, italien, letton, lituanien, maltais, polonais, portugais, roumain, russe, slovaque, slovène, espagnol, suédois et ukrainien.

Puis-je exécuter Parakeet V3 sur Mac ?

Oui. Whisper Notes pour Mac livre Parakeet V3 comme moteur par défaut. Il tourne à 100 % en local sur Apple Silicon — pas d'Internet, pas de cloud, aucune donnée ne quitte votre appareil. Téléchargez le DMG d'essai gratuit pour l'essayer.

Parakeet V3 hallucine-t-il comme Whisper ?

Beaucoup moins souvent dans nos tests sur les silences, mais aucun modèle vocal ne mérite l'affirmation « jamais ». Parakeet peut émettre des blancs pendant les pauses, tandis que le décodeur autorégressif de Whisper est plus enclin à produire des phrases répétées ou du texte sans rapport quand l'entrée est silencieuse.

Parakeet V2 vs V3 — lequel utiliser ?

Parakeet V2 est uniquement anglais avec une précision légèrement meilleure en anglais (6,05 % vs 6,32 % de WER). V3 échange cette infime marge contre 25 langues européennes et c'est le modèle par défaut dans Whisper Notes. À moins de transcrire exclusivement de l'anglais et de courir après la dernière fraction de pourcent, utilisez V3.

Parakeet V3 prend-il en charge le japonais, le chinois ou le coréen ?

Non — ses 25 langues sont toutes européennes. Pour le chinois, le japonais, le coréen ou le cantonais, Whisper Notes inclut SenseVoice (52x plus rapide que Whisper pour le CJK) et les modèles Whisper. Tous fonctionnent hors ligne, sur Mac comme sur iPhone.

Quelle est la taille de Parakeet V3 ?

600 millions de paramètres — un téléchargement de 465 Mo qui utilise environ 800 Mo de mémoire pendant la transcription dans notre version Mac. Whisper Large V3 Turbo représente environ 1,6 Go de téléchargement et utilise environ 1,6 Go de mémoire dans la même app.

Essayez-le

Parakeet v3 est disponible dès maintenant dans la version Mac — il suffit de télécharger le dernier DMG. (Mise à jour : Parakeet est désormais disponible dans la dernière version iOS.)

Des questions ou des suggestions ? Écrivez-nous à support@whispernotes.app.