Transcription Hors Ligne
Pourquoi ça marche enfin
Pendant des années, la transcription locale signifiait plus lent et moins bon. Ça a changé.

Un peu de contexte
Il y a quelques années, si vous vouliez une transcription précise, vous deviez télécharger votre audio sur le serveur de quelqu'un d'autre. Des options locales existaient, mais elles étaient nettement moins bonnes. Le compromis était réel.
Puis quelques choses se sont passées. OpenAI a publié Whisper en tant que modèle ouvert. Apple a livré des puces avec du matériel IA dédié. Soudain, les mêmes modèles qui alimentaient les services cloud pouvaient tourner sur un ordinateur portable.
Nous avons commencé à développer Whisper Notes à cette époque, principalement parce que nous en avions besoin nous-mêmes. Il s'est avéré que beaucoup de gens cherchaient la même chose.
Ce qui a changé
Trois choses faisaient de la transcription cloud le choix évident. Les trois ont changé.
Puissance de calcul
Les modèles IA qui font la transcription sont grands—des centaines de millions de paramètres. Les faire tourner était lent et gourmand en batterie sur du matériel grand public.
Le Neural Engine d'Apple a changé ça. C'est une puce dédiée aux tâches IA, et elle est dans chaque Mac série M et iPhone récent. Whisper Large v3 Turbo tourne maintenant confortablement sur un MacBook Air.
Sur téléphone, nous utilisons des modèles plus petits optimisés pour les puces mobiles. Ils ne sont pas tout à fait aussi précis que le grand modèle, mais ils sont quand même meilleurs que la plupart des dictées intégrées.
Précision
Ça nous a surpris. Nous nous attendions à ce que les modèles locaux soient « assez bons ». Ils sont en fait plutôt bons.
Whisper Large v3 a des taux d'erreur de mots plus bas que la plupart des dictées système. Et l'écart entre les APIs locales et cloud est devenu assez petit. Pour la plupart des cas d'usage, vous ne remarquerez probablement pas la différence.
Ça change le calcul. Si la précision est comparable, la raison principale de télécharger l'audio disparaît.
Vie privée
Nous ne sommes pas là pour vous faire peur sur les services cloud. La plupart gèrent les données de façon responsable.
Mais il y a une différence entre « ils promettent de ne pas en abuser » et « ils ne l'ont jamais eu ». Votre voix est biométrique—contrairement à un mot de passe, vous ne pouvez pas la changer si quelque chose tourne mal.
Avec la transcription locale, votre audio reste sur votre appareil. Pas chiffré-puis-téléchargé. Il reste juste... là. Pour certaines personnes ça compte beaucoup. Pour d'autres, peut-être pas. Nous avons construit pour le premier groupe.
Quand utiliser quoi
Le local n'est pas toujours le bon choix. Voici comment nous voyons les choses.
Besoin de collaboration en temps réel ?
Les outils cloud comme Otter sont faits pour ça. Plusieurs personnes éditant la même transcription ont besoin d'un serveur central. C'est un bon usage du cloud.
Sur Windows ou Android ?
L'IA locale est plus difficile sur ces plateformes—le support matériel n'est pas encore mature. Dragon marche pour Windows. Sur Android, les services cloud sont généralement le choix pratique.
Besoin de savoir qui a dit quoi ?
L'identification des locuteurs (diarisation) nécessite des modèles supplémentaires. Les services cloud comme Rev gèrent ça bien. Les outils locaux rattrapent, mais c'est encore un domaine où le cloud a l'avantage.
Juste besoin d'une transcription privée et précise ?
C'est ce sur quoi nous nous sommes concentrés. Si vos principales préoccupations sont la vie privée et la précision, et que vous êtes sur du matériel Apple, le local fonctionne bien maintenant.
Ce que fait Whisper Notes
Il fait tourner Whisper Large v3 Turbo sur votre Mac, ou un modèle plus petit optimisé sur votre iPhone. Votre audio ne quitte jamais l'appareil.
Sur Mac, la transcription tourne à environ 10-15 fois la vitesse réelle en utilisant le Neural Engine. Un enregistrement d'une heure prend quelques minutes. Sur iPhone c'est plus lent, mais pratique pour la plupart des enregistrements.
$4,99 une fois, pour les deux plateformes. Nous ne gérons pas de serveurs, donc nous n'avons pas besoin d'abonnements. C'est tout.
La version courte
La transcription locale était autrefois un compromis. Maintenant c'est un choix par défaut raisonnable pour beaucoup de gens.
Si vous avez besoin de collaboration ou travaillez sur des plateformes non-Apple, les services cloud ont toujours du sens. Si vous voulez principalement une transcription précise et privée sur un Mac ou iPhone, l'option locale est devenue plutôt bonne.
Nous utilisons Whisper Notes nous-mêmes tous les jours. Il fait ce dont nous avions besoin.
Essayez-le
Vous pouvez le tester en mode avion si vous voulez vérifier que rien n'est téléchargé. Tout fonctionne pareil.
App Store • $4.99 • Mac et iPhone
Un achat couvre les deux plateformes.