Transcription Hors Ligne

Pourquoi ça marche enfin

Pendant des années, la transcription locale signifiait plus lent et moins bon. Ça a changé.

Logiciel de transcription hors ligne

Un peu de contexte

Il y a quelques années, si vous vouliez une transcription précise, vous deviez télécharger votre audio sur le serveur de quelqu'un d'autre. Des options locales existaient, mais elles étaient nettement moins bonnes. Le compromis était réel.

Puis quelques choses se sont passées. OpenAI a publié Whisper en tant que modèle ouvert. Apple a livré des puces avec du matériel IA dédié. Soudain, les mêmes modèles qui alimentaient les services cloud pouvaient tourner sur un ordinateur portable.

Nous avons commencé à développer Whisper Notes à cette époque, principalement parce que nous en avions besoin nous-mêmes. Il s'est avéré que beaucoup de gens cherchaient la même chose.

Ce qui a changé

Trois choses faisaient de la transcription cloud le choix évident. Les trois ont changé.

Puissance de calcul

Les modèles IA qui font la transcription sont grands—des centaines de millions de paramètres. Les faire tourner était lent et gourmand en batterie sur du matériel grand public.

Le Neural Engine d'Apple a changé ça. C'est une puce dédiée aux tâches IA, et elle est dans chaque Mac série M et iPhone récent. Whisper Large v3 Turbo tourne maintenant confortablement sur un MacBook Air.

Sur téléphone, nous utilisons des modèles plus petits optimisés pour les puces mobiles. Ils ne sont pas tout à fait aussi précis que le grand modèle, mais ils sont quand même meilleurs que la plupart des dictées intégrées.

Précision

Ça nous a surpris. Nous nous attendions à ce que les modèles locaux soient « assez bons ». Ils sont en fait plutôt bons.

Whisper Large v3 a des taux d'erreur de mots plus bas que la plupart des dictées système. Et l'écart entre les APIs locales et cloud est devenu assez petit. Pour la plupart des cas d'usage, vous ne remarquerez probablement pas la différence.

Ça change le calcul. Si la précision est comparable, la raison principale de télécharger l'audio disparaît.

Vie privée

Nous ne sommes pas là pour vous faire peur sur les services cloud. La plupart gèrent les données de façon responsable.

Mais il y a une différence entre « ils promettent de ne pas en abuser » et « ils ne l'ont jamais eu ». Votre voix est biométrique—contrairement à un mot de passe, vous ne pouvez pas la changer si quelque chose tourne mal.

Avec la transcription locale, votre audio reste sur votre appareil. Pas chiffré-puis-téléchargé. Il reste juste... là. Pour certaines personnes ça compte beaucoup. Pour d'autres, peut-être pas. Nous avons construit pour le premier groupe.

Quand utiliser quoi

Le local n'est pas toujours le bon choix. Voici comment nous voyons les choses.

Besoin de collaboration en temps réel ?

Les outils cloud comme Otter sont faits pour ça. Plusieurs personnes éditant la même transcription ont besoin d'un serveur central. C'est un bon usage du cloud.

Sur Windows ou Android ?

L'IA locale est plus difficile sur ces plateformes—le support matériel n'est pas encore mature. Dragon marche pour Windows. Sur Android, les services cloud sont généralement le choix pratique.

Besoin de savoir qui a dit quoi ?

L'identification des locuteurs (diarisation) nécessite des modèles supplémentaires. Les services cloud comme Rev gèrent ça bien. Les outils locaux rattrapent, mais c'est encore un domaine où le cloud a l'avantage.

Juste besoin d'une transcription privée et précise ?

C'est ce sur quoi nous nous sommes concentrés. Si vos principales préoccupations sont la vie privée et la précision, et que vous êtes sur du matériel Apple, le local fonctionne bien maintenant.

Ce que fait Whisper Notes

Il fait tourner Whisper Large v3 Turbo sur votre Mac, ou un modèle plus petit optimisé sur votre iPhone. Votre audio ne quitte jamais l'appareil.

Sur Mac, la transcription tourne à environ 10-15 fois la vitesse réelle en utilisant le Neural Engine. Un enregistrement d'une heure prend quelques minutes. Sur iPhone c'est plus lent, mais pratique pour la plupart des enregistrements.

$4,99 une fois, pour les deux plateformes. Nous ne gérons pas de serveurs, donc nous n'avons pas besoin d'abonnements. C'est tout.

$4.99Achat unique. Mac et iPhone. Pas d'abonnements. Pas de collecte de données.
Apple App Store logoObtenir Whisper Notes

La version courte

La transcription locale était autrefois un compromis. Maintenant c'est un choix par défaut raisonnable pour beaucoup de gens.

Si vous avez besoin de collaboration ou travaillez sur des plateformes non-Apple, les services cloud ont toujours du sens. Si vous voulez principalement une transcription précise et privée sur un Mac ou iPhone, l'option locale est devenue plutôt bonne.

Nous utilisons Whisper Notes nous-mêmes tous les jours. Il fait ce dont nous avions besoin.

Essayez-le

Vous pouvez le tester en mode avion si vous voulez vérifier que rien n'est téléchargé. Tout fonctionne pareil.

App Store • $4.99 • Mac et iPhone

Un achat couvre les deux plateformes.