Presentant Whisper Large V3 Turbo

6 de novembre del 2024
·
6 min read
·Whisper Notes Team

Whisper Notes ara admet Whisper Large-v3 Turbo. Mateixa precisió de transcripció, 5× més ràpid. Actualment disponible a Mac amb Apple Silicon.

Il·lustració Whisper Large-v3 Turbo

Què és diferent

1. 5× més ràpid

Turbo processa l'àudio cinc vegades més ràpid que el model estàndard Whisper. A la pràctica:

  • iPhone 15 Pro: 10 minuts d'àudio es transcriuen en ~82 segons (eren 425)
  • MacBook M2: 10 minuts en ~63 segons (eren 316)
  • 60% menys consum de bateria

2. Mateixa precisió

Turbo no sacrifica qualitat per velocitat:

  • Precisió idèntica al model estàndard
  • Mateixa precisió de marca de temps
  • Tots els més de 100 idiomes compatibles: la detecció automàtica d'idioma funciona igual

3. Encara 100% fora de línia

Turbo s'executa al teu dispositiu igual que el model estàndard:

  • Tot es processa localment: el teu àudio mai surt del teu dispositiu
  • Zero comunicació amb el servidor
  • Funciona completament fora de línia

Requisits del dispositiu

Actualment, Whisper Large-v3 Turbo està disponible a Mac amb Apple Silicon (M1/M2/M3/M4 o més nou).

Estem seguint de prop les futures actualitzacions de models per a la compatibilitat amb iPhone i iPad. A mesura que els models d'IA es tornen més eficients, esperem portar Turbo als dispositius mòbils.

Per què la limitació? Whisper Notes és 100% fora de línia: els usuaris no poden descarregar models després d'instal·lar l'aplicació. Això significa que proporcionem un model que ha d'equilibrar el rendiment en dispositius convencionals mentre manté la precisió. Estem compromesos a trobar el correcte equilibri entre velocitat i precisió.

Comparació: temps per processar 10 minuts d'àudio

Dispositiu Whisper Standard Whisper Large-v3 Turbo Millora
iPhone 15 Pro 425 seconds 82 seconds 5.2× més ràpid
iPad Pro M2 380 seconds 71 seconds 5.4× més ràpid
MacBook Pro M2 316 seconds 63 seconds 5.0× més ràpid

10 minuts d'àudio ara es transcriu en aproximadament un minut amb maquinari recent. Mateixa precisió, molt més ràpid.

Versió Mac

Mac Whisper Notes utilitza el model Turbo als Mac amb Apple Silicon. Els xips de la sèrie M gestionen el processament més ràpid molt bé: la velocitat de transcripció coincideix amb els números anteriors.