Whisper Notes ahora soporta Whisper Large-v3 Turbo. Misma precisión, processing 5× más rápido. Actualmente disponible en Mac con Apple Silicon.
Qué cambió
1. 5× más rápido
Turbo procesa audio cinco veces más rápido que el modelo Whisper estándar. En la práctica:
- •iPhone 15 Pro: 10 minutos de audio en ~82 segundos (antes 425)
- •MacBook M2: 10 minutos en ~63 segundos (antes 316)
- •60% menos batería
2. Misma precisión
Turbo no sacrifica calidad por velocidad:
- •Precisión idéntica al modelo estándar
- •Misma precisión en timestamps
- •Los más de 80 idiomas, detección auto funciona igual
3. Totalmente offline
Turbo corre en tu dispositivo como el modelo estándar:
- •Todo procesado local. Tu audio nunca sale del dispositivo
- •Cero comunicación con servers
- •Funciona offline
Requisitos de dispositivo
Actualmente, Whisper Large-v3 Turbo solo está disponible en Mac con Apple Silicon (M1/M2/M3/M4 o más reciente).
Estamos monitoreando de cerca las futuras actualizaciones de modelos y esperamos poder usarlo en iPhone e iPad. A medida que los modelos de IA se vuelven más eficientes, esperamos llevar Turbo a dispositivos móviles.
¿Por qué esta limitación? Whisper Notes es 100% offline – los usuarios no pueden descargar modelos después de la instalación. Esto significa que debemos proporcionar un modelo integrado que debe equilibrar el rendimiento mientras mantiene la precisión en dispositivos comunes. Estamos comprometidos a encontrar el equilibrio óptimo entre velocidad y precisión.
Comparación: tiempo para procesar 10 minutos de audio
| Dispositivo | Whisper Estándar | Whisper Large-v3 Turbo | Mejora |
|---|---|---|---|
| iPhone 15 Pro | 425 segundos | 82 segundos | 5.2× más rápido |
| iPad Pro M2 | 380 segundos | 71 segundos | 5.4× más rápido |
| MacBook Pro M2 | 316 segundos | 63 segundos | 5.0× más rápido |
10 minutos de audio ahora se transcriben en aprox un minuto en hardware reciente. Misma precisión, mucho más rápido.
Versión Mac
Mac Whisper Notes usa el modelo Turbo en Macs con Apple Silicon. Los chips serie M aguantan bien el processing más rápido—velocidad de transcripción igual a los números de arriba.