Представляємо Whisper Large V3 Turbo

6 листопада 2024 р.
·
6 min read
·Whisper Notes Team

Whisper Notes тепер підтримує Whisper Large-v3 Turbo. Та сама точність транскрипції, у 5× швидше. Наразі доступно на Mac з Apple Silicon.

Ілюстрація Whisper Large-v3 Turbo

Що змінилось

1. У 5× швидше

Turbo обробляє аудіо в п'ять разів швидше, ніж стандартна модель Whisper. На практиці:

  • iPhone 15 Pro: 10 хвилин аудіо транскрибується за ~82 секунди (було 425)
  • MacBook M2: 10 хвилин за ~63 секунди (було 316)
  • На 60% менше споживання батареї

2. Та сама точність

Turbo не жертвує якістю заради швидкості:

  • Ідентична точність зі стандартною моделлю
  • Та сама точність часових міток
  • Усі 100+ мов підтримуються—автоматичне визначення мови працює так само

3. Все ще 100% офлайн

Turbo працює на вашому пристрої так само, як стандартна модель:

  • Все обробляється локально—ваше аудіо ніколи не залишає ваш пристрій
  • Нуль комунікації з сервером
  • Працює повністю офлайн

Вимоги до пристрою

Наразі Whisper Large-v3 Turbo доступний на Mac з Apple Silicon (M1/M2/M3/M4 або новіше).

Ми уважно стежимо за майбутніми оновленнями моделей для підтримки iPhone та iPad. Оскільки моделі AI стають більш ефективними, ми сподіваємося принести Turbo на мобільні пристрої.

Чому обмеження? Whisper Notes 100% офлайн—користувачі не можуть завантажувати моделі після встановлення програми. Це означає, що ми постачаємо одну модель, яка повинна балансувати продуктивність на основних пристроях, зберігаючи точність. Ми прагнемо знайти правильний баланс між швидкістю та точністю.

Порівняння: час обробки 10 хвилин аудіо

Пристрій Whisper Standard Whisper Large-v3 Turbo Покращення
iPhone 15 Pro 425 seconds 82 seconds У 5.2× швидше
iPad Pro M2 380 seconds 71 seconds У 5.4× швидше
MacBook Pro M2 316 seconds 63 seconds У 5.0× швидше

10 хвилин аудіо тепер транскрибується приблизно за хвилину на сучасному обладнанні. Та сама точність, набагато швидше.

Версія для Mac

Mac Whisper Notes використовує модель Turbo на Mac з Apple Silicon. Чіпи серії M дійсно добре справляються з швидшою обробкою—швидкість транскрипції відповідає наведеним вище цифрам.