Офлайн-транскрипция
Почему это наконец работает
Долгое время локальная транскрипция означала медленнее и хуже. Это изменилось.

Немного контекста
Несколько лет назад, если вы хотели точную транскрипцию, нужно было загружать аудио на чей-то сервер. Локальные варианты существовали, но были заметно хуже. Компромисс был реальным.
Потом произошло несколько вещей. OpenAI выпустила Whisper как открытую модель. Apple начала выпускать чипы со специализированным AI-оборудованием. Внезапно те же модели, которые работали в облачных сервисах, могли работать на ноутбуке.
Мы начали разрабатывать Whisper Notes примерно в это время, в основном потому что нам это было нужно самим. Оказалось, что многие искали то же самое.
Что изменилось
Три вещи раньше делали облачную транскрипцию очевидным выбором. Все три изменились.
Вычислительная мощность
AI-модели для транскрипции большие — сотни миллионов параметров. Раньше их запуск на потребительском оборудовании был медленным и разряжал батарею.
Neural Engine от Apple изменил это. Это специализированный чип для AI-задач, и он есть в каждом Mac серии M и новом iPhone. Whisper Large v3 Turbo теперь комфортно работает на MacBook Air.
На телефонах мы используем меньшие модели, оптимизированные для мобильных чипов. Они не такие точные, как большая модель, но всё равно лучше большинства встроенных диктовок.
Точность
Это нас удивило. Мы ожидали, что локальные модели будут «достаточно хорошими». На самом деле они довольно хороши.
Whisper Large v3 имеет более низкий уровень ошибок в словах, чем большинство системных диктовок. И разрыв между локальными и облачными API стал довольно маленьким. Для большинства случаев вы, вероятно, не заметите разницу.
Это меняет расчёт. Если точность сопоставима, главная причина загружать аудио исчезает.
Приватность
Мы не собираемся пугать вас облачными сервисами. Большинство обращаются с данными ответственно.
Но есть разница между «они обещают не злоупотреблять» и «у них никогда этого не было». Ваш голос — это биометрия. В отличие от пароля, вы не можете его изменить, если что-то пойдёт не так.
С локальной транскрипцией ваше аудио остаётся на устройстве. Не зашифровано-и-загружено. Просто... остаётся. Для некоторых людей это очень важно. Для других, может быть, нет. Мы создали для первых.
Когда что использовать
Локальное не всегда правильный выбор. Вот как мы об этом думаем.
Нужна совместная работа в реальном времени?
Облачные инструменты вроде Otter созданы для этого. Несколько человек, редактирующих одну транскрипцию, нуждаются в центральном сервере. Это хорошее применение облака.
Используете Windows или Android?
Локальный AI на этих платформах сложнее — аппаратная поддержка ещё не созрела. Dragon работает для Windows. На Android облачные сервисы обычно практичный выбор.
Нужно знать, кто что сказал?
Определение говорящего (диаризация) требует дополнительных моделей. Облачные сервисы вроде Rev хорошо с этим справляются. Локальные инструменты догоняют, но это всё ещё область, где облако имеет преимущество.
Просто нужна приватная, точная транскрипция?
На этом мы сосредоточились. Если ваши главные заботы — приватность и точность, и вы на оборудовании Apple, локальное сейчас хорошо работает.
Что делает Whisper Notes
Он запускает Whisper Large v3 Turbo на вашем Mac или меньшую оптимизированную модель на iPhone. Ваше аудио никогда не покидает устройство.
На Mac транскрипция работает примерно в 10-15 раз быстрее реального времени с использованием Neural Engine. Часовая запись занимает несколько минут. На iPhone медленнее, но практично для большинства записей.
$4.99 один раз, для обеих платформ. Мы не управляем серверами, поэтому не нужны подписки. Вот и всё.
Коротко
Локальная транскрипция раньше была компромиссом. Теперь это разумный выбор по умолчанию для многих людей.
Если вам нужна совместная работа или вы работаете на платформах не от Apple, облачные сервисы всё ещё имеют смысл. Если вам в основном нужна точная, приватная транскрипция на Mac или iPhone, локальный вариант стал довольно хорошим.
Мы сами используем Whisper Notes каждый день. Он делает то, что нам было нужно.
Попробуйте
Вы можете протестировать в режиме полёта, если хотите убедиться, что ничего не загружается. Всё работает так же.
App Store • $4.99 • Mac и iPhone
Одна покупка покрывает обе платформы.