Офлайн-транскрипция встреч на Mac: записывайте Zoom, Teams и Meet локально

13 мая 2026 г.
·
8 min read
·Whisper Notes Team

Мы сделали офлайн-транскрипцию встреч для Mac. Записывает звонки в Zoom, Teams и Google Meet, транскрибирует локально через Parakeet V3 и создаёт резюме через Gemma 4. Без облака, без бота в звонке. $6.99 один раз.

Whisper Notes записывает встречу в Zoom на Mac с транскрипцией в реальном времени и метками Я и Другие

Запись звонка в Zoom через Whisper Notes — «Я» и «Другие» помечены по источнику аудио

Обычный понедельник

10 утра, звонок в Zoom с клиентом. Вы открываете Whisper Notes, нажимаете запись. Приложение захватывает системный звук и микрофон одновременно — никто на встрече не видит бота, никто не получает уведомление, ничего не появляется в списке участников.

Через час звонок заканчивается. Вы останавливаете запись. Parakeet V3 транскрибирует 60 минут аудио примерно за минуту, целиком на Neural Engine вашего Mac. Нажимаете «Резюме» — Gemma 4 извлекает ключевые тезисы. Нажимаете «Задачи» — получаете каждую задачу и дедлайн, упомянутые в разговоре. Отправляете заметки клиенту. Аудио ни разу не покинуло вашу машину.

Вот и весь процесс. Записать, транскрибировать, резюмировать. Всё локально.

Что умеет

Запись

Whisper Notes захватывает системный звук — то, что идёт из ваших динамиков или наушников. Если вы слышите это на Mac — мы можем транскрибировать. Zoom, Teams, Google Meet, Webex, GoTo, Whereby, Jitsi, YouTube, подкасты или любое другое приложение. Одновременно записывается и микрофон, так что обе стороны разговора попадают в запись.

Бот не подключается к звонку. Это важнее, чем кажется. Если вы когда-нибудь видели «Otter.ai Notetaker has joined the meeting» во время звонка в Zoom, вы знаете, что происходит дальше — кто-то спрашивает, что это, кому-то становится некомфортно, и разговор меняется. При захвате системного звука никто, кроме вас, не знает о записи.

Транскрипция

Parakeet V3 работает на Apple Silicon через CoreML. Обрабатывает английский и 24 европейских языка примерно в 60 раз быстрее реального времени — 60-минутная встреча готова примерно за минуту. Для китайского, японского или корейского SenseVoice обрабатывает CJK со скоростью 52x. Pyannote VAD удаляет тишину перед транскрипцией, поэтому модель обрабатывает только реальную речь.

Экран транскрипции Whisper Notes на Mac с инлайн-редактированием текста, временными метками и волновой формой аудио

Транскрипция с временными метками и инлайн-редактированием — нажмите на любой сегмент, чтобы перейти к этому моменту в аудио

Функции ИИ — все локальные

Gemma 4 работает на вашем Mac. Без API-ключа, без облачных вызовов, без лимитов использования. После транскрипции:

  • Резюме — ключевые тезисы 60-минутной встречи за секунды
  • Задачи — задачи и дедлайны, извлечённые автоматически
  • Перевод — Apple Intelligence переводит транскрипцию на другой язык
  • Чат — спросите «о чём мы договорились по ценам?» и получите ответ на основе транскрипции
Боковая панель ИИ-ассистента Whisper Notes с кнопками Резюме, Задачи, Перевод и интерфейсом чата

Боковая панель ИИ Gemma 4 — Резюме, Задачи, Перевод и свободный чат, всё работает локально

Почему мы сделали именно так

Аудио встреч — одни из самых чувствительных данных, которые производит компания. Переговоры с клиентами, HR-ревью, заседания совета директоров, юридические консультации — разговоры, где одна утечка может стоить карьеры.

Большинство инструментов транскрипции загружают это аудио на облачные серверы, обрабатывают там и хранят в соответствии со своими политиками хранения данных. Некоторые добавляют в звонок бота, которого видят все. Некоторые хранят ваши записи бессрочно для «улучшения модели».

Мы выбрали другой подход: всё работает на вашем Mac. Модель ASR, LLM, хранение аудио — всё локально. Нет сервера, который можно взломать. Нет политики хранения данных, которую нужно читать. Нет риска запроса данных третьей стороной. Для команд, работающих под GDPR, HIPAA или адвокатской тайной, эта архитектура — и есть суть.

Сравнение

Whisper Notes Otter.ai Fireflies Jamie
Обработка 100% на устройстве Облако Облако Гибрид
Бот в звонке Нет Да Да Нет
Цена $6.99 один раз $16.99/мес (Pro) от $18/мес $24/мес
Работает офлайн Да Нет Нет Частично
ИИ-резюме Локально (Gemma 4) Облако Облако Облако
Диаризация спикеров Пока нет Да Да Да

Разные встречи, разные языки

Выберите модель, соответствующую языку вашей встречи:

Английский / Европейские Parakeet V3 — ~60x в реальном времени, 6.32% WER, ноль галлюцинаций на тишине
Китайский / Японский / Корейский SenseVoice — скорость 52x, поддержка кантонского, GPU-ускорение через MLX
Другие языки Whisper Large V3 Turbo — 99 языков, высокая точность, медленнее

Чего пока нет

У нас пока нет диаризации спикеров. Сейчас Whisper Notes помечает аудио как «Я» (ваш микрофон) и «Другие» (системный звук) — этого достаточно для большинства встреч один на один и малых групп. Но для звонка на 10 человек, где нужно знать, кто что сказал, этого недостаточно.

Это очевидный следующий шаг, и мы над этим работаем. Цель — локальная диаризация, которая работает совместно с Parakeet V3 и SenseVoice, без отправки аудио куда-либо.