Приватность голоса: почему мы выбрали локальную архитектуру
Не нужно жертвовать удобством ради контроля.
Голосовые заметки — это особенное
Голосовые заметки часто хаотичны, нефильтрованы и личны. Они фиксируют мысли в процессе формирования — идеи до того, как их отшлифовали, раздражение до того, как его переварили, наблюдения до того, как их структурировали. Эта сырая подлинность — именно то, что делает их ценными.
Они ощущаются иначе, чем отполированный документ. Это ощущение важно.
Когда вы записываете голосовую заметку, вы часто говорите сами с собой. Интимность этого момента — незаконченные фразы, отступления, незащищённая честность — заслуживает определённого уважения в том, как это обрабатывается технически.
Вопрос цифровой гигиены
Ваш голос — уникальный биометрический идентификатор. В отличие от пароля, его нельзя сбросить. В отличие от номера карты, нельзя запросить новый. Это не для того, чтобы напугать — просто характеристика голосовых данных, которую стоит осознать.
Для большинства повседневных записей облачная обработка вполне приемлема. Но для чувствительного контента — личных размышлений, рабочих заметок, разговоров с клиентами — хранение сырых аудиофайлов вне облака — это просто хорошая цифровая гигиена. Тот же принцип, что и с паролями в открытом виде: не потому что катастрофа неизбежна, а потому что продуманная архитектура предотвращает проблемы до их появления.
Мы построили Whisper Notes вокруг этого принципа. Ваше аудио остаётся на вашем устройстве — не потому что мы считаем облачные сервисы опасными, а потому что у вас должен быть выбор.
Архитектура
Whisper Notes запускает модель распознавания речи Whisper от OpenAI непосредственно на вашем оборудовании. Серверной составляющей нет. Ваши записи обрабатываются локально и никуда не передаются.
Реализация различается между платформами для оптимизации возможностей каждого устройства:
Mac: Whisper Large-v3 Turbo
На Mac мы запускаем Whisper Large-v3 Turbo — модель с 1,5 миллиарда параметров, оптимизированную для Apple Silicon. Это обеспечивает точность, сравнимую с облачными сервисами транскрипции, с правильной пунктуацией и интеллектуальным форматированием абзацев.
Скорость обработки масштабируется с чипом: машины M4 достигают примерно 12x реального времени, в то время как чипы M1 работают примерно с 8x реального времени.
iPhone: Оптимизированная мобильная модель Whisper
Мобильные устройства имеют другие ограничения — тепловые лимиты, время работы батареи, пропускная способность памяти. Мы используем оптимизированную мобильную модель Whisper, настроенную для Neural Engine в чипах A и M.
Хотя она меньше модели для Mac, она выдаёт структурированный текст с пунктуацией, который стабильно превосходит стандартную диктовку. Компромисс честен: для максимальной точности длинных записей обрабатывайте на Mac. Для быстрого захвата мобильная модель работает хорошо.
Спроектировано для скорости
Хорошие идеи не ждут. Они приходят за рулём, на прогулке или перед сном. Виджет экрана блокировки минимизирует трение между мыслью и записью.
Виджет экрана блокировки с Live Activity
- • Активация одним касанием: Начните запись прямо с экрана блокировки
- • Live Activity: Визуальное подтверждение длительности записи в Dynamic Island
- • Бесшовная работа с Face ID: Виджет плавно работает с аутентификацией Face ID
- • Работа без рук: Работает в перчатках, с мокрыми руками или жестами AirPods
Рабочий процесс: захват и просмотр
Наиболее эффективный рабочий процесс для голосовых заметок разделяет захват и просмотр. Мобильные устройства отлично подходят для быстрой записи; десктопы — для глубокой редактуры.
iPhone: Захват
Используйте iPhone для захвата мыслей в момент их появления. Виджет экрана блокировки сводит трение к одному касанию. Мобильная модель транскрибирует мгновенно, давая пригодный текст на месте.
Mac: Просмотр
На Mac Whisper Notes предлагает инструменты для углублённой работы:
- • Обработка Large-v3 Turbo: Повторная транскрипция записей с максимальной точностью
- • Абзацы с таймкодами: Нажмите на любой абзац, чтобы перейти к этому моменту в аудио
- • Синхронное воспроизведение: Текст подсвечивается во время воспроизведения аудио
- • Гибкий экспорт: Простой текст, формат с таймкодами или субтитры SRT
- • Системная диктовка: Удерживайте Fn для диктовки в любое приложение
Транскрипция с таймкодами и синхронизированным воспроизведением аудио
Спокойствие
Настоящая польза — не только техническая безопасность, она психологическая.
Зная, что ваше аудио никогда не покидает устройство, вы получаете свободу говорить совершенно свободно, без самоцензуры. Вы можете записывать наполовину сформированные мысли, выплёскивать раздражение, устраивать дикие мозговые штурмы или документировать чувствительные рабочие вопросы — всё это без раздумий о том, кто может в итоге получить доступ к этому аудио.
Это та же причина, по которой некоторые предпочитают писать в бумажный блокнот: не потому что цифровые заметки небезопасны, а потому что ощущение приватности меняет то, насколько свободно вы думаете.
Экономическая модель
Поскольку вся обработка происходит на вашем устройстве, нет серверных расходов, масштабирующихся с использованием. Это позволяет модель единоразовой покупки: $4.99 за iPhone и Mac, навсегда.
Без подписок. Без поминутной оплаты. Без лимитов использования.
Честные компромиссы
Локальная обработка влечёт реальные компромиссы, которые стоит понимать:
Что учесть
- • Скорость обработки: Инференс на устройстве медленнее облачных API. 10-минутная запись занимает 1-2 минуты на iPhone 15. Облачные сервисы отвечают за секунды.
- • Потолок точности: Whisper достигает 95%+ точности на чёткой речи. Сильные акценты или значительный фоновый шум могут потребовать редактирования.
- • Платформа: Только Apple Silicon — Mac M1 и новее, iPhone с iOS 18+. Нет Android или Windows.
- • Транскрипция после записи: Whisper Notes транскрибирует после записи, а не во время. Это даёт более точные результаты.
Когда этот подход подходит
Whisper Notes хорошо подходит для:
- • Профессионалов, заботящихся о приватности: Юристы, медики, журналисты, терапевты
- • Личных размышлений: Дневник, захват идей, обработка мыслей
- • Офлайн-сред: Самолёты, защищённые объекты, нестабильное соединение
- • Уставших от подписок: Один платёж, постоянный доступ
Когда рассмотреть альтернативы
Облачные сервисы могут подойти лучше, если вам нужно:
- • Транскрипция в реальном времени с доступом для команды
- • Мгновенная обработка очень длинных записей
- • Поддержка Android или Windows
Итог
Whisper Notes построен на простой предпосылке: голосовые заметки личны, и вы должны контролировать, где это аудио находится. Мы выбрали local-first архитектуру не потому, что облачные сервисы плохи, а потому что некоторый контент заслуживает того, чтобы оставаться на вашем устройстве.
Whisper Large-v3 Turbo на Mac для точности. Оптимизированная мобильная модель на iPhone для быстрого захвата. Обе платформы обрабатывают полностью офлайн.
$4.99 один раз. iPhone и Mac. Ваше аудио принадлежит вам.