Приватність голосу: чому ми обрали локальну архітектуру
Не треба обирати між зручністю та контролем.
Голосові нотатки — це інше
Голосові нотатки часто хаотичні, нефільтровані та особисті. Вони фіксують думки в процесі формування — ідеї до шліфування, роздратування до обдумування, спостереження до структурування. Ця сирова автентичність — саме те, що робить їх цінними.
Вони відчуваються інакше, ніж відшліфований документ. Це відчуття важливе.
Коли ви записуєте голосову нотатку, часто говорите самі з собою. Інтимність цього моменту — незакінчені речення, відступи, незахищена чесність — заслуговує певної поваги в тому, як це обробляється технічно.
Питання цифрової гігієни
Ваш голос — унікальний біометричний ідентифікатор. На відміну від пароля, його не можна скинути. На відміну від номера картки, не можна запросити новий. Це не для того, щоб налякати — просто властивість голосових даних, яку варто усвідомити.
Для більшості повсякденних записів хмарна обробка цілком прийнятна. Але для чутливого контенту — особистих роздумів, робочих нотаток, розмов з клієнтами — зберігання сирих аудіофайлів поза хмарою — це просто хороша цифрова гігієна. Той самий принцип, що й з паролями у відкритому вигляді: не тому що катастрофа неминуча, а тому що продумана архітектура запобігає проблемам до їх появи.
Ми побудували Whisper Notes навколо цього принципу. Ваше аудіо залишається на вашому пристрої — не тому що ми вважаємо хмарні сервіси небезпечними, а тому що у вас має бути вибір.
Архітектура
Whisper Notes запускає модель розпізнавання мовлення Whisper від OpenAI безпосередньо на вашому обладнанні. Серверної складової немає. Ваші записи обробляються локально і ніколи нікуди не передаються.
Реалізація відрізняється між платформами для оптимізації можливостей кожного пристрою:
Mac: Whisper Large-v3 Turbo
На Mac ми запускаємо Whisper Large-v3 Turbo — модель з 1,5 мільярда параметрів, оптимізовану для Apple Silicon. Це забезпечує точність, порівнянну з хмарними сервісами транскрипції, з правильною пунктуацією та інтелектуальним форматуванням абзаців.
Швидкість обробки масштабується з чіпом: машини M4 досягають приблизно 12x реального часу, тоді як чіпи M1 працюють приблизно з 8x реального часу.
iPhone: Оптимізована мобільна модель Whisper
Мобільні пристрої мають інші обмеження — теплові ліміти, час роботи батареї, пропускна здатність пам'яті. Ми використовуємо оптимізовану мобільну модель Whisper, налаштовану для Neural Engine в чіпах A та M.
Хоча вона менша за модель для Mac, вона видає структурований текст з пунктуацією, який стабільно перевершує стандартну диктовку. Компроміс чесний: для максимальної точності довгих записів обробляйте на Mac. Для швидкого захоплення мобільна модель працює добре.
Спроектовано для швидкості
Хороші ідеї не чекають. Вони приходять за кермом, на прогулянці або перед сном. Віджет екрана блокування мінімізує тертя між думкою та записом.
Віджет екрана блокування з Live Activity
- • Активація одним дотиком: Почніть запис прямо з екрана блокування
- • Live Activity: Візуальне підтвердження тривалості запису в Dynamic Island
- • Безшовна робота з Face ID: Віджет плавно працює з автентифікацією Face ID
- • Робота без рук: Працює в рукавичках, з мокрими руками або жестами AirPods
Робочий процес: захоплення та перегляд
Найефективніший робочий процес для голосових нотаток розділяє захоплення та перегляд. Мобільні пристрої чудово підходять для швидкого запису; десктопи — для глибокого редагування.
iPhone: Захоплення
Використовуйте iPhone для захоплення думок у момент їх появи. Віджет екрана блокування зводить тертя до одного дотику. Мобільна модель транскрибує миттєво, даючи придатний текст на місці.
Mac: Перегляд
На Mac Whisper Notes пропонує інструменти для поглибленої роботи:
- • Обробка Large-v3 Turbo: Повторна транскрипція записів з максимальною точністю
- • Абзаци з таймкодами: Натисніть на будь-який абзац, щоб перейти до цього моменту в аудіо
- • Синхронне відтворення: Текст підсвічується під час відтворення аудіо
- • Гнучкий експорт: Простий текст, формат з таймкодами або субтитри SRT
- • Системна диктовка: Утримуйте Fn для диктовки в будь-який додаток
Транскрипція з таймкодами та синхронізованим відтворенням аудіо
Спокій душі
Справжня користь — не лише технічна безпека, вона психологічна.
Знаючи, що ваше аудіо ніколи не покидає пристрій, ви отримуєте свободу говорити цілком вільно, без самоцензури. Ви можете записувати наполовину сформовані думки, виплескувати роздратування, влаштовувати дикі мозкові штурми або документувати чутливі робочі питання — все це без роздумів про те, хто може в підсумку отримати доступ до цього аудіо.
Це та сама причина, чому деякі надають перевагу паперовому блокноту: не тому що цифрові нотатки небезпечні, а тому що відчуття приватності змінює те, наскільки вільно ви думаєте.
Економічна модель
Оскільки вся обробка відбувається на вашому пристрої, немає серверних витрат, що масштабуються з використанням. Це дозволяє модель одноразової покупки: $4.99 за iPhone та Mac, назавжди.
Без підписок. Без похвилинної оплати. Без лімітів використання.
Чесні компроміси
Локальна обробка тягне за собою реальні компроміси, які варто розуміти:
Що врахувати
- • Швидкість обробки: Інференс на пристрої повільніший за хмарні API. 10-хвилинний запис займає 1-2 хвилини на iPhone 15. Хмарні сервіси відповідають за секунди.
- • Стеля точності: Whisper досягає 95%+ точності на чіткому мовленні. Сильні акценти або значний фоновий шум можуть потребувати редагування.
- • Платформа: Тільки Apple Silicon — Mac M1 і новіше, iPhone з iOS 18+. Немає Android чи Windows.
- • Транскрипція після запису: Whisper Notes транскрибує після запису, а не під час. Це дає точніші результати.
Коли цей підхід підходить
Whisper Notes добре підходить для:
- • Професіоналів, що дбають про приватність: Юристи, медики, журналісти, терапевти
- • Особистих роздумів: Щоденник, захоплення ідей, обробка думок
- • Офлайн-середовищ: Літаки, захищені об'єкти, нестабільне з'єднання
- • Втомлених від підписок: Один платіж, постійний доступ
Коли розглянути альтернативи
Хмарні сервіси можуть підійти краще, якщо вам потрібно:
- • Транскрипція в реальному часі з доступом для команди
- • Миттєва обробка дуже довгих записів
- • Підтримка Android чи Windows
Підсумок
Whisper Notes побудований на простій передумові: голосові нотатки особисті, і ви повинні контролювати, де це аудіо знаходиться. Ми обрали local-first архітектуру не тому, що хмарні сервіси погані, а тому що деякий контент заслуговує залишатися на вашому пристрої.
Whisper Large-v3 Turbo на Mac для точності. Оптимізована мобільна модель на iPhone для швидкого захоплення. Обидві платформи обробляють повністю офлайн.
$4.99 один раз. iPhone та Mac. Ваше аудіо належить вам.