A privacidade da voz: por que escolhemos uma arquitetura local
Você não precisa escolher entre conveniência e controle.
Notas de voz são diferentes
Notas de voz costumam ser bagunçadas, sem filtro e pessoais. Capturam pensamentos em formação—ideias antes de serem polidas, frustrações antes de serem digeridas, observações antes de serem estruturadas. Essa autenticidade crua é exatamente o que as torna valiosas.
Elas têm uma sensação diferente de um documento polido. Essa sensação importa.
Quando você grava uma nota de voz, frequentemente está falando consigo mesmo. A intimidade daquele momento—as frases incompletas, as divagações, a honestidade desprotegida—merece um certo respeito em como é tratada tecnicamente.
Uma questão de higiene digital
Sua voz é um identificador biométrico único. Diferente de uma senha, você não pode redefini-la. Diferente de um número de cartão de crédito, você não pode solicitar um novo. Isso não é para alarmar—é simplesmente uma característica dos dados de voz que vale a pena reconhecer.
Para a maioria das gravações do dia a dia, o processamento na nuvem é perfeitamente aceitável. Mas para conteúdo sensível—reflexões pessoais, notas profissionais, conversas com clientes—manter arquivos de áudio brutos fora da nuvem é simplesmente boa higiene digital. É o mesmo princípio de não armazenar senhas em texto simples: não porque um desastre é iminente, mas porque uma arquitetura pensada previne problemas antes que eles surjam.
Construímos o Whisper Notes em torno desse princípio. Seu áudio permanece no seu dispositivo—não porque achamos que serviços na nuvem são perigosos, mas porque você deveria ter escolha.
A arquitetura
O Whisper Notes executa o modelo de reconhecimento de fala Whisper da OpenAI diretamente no seu hardware. Não há componente de servidor. Suas gravações são processadas localmente e nunca são transmitidas para lugar nenhum.
A implementação difere entre plataformas para otimizar as capacidades de cada dispositivo:
Mac: Whisper Large-v3 Turbo
No Mac, executamos o Whisper Large-v3 Turbo—um modelo de 1,5 bilhão de parâmetros otimizado para Apple Silicon. Isso oferece precisão comparável a serviços de transcrição na nuvem, com pontuação correta e formatação inteligente de parágrafos.
A velocidade de processamento escala com seu chip: máquinas M4 alcançam aproximadamente 12x tempo real, enquanto chips M1 operam a aproximadamente 8x tempo real.
iPhone: Modelo Whisper otimizado para mobile
Dispositivos móveis têm restrições diferentes—limites térmicos, duração da bateria, largura de banda de memória. Usamos um modelo Whisper otimizado para mobile, ajustado para o Neural Engine nos chips A e M.
Embora menor que o modelo do Mac, produz texto estruturado e pontuado que supera consistentemente o ditado padrão. O compromisso é honesto: para máxima precisão em gravações longas, processe no Mac. Para captura rápida, o modelo mobile funciona bem.
Projetado para velocidade
Boas ideias não esperam. Elas chegam enquanto você dirige, caminha, ou logo antes de dormir. O widget da tela de bloqueio é projetado para minimizar o atrito entre o pensamento e a gravação.
Widget da tela de bloqueio com Live Activity
- • Ativação com um toque: Comece a gravar diretamente da tela de bloqueio
- • Live Activity: Confirmação visual da duração da gravação na Dynamic Island
- • Face ID fluido: O widget funciona perfeitamente com a autenticação Face ID
- • Compatível com mãos livres: Funciona com luvas, mãos molhadas ou gestos de toque dos AirPods
O fluxo de trabalho captura-revisão
O fluxo de trabalho mais eficaz para notas de voz separa a captura da revisão. Dispositivos móveis se destacam na gravação rápida; ambientes desktop na edição profunda.
iPhone: Captura
Use o iPhone para capturar pensamentos quando surgirem. O widget da tela de bloqueio reduz o atrito a um único toque. O modelo mobile transcreve instantaneamente, fornecendo texto utilizável na hora.
Mac: Revisão
No Mac, o Whisper Notes oferece ferramentas para trabalho profundo:
- • Processamento Large-v3 Turbo: Re-transcreva gravações com precisão máxima
- • Parágrafos com timestamps: Clique em qualquer parágrafo para pular para aquele momento no áudio
- • Reprodução sincronizada: O texto é destacado enquanto o áudio é reproduzido
- • Exportação flexível: Texto simples, formato com timestamps, ou legendas SRT
- • Ditado do sistema: Segure Fn para ditar diretamente em qualquer app
Transcrição com timestamps e reprodução de áudio sincronizada
Paz de espírito
O benefício real não é apenas segurança técnica—é psicológico.
Saber que seu áudio nunca sai do seu dispositivo te dá a liberdade de falar completamente livre, sem autocensura. Você pode gravar pensamentos meio formados, desabafar frustrações, fazer brainstorms selvagens, ou documentar questões profissionais sensíveis—tudo sem se perguntar quem poderia eventualmente acessar aquele áudio.
É a mesma razão pela qual algumas pessoas preferem escrever em um caderno físico: não porque notas digitais são perigosas, mas porque a sensação de privacidade muda o quão livremente você pensa.
O modelo econômico
Como todo o processamento acontece no seu dispositivo, não há custos de servidor que escalam com o uso. Isso permite um modelo de compra única: R$ 24,90 para iPhone e Mac, para sempre.
Sem assinaturas. Sem taxas por minuto. Sem limites de uso.
Os compromissos honestos
O processamento local vem com compromissos reais que vale a pena entender:
Considerações
- • Velocidade de processamento: A inferência no dispositivo é mais lenta que APIs na nuvem. Uma gravação de 10 minutos leva 1-2 minutos no iPhone 15. Serviços na nuvem respondem em segundos.
- • Teto de precisão: O Whisper alcança 95%+ de precisão em fala clara. Sotaques fortes ou ruído de fundo significativo podem exigir alguma edição.
- • Plataforma: Apenas Apple Silicon—Mac M1 ou mais recente, iPhone com iOS 18+. Sem Android ou Windows.
- • Transcrição pós-gravação: O Whisper Notes transcreve após a gravação, não durante. Isso produz resultados mais precisos.
Quando essa abordagem é adequada
O Whisper Notes funciona bem para:
- • Profissionais conscientes de privacidade: Jurídico, médico, jornalismo, terapia
- • Reflexão pessoal: Diário, captura de ideias, processamento de pensamentos
- • Ambientes offline: Aviões, instalações seguras, conexão não confiável
- • Usuários cansados de assinaturas: Um pagamento, acesso permanente
Quando considerar alternativas
Serviços na nuvem podem ser mais adequados se você precisa de:
- • Transcrição em tempo real compartilhada com uma equipe
- • Processamento instantâneo de gravações muito longas
- • Suporte para Android ou Windows
Resumo
O Whisper Notes é construído sobre uma premissa simples: notas de voz são pessoais, e você deveria controlar onde esse áudio reside. Escolhemos uma arquitetura local-first não porque serviços na nuvem são ruins, mas porque certo conteúdo merece ficar no seu dispositivo.
Whisper Large-v3 Turbo no Mac para precisão. Um modelo otimizado para mobile no iPhone para captura rápida. Ambas as plataformas processam completamente offline.
R$ 24,90 uma vez. iPhone e Mac. Seu áudio é seu.