A privacidade da voz: porque escolhemos a arquitectura local
Não precisa de escolher entre conveniência e controlo.
Os memos de voz são diferentes
Os memos de voz são frequentemente desorganizados, não filtrados e pessoais. Capturam pensamentos em formação—ideias antes de serem polidas, frustrações antes de serem processadas, observações antes de serem estruturadas. Esta autenticidade crua é precisamente o que os torna valiosos.
Sentem-se diferentes de um documento polido. Esse sentimento importa.
Quando grava um memo de voz, está frequentemente a falar consigo próprio. A intimidade desse momento—as frases incompletas, os pensamentos errantes, a honestidade desprotegida—merece um certo respeito na forma como é tratado tecnicamente.
Uma questão de higiene digital
A sua voz é um identificador biométrico único. Ao contrário de uma palavra-passe, não pode redefini-la. Ao contrário de um número de cartão de crédito, não pode pedir um novo. Isto não é para assustar—é simplesmente uma propriedade dos dados de voz que vale a pena reconhecer.
Para a maioria das gravações quotidianas, o processamento na nuvem é perfeitamente aceitável. Mas para conteúdo sensível—reflexões pessoais, notas profissionais, conversas com clientes—manter os ficheiros de áudio brutos fora da nuvem é simplesmente boa higiene digital. É o mesmo princípio de não armazenar palavras-passe em texto simples: não porque o desastre seja iminente, mas porque uma arquitectura ponderada previne problemas antes de surgirem.
Construímos o Whisper Notes em torno deste princípio. O seu áudio permanece no seu dispositivo—não porque achamos que os serviços na nuvem são perigosos, mas porque deveria ter escolha.
A arquitectura
O Whisper Notes executa o modelo de reconhecimento de voz Whisper da OpenAI directamente no seu hardware. Não há componente de servidor. As suas gravações são processadas localmente e nunca são transmitidas para lado nenhum.
A implementação difere entre plataformas para optimizar as capacidades de cada dispositivo:
Mac: Whisper Large-v3 Turbo
No Mac, executamos Whisper Large-v3 Turbo—um modelo de 1,5 mil milhões de parâmetros optimizado para Apple Silicon. Isto proporciona precisão comparável aos serviços de transcrição na nuvem, com pontuação adequada e formatação inteligente de parágrafos.
A velocidade de processamento escala com o seu chip: máquinas M4 atingem cerca de 12x tempo real, enquanto chips M1 operam a cerca de 8x tempo real.
iPhone: Modelo Whisper optimizado para móvel
Os dispositivos móveis têm restrições diferentes—limites térmicos, duração da bateria, largura de banda de memória. Utilizamos um modelo Whisper optimizado para móvel, ajustado para o Neural Engine nos chips A e M.
Embora mais pequeno que o modelo Mac, produz texto estruturado e com pontuação que supera consistentemente o ditado padrão. O compromisso é honesto: para máxima precisão em gravações longas, processe no Mac. Para captura rápida, o modelo móvel funciona bem.
Concebido para velocidade
Boas ideias não esperam. Vêm enquanto conduz, caminha ou mesmo antes de adormecer. O widget do ecrã de bloqueio foi concebido para minimizar o atrito entre pensamento e gravação.
Widget do ecrã de bloqueio com Actividade em Directo
- • Activação com um toque: Comece a gravar directamente do ecrã de bloqueio
- • Actividade em Directo: Confirmação visual da duração da gravação na Dynamic Island
- • Face ID fluido: O widget funciona perfeitamente com autenticação Face ID
- • Amigável mãos-livres: Funciona com luvas, mãos molhadas ou gestos de toque dos AirPods
O fluxo de trabalho captura-revisão
O fluxo de trabalho mais eficaz para memos de voz separa a captura da revisão. Os dispositivos móveis destacam-se na gravação rápida; os ambientes de desktop na edição profunda.
iPhone: Captura
Use o iPhone para capturar pensamentos quando surgem. O widget do ecrã de bloqueio reduz o atrito a um único toque. O modelo móvel transcreve imediatamente, fornecendo texto utilizável no momento.
Mac: Revisão
No Mac, o Whisper Notes oferece ferramentas para trabalho profundo:
- • Processamento Large-v3 Turbo: Re-transcreva gravações com máxima precisão
- • Parágrafos com timestamps: Clique em qualquer parágrafo para saltar para esse momento no áudio
- • Reprodução sincronizada: O texto é destacado enquanto o áudio toca
- • Exportação flexível: Texto simples, formato com timestamps ou legendas SRT
- • Ditado do sistema: Mantenha Fn pressionado para ditar directamente em qualquer aplicação
Transcrição com timestamps e reprodução de áudio sincronizada
Paz de espírito
O verdadeiro benefício não é apenas segurança técnica—é psicológico.
Saber que o seu áudio nunca sai do dispositivo dá-lhe a liberdade de falar completamente à vontade, sem autocensura. Pode gravar pensamentos meio formados, desabafar frustrações, fazer brainstorm selvagem ou documentar assuntos profissionais sensíveis—tudo sem se perguntar quem poderá eventualmente aceder a esse áudio.
É a mesma razão pela qual alguns preferem escrever num caderno físico: não porque as notas digitais sejam perigosas, mas porque a sensação de privacidade muda quão livremente pensa.
O modelo económico
Como todo o processamento acontece no seu dispositivo, não há custos de servidor que escalem com o uso. Isto permite um modelo de compra única: 4,99 € para iPhone e Mac, para sempre.
Sem subscrições. Sem taxas por minuto. Sem limites de utilização.
Os compromissos honestos
O processamento local traz compromissos reais que vale a pena compreender:
Considerações
- • Velocidade de processamento: A inferência no dispositivo é mais lenta que as APIs na nuvem. Uma gravação de 10 minutos demora 1-2 minutos no iPhone 15. Os serviços na nuvem respondem em segundos.
- • Tecto de precisão: O Whisper atinge 95%+ de precisão em fala clara. Sotaques fortes ou ruído de fundo significativo podem requerer alguma edição.
- • Plataforma: Apenas Apple Silicon—Mac M1 ou mais recente, iPhone com iOS 18+. Sem Android ou Windows.
- • Transcrição pós-gravação: O Whisper Notes transcreve após gravar, não durante. Isto produz resultados mais precisos.
Quando esta abordagem se adequa
O Whisper Notes funciona bem para:
- • Profissionais conscientes da privacidade: Jurídico, médico, jornalismo, terapia
- • Reflexão pessoal: Diário, captura de ideias, processamento de pensamentos
- • Ambientes offline: Aviões, instalações seguras, conectividade não fiável
- • Utilizadores cansados de subscrições: Um pagamento, acesso permanente
Quando considerar alternativas
Os serviços na nuvem podem adequar-se melhor se precisar de:
- • Transcrição em tempo real partilhada com uma equipa
- • Processamento instantâneo de gravações muito longas
- • Suporte para Android ou Windows
Resumo
O Whisper Notes é construído sobre uma premissa simples: os memos de voz são pessoais, e você deveria controlar onde esse áudio reside. Escolhemos uma arquitectura local-first não porque os serviços na nuvem são maus, mas porque certo conteúdo merece ficar no seu dispositivo.
Whisper Large-v3 Turbo no Mac para precisão. Um modelo optimizado para móvel no iPhone para captura rápida. Ambas as plataformas processam completamente offline.
4,99 € uma vez. iPhone e Mac. O seu áudio é seu.