Transcrição Offline
Por que finalmente funciona
Durante anos, a transcrição local significava mais lenta e pior. Isso mudou.

Um pouco de contexto
Há alguns anos, se quisesse transcrição precisa, tinha de carregar o seu áudio para o servidor de outra pessoa. Existiam opções locais, mas eram notavelmente piores. O compromisso era real.
Depois aconteceram algumas coisas. A OpenAI lançou o Whisper como modelo aberto. A Apple começou a enviar chips com hardware AI dedicado. De repente, os mesmos modelos que alimentavam os serviços cloud podiam correr num portátil.
Começámos a desenvolver o Whisper Notes por volta dessa altura, principalmente porque precisávamos dele nós próprios. Descobriu-se que muitas pessoas procuravam a mesma coisa.
O que mudou
Três coisas faziam da transcrição cloud a escolha óbvia. As três mudaram.
Poder de computação
Os modelos AI que fazem transcrição são grandes—centenas de milhões de parâmetros. Executá-los era lento e gastava bateria em hardware de consumo.
O Neural Engine da Apple mudou isso. É um chip dedicado para cargas de trabalho AI, e está em cada Mac série M e iPhone recente. O Whisper Large v3 Turbo agora corre confortavelmente num MacBook Air.
Em telefones, usamos modelos mais pequenos optimizados para chips móveis. Não são tão precisos como o modelo grande, mas ainda são melhores que a maioria do ditado integrado.
Precisão
Isto surpreendeu-nos. Esperávamos que os modelos locais fossem "suficientemente bons". Na verdade são bastante bons.
O Whisper Large v3 tem taxas de erro de palavras mais baixas que a maioria do ditado do sistema. E a diferença entre APIs locais e cloud ficou bastante pequena. Para a maioria dos casos, provavelmente não notará a diferença.
Isso muda o cálculo. Se a precisão é comparável, a razão principal para carregar áudio desaparece.
Privacidade
Não estamos aqui para o assustar sobre serviços cloud. A maioria lida com dados de forma responsável.
Mas há uma diferença entre "prometem não abusar" e "nunca tiveram". A sua voz é biométrica—ao contrário de uma palavra-passe, não pode mudá-la se algo correr mal.
Com transcrição local, o seu áudio fica no seu dispositivo. Não encriptado-depois-carregado. Simplesmente... fica. Para algumas pessoas isso importa muito. Para outras, talvez não. Construímos para o primeiro grupo.
Quando usar o quê
O local nem sempre é a escolha certa. É assim que pensamos sobre isso.
Precisa de colaboração em tempo real?
Ferramentas cloud como Otter são feitas para isso. Várias pessoas a editar a mesma transcrição precisam de um servidor central. Esse é um bom uso de cloud.
Usa Windows ou Android?
AI local é mais difícil nessas plataformas—o suporte de hardware ainda não está maduro. Dragon funciona para Windows. Em Android, serviços cloud são geralmente a escolha prática.
Precisa de saber quem disse o quê?
Identificação de falantes (diarização) requer modelos adicionais. Serviços cloud como Rev lidam bem com isso. Ferramentas locais estão a alcançar, mas é ainda uma área onde cloud tem vantagem.
Só precisa de transcrição privada e precisa?
É nisso que nos focámos. Se as suas principais preocupações são privacidade e precisão, e está em hardware Apple, o local agora funciona bem.
O que o Whisper Notes faz
Corre Whisper Large v3 Turbo no seu Mac, ou um modelo mais pequeno optimizado no seu iPhone. O seu áudio nunca sai do dispositivo.
Em Mac, a transcrição corre a cerca de 10-15 vezes a velocidade real usando o Neural Engine. Uma gravação de uma hora demora alguns minutos. Em iPhone é mais lento, mas prático para a maioria das gravações.
$4,99 uma vez, para ambas as plataformas. Não gerimos servidores, por isso não precisamos de subscrições. É isso.
A versão curta
A transcrição local costumava ser um compromisso. Agora é uma escolha padrão razoável para muitas pessoas.
Se precisa de colaboração ou trabalha em plataformas não-Apple, serviços cloud ainda fazem sentido. Se quer principalmente transcrição precisa e privada num Mac ou iPhone, a opção local ficou bastante boa.
Nós usamos o Whisper Notes todos os dias. Faz o que precisávamos.
Experimente
Pode testar em modo avião se quiser verificar que nada é carregado. Tudo funciona igual.
App Store • $4.99 • Mac e iPhone
Uma compra cobre ambas as plataformas.