Transcreva sua voz em texto.
Sem enviar nada para a nuvem.

Push to Talk é uma ferramenta de transcrição de voz que roda 100% no seu computador. Você pressiona uma tecla, fala, e o texto aparece onde seu cursor está. Simples assim.

Diferente de outras soluções que enviam seu áudio para servidores externos, aqui tudo acontece localmente. Seu áudio nunca sai da sua máquina. A transcrição usa o modelo Whisper da OpenAI, compilado em C++ para rodar nativamente no seu hardware.

Baixar gratuitamente Ver como funciona

100% offline

Funciona sem internet

Open source

MIT License

Multiplataforma

Mac, Windows, Linux

Como funciona

O Push to Talk funciona em qualquer aplicativo do seu sistema. Editores de texto, navegadores, apps de mensagem, IDEs — onde você puder digitar, você pode usar o Push to Talk.

1

Configure seu atalho

Por padrão, o atalho é a tecla Option ⌥ no Mac ou Alt no Windows/Linux. Você pode mudar para qualquer combinação que preferir nas configurações do app.

2

Pressione e fale

Quando precisar transcrever, mantenha a tecla pressionada e fale normalmente. O app começa a gravar seu áudio imediatamente. Fale em português, inglês, espanhol, ou qualquer um dos mais de 90 idiomas suportados pelo Whisper.

3

Solte e o texto aparece

Quando você solta a tecla, o áudio é processado localmente pelo Whisper.cpp e o texto resultante é inserido diretamente no campo onde seu cursor está. Não é copiado para a área de transferência — ele simplesmente aparece como se você tivesse digitado.

Por que usar o Push to Talk

Existem muitas ferramentas de transcrição. Mas a maioria delas funciona enviando seu áudio para a nuvem. Isso significa latência, custos recorrentes, e — principalmente — seus dados passando por servidores de terceiros.

Privacidade real

Seu áudio nunca sai do seu computador. O modelo de IA roda localmente — não há requisições HTTP, não há upload de dados, não há telemetria. Quando você fecha o app, nada fica armazenado. Isso é especialmente importante se você trabalha com informações sensíveis, contratos, dados de clientes, ou simplesmente valoriza sua privacidade.

Velocidade nativa

O Whisper.cpp é uma implementação em C++ do modelo Whisper. Ele roda diretamente no seu processador — sem intermediários, sem latência de rede. Em um Mac com Apple Silicon, a transcrição de 10 segundos de áudio leva menos de 1 segundo. Você solta a tecla e o texto já está lá.

Sem custos recorrentes

APIs de transcrição cobram por minuto de áudio processado. Se você usa bastante, a conta cresce rápido. Push to Talk é gratuito — não há assinatura, não há créditos, não há limites. Use o dia inteiro, todos os dias, por anos. O custo é zero.

Funciona offline

Uma vez instalado, o Push to Talk não precisa de internet para funcionar. Você pode usar no avião, no metrô, em uma cafeteria sem Wi-Fi, ou em qualquer situação onde não há conexão. O modelo já está no seu computador.

Comparando com alternativas

Veja como o Push to Talk se compara com as soluções mais populares de transcrição de voz.

Recurso	Push to Talk	Whisper API	Google Speech	Otter.ai
Processamento	Local	Nuvem	Nuvem	Nuvem
Privacidade	Total	Dados enviados	Dados enviados	Dados armazenados
Custo mensal	Grátis	~$6/hora	~$1.44/hora	$16.99+/mês
Funciona offline	Sim	Não	Não	Não
Código aberto	Sim	Não	Não	Não

Para quem é o Push to Talk

Se você digita muito, provavelmente vai se beneficiar. Aqui estão alguns casos de uso comuns:

Desenvolvedores

Escreva comentários, documentação, mensagens de commit, respostas em pull requests, e qualquer texto que interrompa seu fluxo de código. Fale em vez de alternar contexto para digitar.

Escritores e jornalistas

Capture ideias rapidamente, faça rascunhos de artigos, transcreva entrevistas. Sua mente pensa mais rápido que seus dedos — use a voz para acompanhar.

Profissionais de suporte

Responda tickets, documente interações, escreva notas de follow-up. Economize tempo em tarefas repetitivas de escrita sem comprometer a qualidade.

Pessoas com RSI ou lesões

Se digitar causa desconforto ou dor, a transcrição por voz pode ser uma alternativa para continuar produtivo enquanto descansa as mãos.

Quem trabalha com dados sensíveis

Advogados, médicos, contadores — profissões onde a confidencialidade é crítica. Aqui, nenhum dado sai do seu computador.

Qualquer pessoa que digita muito

E-mails, mensagens, documentos, notas. Se você passa horas por dia digitando, considere quanto tempo pode economizar falando.

Perguntas frequentes

Qual a qualidade da transcrição?

O Push to Talk usa o modelo Whisper (base) da OpenAI, que é considerado um dos melhores modelos de transcrição disponíveis. A qualidade é excelente para português, inglês, e a maioria dos idiomas europeus. Para áudio claro sem muito ruído de fundo, a precisão geralmente está acima de 95%.

O app funciona em segundo plano?

Sim. O Push to Talk roda na sua barra de menu (Mac) ou system tray (Windows/Linux). Ele fica sempre disponível esperando você pressionar o atalho, sem janelas abertas ocupando espaço.

Quanto espaço o app ocupa?

O aplicativo com o modelo Whisper incluído ocupa aproximadamente 150MB. Isso porque o modelo de IA precisa estar localmente no seu computador para funcionar offline.

Funciona com qualquer microfone?

Sim. O app usa o microfone padrão do seu sistema. Pode ser o microfone integrado do laptop, um headset USB, AirPods, ou qualquer dispositivo de entrada de áudio que seu sistema operacional reconheça.

O código é realmente open source?

Sim. O código completo está disponível no GitHub sob licença MIT. Você pode auditar, modificar, e distribuir como quiser. Transparência total.

Baixe o Push to Talk

A instalação leva menos de um minuto. Baixe, abra, e comece a usar. Sem cadastro, sem configuração complexa.

Baixar última versão Ver código no GitHub

Disponível para macOS (Intel e Apple Silicon), Windows 10/11, e Linux (Debian/Ubuntu). Licença MIT — gratuito para uso pessoal e comercial.

Transcreva sua voz em texto. Sem enviar nada para a nuvem.