Push to Talk é uma ferramenta de transcrição de voz que roda 100% no seu computador. Você pressiona uma tecla, fala, e o texto aparece onde seu cursor está. Simples assim.
Diferente de outras soluções que enviam seu áudio para servidores externos, aqui tudo acontece localmente. Seu áudio nunca sai da sua máquina. A transcrição usa o modelo Whisper da OpenAI, compilado em C++ para rodar nativamente no seu hardware.
100% offline
Funciona sem internet
Open source
MIT License
Multiplataforma
Mac, Windows, Linux
O Push to Talk funciona em qualquer aplicativo do seu sistema. Editores de texto, navegadores, apps de mensagem, IDEs — onde você puder digitar, você pode usar o Push to Talk.
Por padrão, o atalho é a tecla Option ⌥ no Mac ou Alt no Windows/Linux. Você pode mudar para qualquer combinação que preferir nas configurações do app.
Quando precisar transcrever, mantenha a tecla pressionada e fale normalmente. O app começa a gravar seu áudio imediatamente. Fale em português, inglês, espanhol, ou qualquer um dos mais de 90 idiomas suportados pelo Whisper.
Quando você solta a tecla, o áudio é processado localmente pelo Whisper.cpp e o texto resultante é inserido diretamente no campo onde seu cursor está. Não é copiado para a área de transferência — ele simplesmente aparece como se você tivesse digitado.
Existem muitas ferramentas de transcrição. Mas a maioria delas funciona enviando seu áudio para a nuvem. Isso significa latência, custos recorrentes, e — principalmente — seus dados passando por servidores de terceiros.
Seu áudio nunca sai do seu computador. O modelo de IA roda localmente — não há requisições HTTP, não há upload de dados, não há telemetria. Quando você fecha o app, nada fica armazenado. Isso é especialmente importante se você trabalha com informações sensíveis, contratos, dados de clientes, ou simplesmente valoriza sua privacidade.
O Whisper.cpp é uma implementação em C++ do modelo Whisper. Ele roda diretamente no seu processador — sem intermediários, sem latência de rede. Em um Mac com Apple Silicon, a transcrição de 10 segundos de áudio leva menos de 1 segundo. Você solta a tecla e o texto já está lá.
APIs de transcrição cobram por minuto de áudio processado. Se você usa bastante, a conta cresce rápido. Push to Talk é gratuito — não há assinatura, não há créditos, não há limites. Use o dia inteiro, todos os dias, por anos. O custo é zero.
Uma vez instalado, o Push to Talk não precisa de internet para funcionar. Você pode usar no avião, no metrô, em uma cafeteria sem Wi-Fi, ou em qualquer situação onde não há conexão. O modelo já está no seu computador.
Veja como o Push to Talk se compara com as soluções mais populares de transcrição de voz.
| Recurso | Push to Talk | Whisper API | Google Speech | Otter.ai |
|---|---|---|---|---|
| Processamento | Local | Nuvem | Nuvem | Nuvem |
| Privacidade | Total | Dados enviados | Dados enviados | Dados armazenados |
| Custo mensal | Grátis | ~$6/hora | ~$1.44/hora | $16.99+/mês |
| Funciona offline | Sim | Não | Não | Não |
| Código aberto | Sim | Não | Não | Não |
Se você digita muito, provavelmente vai se beneficiar. Aqui estão alguns casos de uso comuns:
Escreva comentários, documentação, mensagens de commit, respostas em pull requests, e qualquer texto que interrompa seu fluxo de código. Fale em vez de alternar contexto para digitar.
Capture ideias rapidamente, faça rascunhos de artigos, transcreva entrevistas. Sua mente pensa mais rápido que seus dedos — use a voz para acompanhar.
Responda tickets, documente interações, escreva notas de follow-up. Economize tempo em tarefas repetitivas de escrita sem comprometer a qualidade.
Se digitar causa desconforto ou dor, a transcrição por voz pode ser uma alternativa para continuar produtivo enquanto descansa as mãos.
Advogados, médicos, contadores — profissões onde a confidencialidade é crítica. Aqui, nenhum dado sai do seu computador.
E-mails, mensagens, documentos, notas. Se você passa horas por dia digitando, considere quanto tempo pode economizar falando.
O Push to Talk usa o modelo Whisper (base) da OpenAI, que é considerado um dos melhores modelos de transcrição disponíveis. A qualidade é excelente para português, inglês, e a maioria dos idiomas europeus. Para áudio claro sem muito ruído de fundo, a precisão geralmente está acima de 95%.
Sim. O Push to Talk roda na sua barra de menu (Mac) ou system tray (Windows/Linux). Ele fica sempre disponível esperando você pressionar o atalho, sem janelas abertas ocupando espaço.
O aplicativo com o modelo Whisper incluído ocupa aproximadamente 150MB. Isso porque o modelo de IA precisa estar localmente no seu computador para funcionar offline.
Sim. O app usa o microfone padrão do seu sistema. Pode ser o microfone integrado do laptop, um headset USB, AirPods, ou qualquer dispositivo de entrada de áudio que seu sistema operacional reconheça.
Sim. O código completo está disponível no GitHub sob licença MIT. Você pode auditar, modificar, e distribuir como quiser. Transparência total.
A instalação leva menos de um minuto. Baixe, abra, e comece a usar. Sem cadastro, sem configuração complexa.
Disponível para macOS (Intel e Apple Silicon), Windows 10/11, e Linux (Debian/Ubuntu). Licença MIT — gratuito para uso pessoal e comercial.