Modo de Voz do Claude Code
Digite /voice, segure espaço, fale, solte. As palavras faladas aparecem no cursor no meio do prompt, então você pode misturar input digitado e por voz sem trocar de modo.
Pare de configurar. Comece a construir.
Templates SaaS com orquestração de IA.
Problema: Você está olhando para um bug complexo e sabe exatamente o que quer que Claude faça. Traduzir esse modelo mental em um prompt digitado leva muito mais tempo do que deveria. Você acaba cortando o pedido porque digitar todo o contexto, as nuances, os qualificadores "tente isso mas não aquilo", parece rascunhar um mini-ensaio. A lacuna entre o que você está pensando e o que você digita custa clareza e tempo.
Ganho Rápido: Digite /voice para ativar o modo de voz. Segure espaço, fale seu pensamento, solte o espaço. Suas palavras faladas aparecem como texto no cursor. Você pode digitar metade de um prompt, falar a parte complicada do meio e continuar digitando. Sem troca de modo. Sem perda de contexto.
# Enable voice mode
/voice
# Then hold spacebar to talk, release to send
# Your transcript appears at cursor positionO modo de voz do Claude Code está sendo liberado agora, começando com cerca de 5% dos usuários e expandindo nas próximas semanas. Está disponível nos planos Pro, Max, Team e Enterprise. Se você tiver acesso, uma nota na tela de boas-vindas aparece na próxima vez que você lançar o Claude Code. Novo no terminal? Comece com o modelo de desenvolvimento terminal-first para ver como o modelo de execução do Claude Code funciona.
Como o Modo de Voz do Claude Code Funciona
O modo de voz no Claude Code funciona com push-to-talk. Sem modo always-listening. Sem wake word. Sem transcrição ambiente. Você decide exatamente quando o microfone está ativo.
A mecânica é simples:
| Ação | O Que Acontece |
|---|---|
/voice | Liga ou desliga o modo de voz |
| Segure espaço | Microfone ativa, começa a ouvir |
| Solte espaço | Transcrição roda e texto aparece no cursor |
| Continue digitando | Input de texto e voz se combinam num único prompt |
Solte o espaço e suas palavras faladas são transcritas e inseridas onde seu cursor estiver no input. Esse é o ponto que importa: a voz não substitui seu input atual. Ela insere nele. Digite a primeira metade de um prompt, segure espaço para o resto, e a transcrição cai logo após o texto que você digitou.
A transcrição roda rápido o suficiente para parecer uma extensão natural da digitação. Você fala, solta, o texto está lá. Sem UI separada, sem popup, sem diálogo de confirmação.
Transcrição e Rate Limits
Um detalhe prático que vale saber: tokens de transcrição não contam contra seus rate limits. O modo de voz não tem custo extra em nenhum plano. A transcrição roda separada dos tokens de modelo que Claude gasta em respostas. Você pode usar voz para prompts longos e detalhados sem queimar sua cota de uso mais rápido.
Input Híbrido: A Feature Que Realmente Importa
A feature principal do modo de voz não é a voz. É a capacidade de misturar input digitado e falado em um único prompt sem que um atrapalhe o outro.
Veja como isso parece na prática:
[Type]: "Refactor the auth middleware in src/middleware/auth.ts to "
[Voice]: "handle the edge case where the JWT token is expired but
the refresh token is still valid, and make sure we're not
hitting the database twice during that flow"
[Type]: " -- keep the existing error codes"Toda essa sequência forma um prompt. As partes digitadas te dão precisão para caminhos de arquivo, nomes de variáveis e restrições específicas. A parte falada deixa você despejar a lógica complexa sem parar para pensar em como estruturar uma frase.
Esse modelo híbrido resolve um problema real. Contexto de engenharia para Claude geralmente significa carregar detalhes técnicos precisos e intenção vaga na mesma mensagem. Digitar se encaixa nas partes precisas. Falar se encaixa nas partes vagas. Agora você não precisa escolher.
Quando o Input Híbrido Brilha
Descrevendo bugs que você vê mas luta para digitar: "O dropdown renderiza corretamente no primeiro carregamento mas [voice] quando você navega para longe e volta o estado reseta e o item selecionado volta para o padrão mesmo que os params da URL ainda tenham o valor certo [/voice] -- verifique a limpeza do useEffect em FilterPanel.tsx"
Explicando decisões de arquitetura: Digite os caminhos de arquivo e nomes de funções, use voz para o raciocínio da abordagem que você quer. Especificidades técnicas ficam precisas. Raciocínio flui naturalmente.
Ditando cenários de teste: Digite o boilerplate do framework de testes, use voz para os edge cases que você quer cobrir. "Também deve tratar [voice] o caso onde o usuário tem múltiplas sessões abertas e submete o formulário de uma aba obsoleta depois que a sessão foi atualizada em outra aba [/voice]"
Casos de Uso Práticos para o Modo de Voz
O modo de voz se encaixa em alguns fluxos melhor do que outros. Essas são as situações onde falar genuinamente supera digitar.
Sessões de Prototipação Rápida
Quando você está iterando rápido e pulando entre ideias, digitar te força a se comprometer com uma estrutura antes de terminar de pensar. A voz deixa você falar a abordagem enquanto ainda está se formando. "Tente construir isso como um componente React primeiro, mas se o gerenciamento de estado ficar complicado, mude para uma abordagem em vanilla JS com um padrão pub-sub simples." Esse tipo de instrução exploratória sai mais rápido falada do que digitada.
Relatórios de Bug com Muito Contexto
Debugando algo e precisa dar a Claude o quadro completo? O modo de voz te deixa narrar o que você está vendo, o que tentou e o que suspeita, tudo de uma vez. Combinado com o planning mode para a fase de análise, você pode ditar um relatório de bug detalhado por voz e ter Claude planejar a correção antes de uma linha de código mudar.
Feedback de Code Review
Quando você está revisando diffs e quer que Claude trate de problemas específicos: digite o caminho do arquivo, use voz para o feedback. "Nesta função [voice] o tratamento de erro está engolindo exceções silenciosamente e quero que todo bloco catch pelo menos registre o erro com o contexto da requisição antes de continuar [/voice] -- aplique isso em todos os route handlers."
Acessibilidade
Para desenvolvedores que acham a digitação prolongada desconfortável ou que pensam melhor verbalmente, o modo de voz torna as sessões do Claude Code menos exigentes fisicamente. Push-to-talk significa que você controla o ritmo. Você pode alternar entre digitar e falar com base no que se encaixa em cada parte do prompt.
Limitações Atuais
O modo de voz é novo. Algumas restrições vale saber antes de incorporá-lo ao seu fluxo diário.
Liberação gradual. Apenas cerca de 5% dos usuários têm acesso hoje. Anthropic está expandindo a disponibilidade nas próximas semanas para Pro, Max, Team e Enterprise. Se a tela de boas-vindas não aparecer, ou /voice não responder, você ainda não está no grupo de liberação.
Apenas push-to-talk. Sem modo mãos-livres. Sem modo always-listening. Segure espaço para falar, solte para parar. Essa é uma escolha de design deliberada para um terminal onde gatilhos de voz acidentais seriam um pesadelo.
Sem suporte ao Agent SDK. Construindo fluxos programáticos pelo Claude Code SDK? O modo de voz não está disponível lá. É uma feature interativa somente no terminal por enquanto.
Inglês assumido. Anthropic não confirmou explicitamente restrições de idioma para a feature de voz do CLI, mas a liberação inicial parece focada em transcrição em inglês.
Modo de Voz no Claude Code vs Claude.ai
Vale destacar: Claude também tem um modo de voz separado nos apps web e mobile em claude.ai. É uma feature diferente. A versão web/mobile inclui modo de conversa mãos-livres, seleção de voz predefinida e diálogo contínuo de ida e volta. O modo de voz do Claude Code é feito para o terminal: input push-to-talk que produz texto, não uma interface de voz conversacional. Eles resolvem problemas diferentes em contextos diferentes.
Dicas para Input de Voz Eficaz
Digite caminhos de arquivo e nomes, não fale. A transcrição de voz estraga caminhos como src/components/AuthProvider.tsx. Digite as partes precisas, use voz para as instruções.
Coloque a ação na frente. Comece o input de voz com o que você quer feito, depois adicione contexto. "Refatore essa função para usar async/await" é mais fácil de Claude processar do que dois minutos de stream of consciousness que termina com "então sim, torne assíncrono."
Combine com fast mode para iteração rápida. Ative o fast mode para respostas mais rápidas, depois use voz para disparar prompts sem o custo de digitação. Saída mais rápida mais input mais rápido comprime o ciclo de feedback drasticamente.
Use voz para o "por quê" e digitação para o "o quê". Digite: update src/api/routes.ts. Voz: "porque o tratamento de erro atual não distingue entre falhas de auth e timeouts de rede, e consumidores downstream precisam de comportamento de retry diferente para cada um." Esse padrão dá ao Claude precisão e intenção.
Próximos Passos
- Navegue a referência completa de modo interativo para atalhos de teclado, perguntas laterais /btw, modo vim e todo slash command
- Aprenda context engineering para estruturar prompts eficazes, sejam digitados ou falados
- Use o planning mode junto com voz para análise complexa antes da implementação
- Explore o fast mode para combinar saída mais rápida com input mais rápido por voz
- Leia sobre o modelo de desenvolvimento terminal-first que o modo de voz constrói sobre
- Confira os comandos /simplify e /batch para mais fluxos agrupados lançados em releases recentes
O modo de voz é o tipo de feature que parece menor até você usar por um dia e não conseguir mais viver sem. O modelo de input híbrido, onde precisão digitada encontra fluência falada, corresponde a como desenvolvedores realmente pensam sobre código. Você não pensa em texto puro nem em fala pura. Você pensa numa mistura de especificidades e intenção. Agora seu input no terminal funciona da mesma forma.
Pare de configurar. Comece a construir.
Templates SaaS com orquestração de IA.
Referência do Modo Interativo do Claude Code
Atalhos, modos e comandos de barra que a maioria dos utilizadores do Claude Code nunca encontra. Ctrl+F mata agentes em segundo plano, /btw faz perguntas laterais, /vim ativa a edição modal.
Revisão de Diff no Claude Code
Quatro teclas controlam cada mudança de arquivo que Claude Code propõe: y aprova, n rejeita, d mostra o diff, e abre a edição. Ferramentas internas Write e Edit explicadas.