Modo de Voz do Claude Code

Problema: Você está olhando para um bug complexo e sabe exatamente o que quer que Claude faça. Traduzir esse modelo mental em um prompt digitado leva muito mais tempo do que deveria. Você acaba cortando o pedido porque digitar todo o contexto, as nuances, os qualificadores "tente isso mas não aquilo", parece rascunhar um mini-ensaio. A lacuna entre o que você está pensando e o que você digita custa clareza e tempo.

Ganho Rápido: Digite /voice para ativar o modo de voz. Segure espaço, fale seu pensamento, solte o espaço. Suas palavras faladas aparecem como texto no cursor. Você pode digitar metade de um prompt, falar a parte complicada do meio e continuar digitando. Sem troca de modo. Sem perda de contexto.

# Enable voice mode
/voice
 
# Then hold spacebar to talk, release to send
# Your transcript appears at cursor position

O modo de voz do Claude Code está sendo liberado agora, começando com cerca de 5% dos usuários e expandindo nas próximas semanas. Está disponível nos planos Pro, Max, Team e Enterprise. Se você tiver acesso, uma nota na tela de boas-vindas aparece na próxima vez que você lançar o Claude Code. Novo no terminal? Comece com o modelo de desenvolvimento terminal-first para ver como o modelo de execução do Claude Code funciona.

Como o Modo de Voz do Claude Code Funciona

O modo de voz no Claude Code funciona com push-to-talk. Sem modo always-listening. Sem wake word. Sem transcrição ambiente. Você decide exatamente quando o microfone está ativo.

A mecânica é simples:

Ação	O Que Acontece
`/voice`	Liga ou desliga o modo de voz
Segure espaço	Microfone ativa, começa a ouvir
Solte espaço	Transcrição roda e texto aparece no cursor
Continue digitando	Input de texto e voz se combinam num único prompt

Solte o espaço e suas palavras faladas são transcritas e inseridas onde seu cursor estiver no input. Esse é o ponto que importa: a voz não substitui seu input atual. Ela insere nele. Digite a primeira metade de um prompt, segure espaço para o resto, e a transcrição cai logo após o texto que você digitou.

A transcrição roda rápido o suficiente para parecer uma extensão natural da digitação. Você fala, solta, o texto está lá. Sem UI separada, sem popup, sem diálogo de confirmação.

Transcrição e Rate Limits

Um detalhe prático que vale saber: tokens de transcrição não contam contra seus rate limits. O modo de voz não tem custo extra em nenhum plano. A transcrição roda separada dos tokens de modelo que Claude gasta em respostas. Você pode usar voz para prompts longos e detalhados sem queimar sua cota de uso mais rápido.

Input Híbrido: A Feature Que Realmente Importa

A feature principal do modo de voz não é a voz. É a capacidade de misturar input digitado e falado em um único prompt sem que um atrapalhe o outro.

Veja como isso parece na prática:

[Type]: "Refactor the auth middleware in src/middleware/auth.ts to "
[Voice]: "handle the edge case where the JWT token is expired but
         the refresh token is still valid, and make sure we're not
         hitting the database twice during that flow"
[Type]: " -- keep the existing error codes"

Toda essa sequência forma um prompt. As partes digitadas te dão precisão para caminhos de arquivo, nomes de variáveis e restrições específicas. A parte falada deixa você despejar a lógica complexa sem parar para pensar em como estruturar uma frase.

Esse modelo híbrido resolve um problema real. Contexto de engenharia para Claude geralmente significa carregar detalhes técnicos precisos e intenção vaga na mesma mensagem. Digitar se encaixa nas partes precisas. Falar se encaixa nas partes vagas. Agora você não precisa escolher.

Quando o Input Híbrido Brilha

Descrevendo bugs que você vê mas luta para digitar: "O dropdown renderiza corretamente no primeiro carregamento mas [voice] quando você navega para longe e volta o estado reseta e o item selecionado volta para o padrão mesmo que os params da URL ainda tenham o valor certo [/voice] -- verifique a limpeza do useEffect em FilterPanel.tsx"

Explicando decisões de arquitetura: Digite os caminhos de arquivo e nomes de funções, use voz para o raciocínio da abordagem que você quer. Especificidades técnicas ficam precisas. Raciocínio flui naturalmente.

Ditando cenários de teste: Digite o boilerplate do framework de testes, use voz para os edge cases que você quer cobrir. "Também deve tratar [voice] o caso onde o usuário tem múltiplas sessões abertas e submete o formulário de uma aba obsoleta depois que a sessão foi atualizada em outra aba [/voice]"

Casos de Uso Práticos para o Modo de Voz

O modo de voz se encaixa em alguns fluxos melhor do que outros. Essas são as situações onde falar genuinamente supera digitar.

Sessões de Prototipação Rápida

Quando você está iterando rápido e pulando entre ideias, digitar te força a se comprometer com uma estrutura antes de terminar de pensar. A voz deixa você falar a abordagem enquanto ainda está se formando. "Tente construir isso como um componente React primeiro, mas se o gerenciamento de estado ficar complicado, mude para uma abordagem em vanilla JS com um padrão pub-sub simples." Esse tipo de instrução exploratória sai mais rápido falada do que digitada.

Relatórios de Bug com Muito Contexto

Debugando algo e precisa dar a Claude o quadro completo? O modo de voz te deixa narrar o que você está vendo, o que tentou e o que suspeita, tudo de uma vez. Combinado com o planning mode para a fase de análise, você pode ditar um relatório de bug detalhado por voz e ter Claude planejar a correção antes de uma linha de código mudar.

Feedback de Code Review

Quando você está revisando diffs e quer que Claude trate de problemas específicos: digite o caminho do arquivo, use voz para o feedback. "Nesta função [voice] o tratamento de erro está engolindo exceções silenciosamente e quero que todo bloco catch pelo menos registre o erro com o contexto da requisição antes de continuar [/voice] -- aplique isso em todos os route handlers."

Acessibilidade

Para desenvolvedores que acham a digitação prolongada desconfortável ou que pensam melhor verbalmente, o modo de voz torna as sessões do Claude Code menos exigentes fisicamente. Push-to-talk significa que você controla o ritmo. Você pode alternar entre digitar e falar com base no que se encaixa em cada parte do prompt.

Limitações Atuais

O modo de voz é novo. Algumas restrições vale saber antes de incorporá-lo ao seu fluxo diário.

Liberação gradual. Apenas cerca de 5% dos usuários têm acesso hoje. Anthropic está expandindo a disponibilidade nas próximas semanas para Pro, Max, Team e Enterprise. Se a tela de boas-vindas não aparecer, ou /voice não responder, você ainda não está no grupo de liberação.

Apenas push-to-talk. Sem modo mãos-livres. Sem modo always-listening. Segure espaço para falar, solte para parar. Essa é uma escolha de design deliberada para um terminal onde gatilhos de voz acidentais seriam um pesadelo.

Sem suporte ao Agent SDK. Construindo fluxos programáticos pelo Claude Code SDK? O modo de voz não está disponível lá. É uma feature interativa somente no terminal por enquanto.

Inglês assumido. Anthropic não confirmou explicitamente restrições de idioma para a feature de voz do CLI, mas a liberação inicial parece focada em transcrição em inglês.

Modo de Voz no Claude Code vs Claude.ai

Vale destacar: Claude também tem um modo de voz separado nos apps web e mobile em claude.ai. É uma feature diferente. A versão web/mobile inclui modo de conversa mãos-livres, seleção de voz predefinida e diálogo contínuo de ida e volta. O modo de voz do Claude Code é feito para o terminal: input push-to-talk que produz texto, não uma interface de voz conversacional. Eles resolvem problemas diferentes em contextos diferentes.

Dicas para Input de Voz Eficaz

Digite caminhos de arquivo e nomes, não fale. A transcrição de voz estraga caminhos como src/components/AuthProvider.tsx. Digite as partes precisas, use voz para as instruções.

Coloque a ação na frente. Comece o input de voz com o que você quer feito, depois adicione contexto. "Refatore essa função para usar async/await" é mais fácil de Claude processar do que dois minutos de stream of consciousness que termina com "então sim, torne assíncrono."

Combine com fast mode para iteração rápida. Ative o fast mode para respostas mais rápidas, depois use voz para disparar prompts sem o custo de digitação. Saída mais rápida mais input mais rápido comprime o ciclo de feedback drasticamente.

Use voz para o "por quê" e digitação para o "o quê". Digite: update src/api/routes.ts. Voz: "porque o tratamento de erro atual não distingue entre falhas de auth e timeouts de rede, e consumidores downstream precisam de comportamento de retry diferente para cada um." Esse padrão dá ao Claude precisão e intenção.

Próximos Passos

Navegue a referência completa de modo interativo para atalhos de teclado, perguntas laterais /btw, modo vim e todo slash command
Aprenda context engineering para estruturar prompts eficazes, sejam digitados ou falados
Use o planning mode junto com voz para análise complexa antes da implementação
Explore o fast mode para combinar saída mais rápida com input mais rápido por voz
Leia sobre o modelo de desenvolvimento terminal-first que o modo de voz constrói sobre
Confira os comandos /simplify e /batch para mais fluxos agrupados lançados em releases recentes

O modo de voz é o tipo de feature que parece menor até você usar por um dia e não conseguir mais viver sem. O modelo de input híbrido, onde precisão digitada encontra fluência falada, corresponde a como desenvolvedores realmente pensam sobre código. Você não pensa em texto puro nem em fala pura. Você pensa numa mistura de especificidades e intenção. Agora seu input no terminal funciona da mesma forma.

Modo de Voz do Claude Code

On this page