Engenharia Robots-First
Projete código para agentes autônomos rodando 24/7 a $10 por hora, não para humanos. Rails, domínios de falha, loops de verificação e back-pressure substituem a revisão de código.
Pare de configurar. Comece a construir.
Templates SaaS com orquestração de IA.
O software foi construído para pessoas. O sistema de arquivos. O terminal. JSON. Git. Revisão de código. Tudo foi moldado pelo que um humano com um teclado consegue lidar.
E se você jogasse tudo isso fora e recomeçasse para máquinas?
Isso é engenharia robots-first. E é a direção para onde o desenvolvimento autônomo de software já está indo.
Desenvolvimento Não É Mais Engenharia
Aqui está a divisão que reformula todo o trabalho:
Desenvolvimento de software agora é trabalho de máquina. Escrever código. Rodar testes. Commitar. Agentes já cuidam disso. Chame de aproximadamente $10 por hora, sem dormir, sem pausas.
Engenharia de software é a camada humana que mantém essa máquina confiável. Rails. Domínios de falha. Loops de verificação. Back-pressure. Todo o encanamento dentro do qual o agente roda.
Seu trabalho mudou debaixo dos seus pés. Você não está mais carregando carga para o navio. O contêiner de carga apareceu. Agora você dirige a locomotiva e a mantém nos trilhos.
Essa virada mental é o que separa engenheiros que prosperam no novo mundo dos que afundam nele.
Chave de Fenda Antes da Britadeira
Engenharia autônoma tem estágios. Pule-os e você falha.
A Chave de Fenda: Trabalho manual. Você escreve specs à mão. Você gerencia o contexto com cuidado. Você guia busca e vinculação você mesmo. O objetivo é aprender como o sistema fica nos trilhos antes de entregar as chaves.
A Britadeira: Velocidade total. Loops Ralph rodando sem supervisão. Frotas orquestradas. Agentes paralelos. Builds noturnos que entregam features de manhã.
A maioria dos engenheiros comete o mesmo erro. Pega a britadeira antes de tocar na chave de fenda.
Pule direto para automação total sem os fundamentos e a saída é lixo. A chave de fenda é o que ensina o que a britadeira precisa.
Vá manual primeiro. Descubra por que as coisas se sustentam. Depois alcance as ferramentas elétricas.
Loom: Uma Stack Construída para Agentes
Loom aponta para o próximo passo: um ambiente de software que se reconstrói em torno de agentes ao invés de humanos.
A regra de design é rígida. Para cada peça da stack, faça três perguntas:
- Isso foi projetado para humanos?
- Se sim, pode sair?
- Se sair, o que perdemos e como substituímos?
Algumas suposições que falham no teste:
- Unix user space e convenções TTY: Agentes não ficam em terminais. Alguma dessas coisas ainda se aplica?
- Ritual e processo ágil: Sprints existem porque humanos planejam em semanas. Agentes não planejam assim.
- JSON como formato de dados: Cada aspas e colchete queima tokens. JSON é o formato certo para transmissão?
- Workflows de revisão de código: Um loop de verificação consegue substituir uma fila de revisão?
As peças do Loom incluem:
- Hospedagem de código, estilo GitHub, mas moldada para agentes
- Controle de versão via JJ, que funciona melhor com workflows de máquina
- Sandboxes remotos estilo Codespace
- "Alloying" multi-LLM, rodando múltiplos provedores juntos
- Padrões de mensagens actor e pub-sub
- Encadeamento no estilo Erlang/OTP
A ideia central: loops compostos em cadeias. Loops sobre loops sobre loops. Cada um focado e preciso. O todo se comporta como um sistema reativo único.
Janelas de Contexto São Apenas Arrays
Um princípio central para pensar robots-first:
Uma janela de contexto é um array. Quanto menos você preenche esse array, menos ele precisa deslizar, e melhor fica a saída.
Empilhe mais contexto e você tem:
- Mais deslizamento
- Compactação mais cedo
- Compactação que perde dados
- Âncoras faltando
- Drift
É por isso que loops Ralph funcionam. O loop foi projetado para rodar o array deterministicamente. Mantém o array enxuto. Esquiva compactação. Segura o pino.
O pino é sua spec. O ponto de referência estável para onde o agente continua apontando. Toda iteração lê de novo. Sem o pino, agentes começam a inventar coisas.
Specs como Tabelas de Consulta
Specs robots-first não são docs. São tabelas de consulta afinadas para busca de agente.
Uma boa spec parece com isso:
## User Authentication
**Also known as**: login, sign-in, auth, session management, identity
**Related files**: src/auth/, src/middleware/session.ts
**Key patterns**: JWT tokens, refresh rotation, secure cookies
**What NOT to do**: Don't implement custom crypto, don't store passwords in plain textO campo "também conhecido como" aumenta as taxas de acerto na busca. Quando o agente faz grep de "login", ele cai na spec de auth. Mais sinônimos, mais acertos. Mais acertos, menos invenção.
A spec vira o frame de referência para toda a feature. Agentes consultam o que existe ao invés de adivinhar o que pode existir.
Vinculação Bate Formatos Sofisticados
Muitos engenheiros constroem seus planos com excesso. Schemas JSON aninhados. Hierarquias de tarefas. Formatação elaborada.
A visão robots-first: vinculação precisa ganha de formatos sofisticados.
O que realmente funciona:
- Bullet points com referências concretas
- Cite a seção exata da spec
- Aponte para o arquivo exato
- Referencie hunks específicos (Claude lê arquivos em hunks)
## Implementation Plan
- [ ] Add JWT validation middleware
- Spec: auth-spec.md#token-validation
- File: src/middleware/auth.ts (lines 45-60)
- Pattern: Follow existing rate-limit middleware structure
- [ ] Create refresh token endpoint
- Spec: auth-spec.md#refresh-flow
- File: src/routes/auth/refresh.ts (new file)
- Pattern: Match existing /auth/login endpoint structureAgora o agente busca com precisão. Encontra os hunks certos. Copia o padrão já existente no repositório. Para de inventar.
A Stack Robots-First
Aqui a ideia fica radical. Possua a stack inteira e você pode afiná-la para máquinas:
Serialização: JSON não é eficiente em tokens. Cada aspas, cada chave, cada vírgula custa tokens. Um formato binário, ou um formato de texto construído para agentes, pode cortar esse custo de forma expressiva.
User Space: Por que um agente deve herdar o Unix user space? TTY foi construído para humanos em terminais. Agentes não precisam de emulação de terminal.
Garbage Collection: O que gerenciamento de memória significa quando seu "processo" é uma chamada de API stateless? As suposições habituais param de valer.
Message Passing: Erlang e OTP voltam. Actors. Árvores de supervisor. Let-it-crash. Os padrões mapeiam bem para orquestrar agentes.
Se você possui a stack, você pode:
- Afinar a tokenização
- Cortar custos drasticamente
- Construir pipes reativos mais rápidos
- Rodar mais barato do que o próximo time
Isso é vantagem competitiva.
Weavers: Agentes Sem Humano no Loop
O destino da engenharia robots-first tem um nome: Weavers.
Um Weaver é um agente autônomo que:
- Entrega código por trás de feature flags
- Deploya sem revisão de código
- Monitora analytics de produto
- Decide se uma mudança corrigiu os erros
- Decide se deve avançar mais
- Itera por conta própria
Ninguém está supervisionando. Autonomia total.
Assustador? Sim. Essa é a reação certa de primeira. Agora fique com isso por um segundo.
Cada objeção que você listar é um problema de engenharia esperando para ser construído. E se quebrar a produção? Construa um rollback. E se tomar uma decisão ruim? Construa um loop de verificação. E se sair dos trilhos? Construa back-pressure.
O novo trabalho da engenharia de software: engenharie as preocupações para longe.
Escreva suas objeções. Depois construa os sistemas que as neutralizam. Esse é o trabalho agora.
Engenharia de Back-Pressure
Loops autônomos geram modos de falha. Seu trabalho vira colocar os trilhos:
- Adicione restrições dentro da spec
- Aperte a vinculação do plano
- Melhore a orientação de busca
- Eleve os gates (testes, linting, formatação, scans de segurança)
Quando as saídas ficam ruins, a correção é outro loop:
- Loop de refatoração
- Loop de convenção
- Loop de segurança
- Loop de i18n
O back-pressure mantém o gerador nos trilhos. A locomotiva fica na linha porque você construiu a linha.
A Escada de Escalada
A engenharia robots-first escala por composição. Quatro degraus.
Nível 1: Fundamentos Manuais
- Gere specs por conversa
- Aperte restrições à mão
- Mantenha o contexto o menor possível
- Fique no teclado
Nível 2: Loop Sem Supervisão
- Runs
while true - Um objetivo por iteração
- Testes automatizados mais commit e push
- Estado com checkpoint
Nível 3: Orquestração Multi-Loop
- Vários loops rodando ao mesmo tempo
- Cadeias reativas conectadas entre eles
- Padrões actor e pub-sub
Nível 4: Sistemas de Produto Autônomos
- Weavers entregando features
- Analytics guiando decisões
- Sem fila de revisão
- Autonomia de produto ponta a ponta
Cada degrau repousa sobre o anterior. Pular para o Nível 4 sem os Níveis 1 a 3 não funciona.
A Mudança de Mentalidade
A engenharia robots-first precisa de uma cabeça diferente:
Mentalidade antiga: "Como escrevo esse código?" Nova mentalidade: "Como projeto um sistema que escreve esse código de forma confiável?"
Mentalidade antiga: "Como reviso esse PR?" Nova mentalidade: "Como construo verificação que torna a revisão inútil?"
Mentalidade antiga: "Como debugo esse problema?" Nova mentalidade: "Como construo feedback loops que impedem essa classe de bug?"
Você não está escrevendo código mais. Está projetando sistemas autônomos. Você é um engenheiro de locomotiva, não um estivador.
Começando Hoje
Você não precisa do Loom para começar a pensar robots-first. Comece com perguntas:
-
Que suposições humanas estou incluindo? Audite seus workflows. Quais passos existem apenas porque um humano era quem os fazia?
-
O que poderia virar uma tabela de consulta? Suas specs. Seus padrões. Suas convenções. Você consegue moldá-los para um agente conseguir buscá-los?
-
Onde a vinculação está fraca? A maioria dos planos aponta para as coisas de forma vaga. Você consegue hardcodificar caminhos de arquivo, intervalos de linha e hunks?
-
Onde está o back-pressure? Quando o agente vai na direção errada, o que o pega? Construa esses freios antes de precisar deles.
-
O que autonomia total precisaria? Finja que você saiu do loop. O que cai? Essas falhas são suas próximas prioridades de engenharia.
Para Onde Isso Vai
É 2026. Se prepare.
O gap entre times que conseguem rodar loops autônomos confiáveis e os que não conseguem está crescendo rápido. A economia é clara. Desenvolvimento automatizado custa aproximadamente $10 por hora. Desenvolvedores humanos são $100 ou mais.
Times que constroem robots-first entregam a uma taxa completamente diferente. Rodam mais barato. Iteram mais rápido. Suas melhorias se compõem enquanto dormem.
Engenheiros presos em workflows human-first vão ficar para trás. Não porque suas habilidades são ruins. Porque seu alvo de otimização está errado.
A engenharia de software acabou de mudar. Já mudou antes. Vai mudar de novo.
Os engenheiros que se saem bem são os que veem cada mudança como mais uma chance de projetar a partir dos primeiros princípios. Isso sempre foi verdade. Só está mais difícil de ignorar agora.
Comece com a chave de fenda. Acerte os fundamentos. Depois pegue a britadeira.
A locomotiva está esperando.
Leitura Relacionada
- Técnica Ralph Wiggum: A fundação para loops autônomos
- Engenharia Baseada em Threads: Um framework para escalar trabalho de agentes
- Loops de Agente Autônomo: Ralph mais threads juntos
- Feedback Loops: Padrões de verificação que mantêm os loops honestos
- Context Engineering: Gerenciando o array
Pare de configurar. Comece a construir.
Templates SaaS com orquestração de IA.
Claude Code Autónomo
Uma stack unificada para agentes que fazem ship de funcionalidades durante a noite. As threads dão-te a estrutura, os loops Ralph dão-te a autonomia, a verificação mantém tudo honesto.
Claude Code /simplify e /batch
Corre /simplify para uma revisão de três agentes do teu diff cobrindo reutilização, qualidade e eficiência. Usa /batch quando uma mudança tem de chegar a todo o codebase.