Transforme a IA num sistema de execução autónomo: o mais recente Guia de Melhores Práticas para Agentes Geridos da Claude

By: blockbeats|2026/04/09 18:00:10

Partilhar

Título original do artigo: Lançamento do Claude Managed Agents
Autor original: Lance Martin
Tradução: Peggy, BlockBeats

Nota do editor: Este artigo apresenta os Agentes Geridos lançados pela Claude. Oferece uma forma de software mais próxima do futuro: os agentes inteligentes já não são interfaces que respondem a pedidos uma única vez, mas sim sistemas de execução que podem ser configurados, implementados, programados e executados a longo prazo.

Ao separar completamente a «inteligência» (modelo e estrutura de execução), a «execução» (ferramentas e ambiente de teste) e o «processo» (sessão e registo), os Claude Managed Agents transformam o agente de «lógica no código» numa unidade de infraestrutura independente. Este design não só melhora a estabilidade e a segurança do sistema em tarefas de longa duração, como também permite que os agentes se expandam continuamente à medida que as capacidades do modelo evoluem, sem estarem limitados pelas estruturas existentes.

Neste contexto, os padrões de utilização comuns também se alteraram: passando da execução desencadeada por eventos e programada para a execução automática do tipo «trigger-on-delivery», e para tarefas complexas que se prolongam por dias ou mesmo semanas, os agentes adquirem verdadeiramente a capacidade de «trabalhar de forma contínua». Isto significa que o valor da IA já não se reflete apenas na qualidade de uma única resposta, mas na sua capacidade de acumular e multiplicar-se ao longo do tempo.

Se as APIs anteriores permitiam aos programadores «invocar a inteligência», os Agentes Geridos procuram agora responder a outra questão: como transformar a inteligência num sistema que possa ser alojado, programado e executado de forma contínua. Nesse sentido, os agentes já não são apenas ferramentas, mas aproximam-se mais de uma nova primitiva computacional.

O artigo original é o seguinte:

RESUMO

Os Claude Managed Agents são uma estrutura de execução de agentes (agent harness) pré-configurada e personalizável que funciona em infraestruturas geridas. Basta definir um agente como um modelo — incluindo ferramentas, competências, repositórios de ficheiros/código, etc. — e o resto da estrutura de execução e da infraestrutura é fornecido pelo sistema. Este sistema foi concebido para acompanhar o rápido crescimento dos níveis de inteligência do Claude e para dar suporte a tarefas de longa duração.

Links relacionados:

·Blog do Claude: Padrões de utilização e casos de clientes

·Blog de Engenharia: Conceção dos Agentes Geridos pelo Claude

·Documentação: Guia de Introdução, Início Rápido, Visão Geral da CLI e do SDK

Agentes geridos pelo Claude

Por que são necessários os Agentes Geridos pela Claude

A API de mensagens do Claude é, essencialmente, um ponto de entrada para interagir diretamente com o modelo: insira uma mensagem e receba um bloco de conteúdo. Os agentes inteligentes desenvolvidos com base na API de mensagens precisam de recorrer a uma «estrutura de tempo de execução» para gerir o encaminhamento de chamadas de ferramentas, a gestão do contexto e outras tarefas. No entanto, isto coloca vários desafios:

1. A estrutura de execução precisa acompanhar a evolução das capacidades do Claude
Escrevi recentemente um artigo no blogue sobre como criar um agente com base nas capacidades subjacentes da API do Claude para a coordenação de ferramentas e a gestão do contexto. No entanto, o problema é que o ambiente de execução do agente implica frequentemente alguns pressupostos sobre «o que o Claude não consegue fazer». À medida que as capacidades do Claude aumentam, estas premissas tornam-se rapidamente obsoletas e podem até vir a constituir pontos de estrangulamento no desempenho. Por conseguinte, o ambiente de execução deve ser atualizado continuamente para acompanhar o ritmo de evolução do Claude.

2. Os ciclos de vida das tarefas do Claude estão a tornar-se mais longos
O leque de tarefas que o Claude consegue realizar está a crescer exponencialmente, ultrapassando as 10 horas de trabalho humano nos testes de referência METR. Isto impõe exigências mais elevadas à infraestrutura subjacente do agente: esta deve garantir segurança, estabilidade em cenários de execução prolongada (capacidade de lidar com várias falhas de infraestrutura) e escalabilidade (por exemplo, suportar várias equipas de agentes a funcionar em simultâneo).

Por que é que estes desafios são importantes

É fundamental dar resposta aos desafios acima mencionados, pois prevemos que as futuras versões do Claude serão capazes de funcionar de forma contínua durante períodos de dias, semanas ou mesmo meses, enfrentando os problemas mais complexos da humanidade.

O SDK do Claude Agent é o primeiro passo nessa direção, oferecendo uma estrutura de execução de agentes inteligentes versátil e fácil de usar. Entretanto, os Claude Managed Agents vão um passo além: partindo desta base, oferecem um ambiente de execução completo + infraestrutura gerida, especificamente concebido para garantir a execução segura e fiável de tarefas ao longo de longos períodos de tempo.

Introdução

Uma forma simples de começar é utilizar a nossa skill de código aberto claude-api, que pode ser utilizada imediatamente no Claude Code. Basta instalar a versão mais recente do Claude Code e, em seguida, executar o seguinte subcomando para concluir a configuração de inicialização dos Claude Managed Agents.

Pessoalmente, tenho uma forte preferência pela abordagem baseada em «competências» para integrar novas funcionalidades e utilizo amplamente esta competência na prática.

Transforme a IA num sistema de execução autónomo: o mais recente Guia de Melhores Práticas para Agentes Geridos da Claude

Além disso, pode consultar a nossa documentação para começar rapidamente a utilizar o SDK ou a CLI e criar protótipos dos seus agentes na Consola do Claude.

Casos de utilização

Pode encontrar muitos casos de utilização interessantes no blogue oficial do Claude. Ao combinar estes casos com a minha própria experiência prática, observei alguns padrões de utilização comuns:

1. Acionado por evento
Execução de uma tarefa por um agente gerido, acionada por um serviço.
Por exemplo, quando é detetado um erro no sistema, é efetuada uma chamada automática a um agente responsável para que este crie uma correção e envie um PR. Não é necessária qualquer intervenção humana entre as fases «problema identificado» e «correção aplicada».

2. Execução programada
Agendar tarefas para um Agente Gerido executar.
Por exemplo, muitas pessoas, incluindo eu próprio, utilizam este método para gerar resumos diários (como um resumo das atividades na Plataforma X ou no GitHub, ou um relatório de progresso da equipa gerado por um agente). Segue-se um exemplo do meu resumo diário de atividades na Plataforma X.

3. Disparar e esquecer
Execução de uma tarefa por um agente gerido, desencadeada por um utilizador mas que não requer acompanhamento contínuo. Por exemplo, atribuir tarefas a um agente gerido através do Slack ou do Teams, que, em seguida, conclui a tarefa de forma autónoma e apresenta os resultados (tais como tabelas, slides ou até mesmo aplicações).

4. Tarefas de longo prazo
Uma tarefa de longa duração, que considero um dos cenários particularmente valiosos para os Agentes Geridos.
Realizei algumas experiências com base no repositório de auto-research de Andrej Karpathy, explorando diferentes formas de aplicação. Por exemplo, recentemente utilizei a biblioteca de pretextos do _chenglou como ponto de partida e pedi a um Agente Gerido que investigasse como aplicá-la ao conteúdo do nosso blogue de engenharia.

Conceitos fundamentais

Há três conceitos fundamentais a compreender no processo de integração:

1. Agente
Uma configuração sujeita a controlo de versões que define a «identidade» do agente: incluindo o modelo, o prompt do sistema, as ferramentas, as competências, o servidor MCP, etc. Depois de criado, pode ser chamado repetidamente através do ID.

2. Ambiente
Um modelo utilizado para descrever o ambiente de teste disponibilizado para a execução da ferramenta do agente (por exemplo, tipo de ambiente de execução, política de rede, configuração dos pacotes de dependências, etc.).

3. Sessão
Uma instância em execução com estado, iniciada com base num agente e num ambiente pré-configurados. Irá criar um ambiente de teste totalmente novo a partir do modelo de ambiente, montar os recursos necessários para esta execução (tais como ficheiros e repositórios do GitHub) e armazenar de forma segura as informações de autenticação num keystore (como as credenciais do MCP).

Pode pensar nisso desta forma:

· Agente = A própria configuração

· Ambiente = O modelo de sandbox necessário para o funcionamento do agente

· Sessão = Um processo de execução específico

Um agente pode corresponder a várias sessões.

Utilização

Consulte a documentação para obter mais informações. A utilização geral divide-se em duas categorias:

1. SDK (orientado para código)
Integre o SDK na sua aplicação para gerir sessões em tempo de execução. Atualmente, o Managed Agents suporta 6 idiomas: Python, TypeScript, Java, Go, Ruby, PHP.

2. CLI (Interface de Linha de Comandos)
Interaja com todos os recursos da API através da linha de comandos, incluindo agentes, ambientes, sessões, cofres, competências, ficheiros, etc. Cada tipo de recurso tem os subcomandos correspondentes.

Prática comum:
Normalmente, a CLI é utilizada para a configuração e inicialização, enquanto o SDK é utilizado para a lógica de execução.
Um modelo de agente é persistente — pode criar um modelo (por exemplo, definindo o modelo, o prompt do sistema, as ferramentas, o servidor MCP e as competências em YAML), guardá-lo no Git e aplicá-lo durante o processo de implementação através da CLI.

Fluxo de trabalho

Fui coautor de um artigo no blogue de engenharia da Anthropic, em conjunto com @mc_anthropic, @gcemaj e @jkeatn, que apresentava uma explicação detalhada sobre a criação dos Claude Managed Agents. Uma conclusão fundamental do artigo foi que permitir que os agentes evoluam em sintonia com o nível de inteligência do Claude é, essencialmente, um «problema de infraestrutura», e não apenas uma questão de conceção da estrutura de execução.

Isto significa que o verdadeiro desafio não reside em «como criar um agente mais inteligente», mas sim em como construir um sistema capaz de funcionar de forma estável a longo prazo, que seja escalável e evolutivo, permitindo que o agente execute tarefas cada vez mais complexas e de longo prazo.

Com base nesta filosofia, não concebemos uma estrutura de tempo de execução de agentes fixa (harness), uma vez que prevíamos a sua evolução contínua. Em vez disso, «desacoplámos» várias partes essenciais do sistema:

«Brain» (o Claude e a sua estrutura de execução)

«Mãos» (ambiente de testes e ferramenta para a execução de ações concretas)

«Sessão» (regista os registos de eventos da execução)

Estas três foram concebidas como interfaces independentes, com um mínimo de pressupostos entre si. Cada componente pode avariar ou ser substituído de forma independente, sem afetar o sistema como um todo.

No artigo, também explicámos como esta arquitetura proporciona maior fiabilidade, segurança e flexibilidade — ao mesmo tempo que deixa margem para a integração futura de novos frameworks de execução, sandboxes ou infraestruturas de alojamento de sessões.

Conclusão

Estou muito entusiasmado com projetos que exploram a orquestração multiagente ou tarefas de longo prazo. Uma coisa que sempre me frustrou no passado é o facto de a estrutura de execução do agente ter dificuldade em acompanhar a evolução das capacidades do modelo.

A importância do Claude Managed Agents reside no facto de este se encarregar da estrutura de execução e da camada de infraestrutura por si, permitindo-lhe concentrar-se num nível superior — tratando o próprio «agente» como uma nova primitiva fundamental na API do Claude, possibilitando uma maior exploração e desenvolvimento com base nela.

[Link da publicação original]

Também poderá gostar de

Relatório Matinal | Coinbase Ventures realiza o seu primeiro investimento na ENA; SpaceX planeia definir o preço do IPO em 135 dólares por ação

Visão geral dos eventos importantes do mercado a 3 de junho

Texto integral e análise do discurso do CEO da SanDisk na 42.ª Conferência Anual de Decisões Estratégicas da Bernstein

O valor central do discurso de Goeckeler reside no fornecimento de um quadro narrativo altamente transparente e logicamente claro para a transformação corporativa.

Relatório da Manhã | Strategy vendeu 32 BTC e mais de 800.000 ações da MSTR na semana passada; Binance anunciou oficialmente o seu portal de negociação de ações dos EUA; Polymarket estabeleceu uma parceria exclusiva com a OneFootball

Visão geral dos eventos importantes do mercado a 1 de junho

Bootcamp de Trading WEEXPERIENCE na Polónia: Como a WEEX e a FireCrew estão a tornar o trading de cripto acessível a todos

A WEEX estabeleceu uma parceria com a Firecrew na Polónia, no dia 29 de maio, para o bootcamp de trading WEEXPERIENCE. Leia o resumo das sessões de especialistas sobre análise técnica, psicologia de trading e ferramentas de IA que comprovam a missão da WEEX de tornar o trading de cripto acessível a todos.

Paris Reina Supremo: Como o PSG esmagou o sonho do Arsenal numa final histórica da UCL

PSG vs Arsenal, drama, destino e uma maldição de 20 anos quebrada. Reviva a final da UCL de 2026, onde o PSG defendeu o seu título num tenso desempate por grandes penalidades, à medida que o momento de ouro de Ousmane Dembélé e uma falha agonizante escreveram a história em Budapeste.

TaiJi conclui financiamento estratégico de 3,5 milhões de dólares, com investimentos da Castrum Capital, Becker Ventures e Coinvestor Ventures

A plataforma de inteligência de mercado on-chain Web3 impulsionada por IA, TaiJi, anunciou a conclusão de um financiamento estratégico de 3,5 milhões de dólares, que irá acelerar a construção de um novo motor de simulação de mercado por IA.

Bitcoin estagnado perto dos 73 mil dólares? Como os traders estão a encontrar recompensas num mercado lateral em junho

O Bitcoin está estagnado perto dos 73 mil dólares, à medida que os fluxos dos ETFs arrefecem e a incerteza macroeconómica mantém os traders cautelosos. Eis como campanhas de recompensas como a WEEX Joker Party ajudam os traders a manterem-se ativos durante um mercado lateral em junho.

Como fazer staking de Solana: Um guia passo a passo para 2026

Encontre as melhores moedas cripto de IA de 2026 com escolhas baseadas em dados: Bittensor, Render e projetos emergentes. Inclui métricas on-chain, riscos e guia de negociação na WEEX.

Preço Garantido já disponível na WEEX: Execute com maior precisão

Para proporcionar uma experiência de negociação de futuros mais fluida, a WEEX futures lançou a funcionalidade "Preço Garantido".

A investigação mais recente do BIS: O futuro das stablecoins e o panorama monetário global

O relatório considera que as stablecoins reforçarão o domínio do dólar americano a curto prazo, representando riscos para a soberania monetária dos mercados emergentes e das economias em desenvolvimento, enquanto a trajetória a longo prazo dependerá dos seus modelos de adoção, respostas regulatórias e da sinergia de...

Entrevista com o mestre da macroeconomia Raoul Pal: A competição em IA está a dar origem a uma "singularidade económica"; não desista facilmente dos seus ativos nos próximos quatro anos

Comparado com o Nasdaq, o Bitcoin encontra-se atualmente numa posição de sobrevenda severa dentro da sua tendência de longo prazo.

Why is Peter Thiel, behind Palantir, preparing an exit in Argentina?

Palantir, political risk, and the self-preservation of technological oligarchs.

A crise de meia-idade dos GPs de Cripto: Sem PMF, não há novo cheque dos LPs

Após perderem o fascínio pelas estrelas e pelo mar, a maioria dos GPs de Cripto que não conseguiram obter retornos excedentes neste ciclo deve lançar pragmaticamente um produto com PMF, seja provando a sua capacidade de ajudar os LPs a obter retornos excedentes através de um nicho de mercado, ou resolvendo problemas específicos para LPs/parceiros...

Relatório Matinal | Coinbase Ventures realiza o seu primeiro investimento na ENA; SpaceX planeia definir o preço do IPO em 135 dólares por ação

Visão geral dos eventos importantes do mercado a 3 de junho