Transforme a IA num sistema de execução autónomo: o mais recente Guia de Melhores Práticas para Agentes Geridos da Claude

By: blockbeats|2026/04/09 18:00:10
0
Partilhar
copy
Título original do artigo: Lançamento do Claude Managed Agents
Autor original: Lance Martin
Tradução: Peggy, BlockBeats

Nota do editor: Este artigo apresenta os Agentes Geridos lançados pela Claude. Oferece uma forma de software mais próxima do futuro: os agentes inteligentes já não são interfaces que respondem a pedidos uma única vez, mas sim sistemas de execução que podem ser configurados, implementados, programados e executados a longo prazo.

Ao separar completamente a «inteligência» (modelo e estrutura de execução), a «execução» (ferramentas e ambiente de teste) e o «processo» (sessão e registo), os Claude Managed Agents transformam o agente de «lógica no código» numa unidade de infraestrutura independente. Este design não só melhora a estabilidade e a segurança do sistema em tarefas de longa duração, como também permite que os agentes se expandam continuamente à medida que as capacidades do modelo evoluem, sem estarem limitados pelas estruturas existentes.

Neste contexto, os padrões de utilização comuns também se alteraram: passando da execução desencadeada por eventos e programada para a execução automática do tipo «trigger-on-delivery», e para tarefas complexas que se prolongam por dias ou mesmo semanas, os agentes adquirem verdadeiramente a capacidade de «trabalhar de forma contínua». Isto significa que o valor da IA já não se reflete apenas na qualidade de uma única resposta, mas na sua capacidade de acumular e multiplicar-se ao longo do tempo.

Se as APIs anteriores permitiam aos programadores «invocar a inteligência», os Agentes Geridos procuram agora responder a outra questão: como transformar a inteligência num sistema que possa ser alojado, programado e executado de forma contínua. Nesse sentido, os agentes já não são apenas ferramentas, mas aproximam-se mais de uma nova primitiva computacional.

O artigo original é o seguinte:

RESUMO

Os Claude Managed Agents são uma estrutura de execução de agentes (agent harness) pré-configurada e personalizável que funciona em infraestruturas geridas. Basta definir um agente como um modelo — incluindo ferramentas, competências, repositórios de ficheiros/código, etc. — e o resto da estrutura de execução e da infraestrutura é fornecido pelo sistema. Este sistema foi concebido para acompanhar o rápido crescimento dos níveis de inteligência do Claude e para dar suporte a tarefas de longa duração.

Links relacionados:

·Blog do Claude: Padrões de utilização e casos de clientes

·Blog de Engenharia: Conceção dos Agentes Geridos pelo Claude

·Documentação: Guia de Introdução, Início Rápido, Visão Geral da CLI e do SDK

Agentes geridos pelo Claude

Por que são necessários os Agentes Geridos pela Claude

A API de mensagens do Claude é, essencialmente, um ponto de entrada para interagir diretamente com o modelo: insira uma mensagem e receba um bloco de conteúdo. Os agentes inteligentes desenvolvidos com base na API de mensagens precisam de recorrer a uma «estrutura de tempo de execução» para gerir o encaminhamento de chamadas de ferramentas, a gestão do contexto e outras tarefas. No entanto, isto coloca vários desafios:

1. A estrutura de execução precisa acompanhar a evolução das capacidades do Claude
Escrevi recentemente um artigo no blogue sobre como criar um agente com base nas capacidades subjacentes da API do Claude para a coordenação de ferramentas e a gestão do contexto. No entanto, o problema é que o ambiente de execução do agente implica frequentemente alguns pressupostos sobre «o que o Claude não consegue fazer». À medida que as capacidades do Claude aumentam, estas premissas tornam-se rapidamente obsoletas e podem até vir a constituir pontos de estrangulamento no desempenho. Por conseguinte, o ambiente de execução deve ser atualizado continuamente para acompanhar o ritmo de evolução do Claude.

2. Os ciclos de vida das tarefas do Claude estão a tornar-se mais longos
O leque de tarefas que o Claude consegue realizar está a crescer exponencialmente, ultrapassando as 10 horas de trabalho humano nos testes de referência METR. Isto impõe exigências mais elevadas à infraestrutura subjacente do agente: esta deve garantir segurança, estabilidade em cenários de execução prolongada (capacidade de lidar com várias falhas de infraestrutura) e escalabilidade (por exemplo, suportar várias equipas de agentes a funcionar em simultâneo).

Por que é que estes desafios são importantes

É fundamental dar resposta aos desafios acima mencionados, pois prevemos que as futuras versões do Claude serão capazes de funcionar de forma contínua durante períodos de dias, semanas ou mesmo meses, enfrentando os problemas mais complexos da humanidade.

O SDK do Claude Agent é o primeiro passo nessa direção, oferecendo uma estrutura de execução de agentes inteligentes versátil e fácil de usar. Entretanto, os Claude Managed Agents vão um passo além: partindo desta base, oferecem um ambiente de execução completo + infraestrutura gerida, especificamente concebido para garantir a execução segura e fiável de tarefas ao longo de longos períodos de tempo.

Introdução

Uma forma simples de começar é utilizar a nossa skill de código aberto claude-api, que pode ser utilizada imediatamente no Claude Code. Basta instalar a versão mais recente do Claude Code e, em seguida, executar o seguinte subcomando para concluir a configuração de inicialização dos Claude Managed Agents.

Pessoalmente, tenho uma forte preferência pela abordagem baseada em «competências» para integrar novas funcionalidades e utilizo amplamente esta competência na prática.

Transforme a IA num sistema de execução autónomo: o mais recente Guia de Melhores Práticas para Agentes Geridos da Claude

Além disso, pode consultar a nossa documentação para começar rapidamente a utilizar o SDK ou a CLI e criar protótipos dos seus agentes na Consola do Claude.

Casos de utilização

Pode encontrar muitos casos de utilização interessantes no blogue oficial do Claude. Ao combinar estes casos com a minha própria experiência prática, observei alguns padrões de utilização comuns:

1. Acionado por evento
Execução de uma tarefa por um agente gerido, acionada por um serviço.
Por exemplo, quando é detetado um erro no sistema, é efetuada uma chamada automática a um agente responsável para que este crie uma correção e envie um PR. Não é necessária qualquer intervenção humana entre as fases «problema identificado» e «correção aplicada».

2. Execução programada
Agendar tarefas para um Agente Gerido executar.
Por exemplo, muitas pessoas, incluindo eu próprio, utilizam este método para gerar resumos diários (como um resumo das atividades na Plataforma X ou no GitHub, ou um relatório de progresso da equipa gerado por um agente). Segue-se um exemplo do meu resumo diário de atividades na Plataforma X.

3. Disparar e esquecer
Execução de uma tarefa por um agente gerido, desencadeada por um utilizador mas que não requer acompanhamento contínuo. Por exemplo, atribuir tarefas a um agente gerido através do Slack ou do Teams, que, em seguida, conclui a tarefa de forma autónoma e apresenta os resultados (tais como tabelas, slides ou até mesmo aplicações).

4. Tarefas de longo prazo
Uma tarefa de longa duração, que considero um dos cenários particularmente valiosos para os Agentes Geridos.
Realizei algumas experiências com base no repositório de auto-research de Andrej Karpathy, explorando diferentes formas de aplicação. Por exemplo, recentemente utilizei a biblioteca de pretextos do _chenglou como ponto de partida e pedi a um Agente Gerido que investigasse como aplicá-la ao conteúdo do nosso blogue de engenharia.

Conceitos fundamentais

Há três conceitos fundamentais a compreender no processo de integração:

1. Agente
Uma configuração sujeita a controlo de versões que define a «identidade» do agente: incluindo o modelo, o prompt do sistema, as ferramentas, as competências, o servidor MCP, etc. Depois de criado, pode ser chamado repetidamente através do ID.

2. Ambiente
Um modelo utilizado para descrever o ambiente de teste disponibilizado para a execução da ferramenta do agente (por exemplo, tipo de ambiente de execução, política de rede, configuração dos pacotes de dependências, etc.).

3. Sessão
Uma instância em execução com estado, iniciada com base num agente e num ambiente pré-configurados. Irá criar um ambiente de teste totalmente novo a partir do modelo de ambiente, montar os recursos necessários para esta execução (tais como ficheiros e repositórios do GitHub) e armazenar de forma segura as informações de autenticação num keystore (como as credenciais do MCP).

Pode pensar nisso desta forma:

· Agente = A própria configuração

· Ambiente = O modelo de sandbox necessário para o funcionamento do agente

· Sessão = Um processo de execução específico

Um agente pode corresponder a várias sessões.

Utilização

Consulte a documentação para obter mais informações. A utilização geral divide-se em duas categorias:

1. SDK (orientado para código)
Integre o SDK na sua aplicação para gerir sessões em tempo de execução. Atualmente, o Managed Agents suporta 6 idiomas: Python, TypeScript, Java, Go, Ruby, PHP.

2. CLI (Interface de Linha de Comandos)
Interaja com todos os recursos da API através da linha de comandos, incluindo agentes, ambientes, sessões, cofres, competências, ficheiros, etc. Cada tipo de recurso tem os subcomandos correspondentes.

Prática comum:
Normalmente, a CLI é utilizada para a configuração e inicialização, enquanto o SDK é utilizado para a lógica de execução.
Um modelo de agente é persistente — pode criar um modelo (por exemplo, definindo o modelo, o prompt do sistema, as ferramentas, o servidor MCP e as competências em YAML), guardá-lo no Git e aplicá-lo durante o processo de implementação através da CLI.

Fluxo de trabalho

Fui coautor de um artigo no blogue de engenharia da Anthropic, em conjunto com @mc_anthropic, @gcemaj e @jkeatn, que apresentava uma explicação detalhada sobre a criação dos Claude Managed Agents. Uma conclusão fundamental do artigo foi que permitir que os agentes evoluam em sintonia com o nível de inteligência do Claude é, essencialmente, um «problema de infraestrutura», e não apenas uma questão de conceção da estrutura de execução.

Isto significa que o verdadeiro desafio não reside em «como criar um agente mais inteligente», mas sim em como construir um sistema capaz de funcionar de forma estável a longo prazo, que seja escalável e evolutivo, permitindo que o agente execute tarefas cada vez mais complexas e de longo prazo.

Com base nesta filosofia, não concebemos uma estrutura de tempo de execução de agentes fixa (harness), uma vez que prevíamos a sua evolução contínua. Em vez disso, «desacoplámos» várias partes essenciais do sistema:

«Brain» (o Claude e a sua estrutura de execução)

«Mãos» (ambiente de testes e ferramenta para a execução de ações concretas)

«Sessão» (regista os registos de eventos da execução)

Estas três foram concebidas como interfaces independentes, com um mínimo de pressupostos entre si. Cada componente pode avariar ou ser substituído de forma independente, sem afetar o sistema como um todo.

No artigo, também explicámos como esta arquitetura proporciona maior fiabilidade, segurança e flexibilidade — ao mesmo tempo que deixa margem para a integração futura de novos frameworks de execução, sandboxes ou infraestruturas de alojamento de sessões.

Conclusão

Estou muito entusiasmado com projetos que exploram a orquestração multiagente ou tarefas de longo prazo. Uma coisa que sempre me frustrou no passado é o facto de a estrutura de execução do agente ter dificuldade em acompanhar a evolução das capacidades do modelo.

A importância do Claude Managed Agents reside no facto de este se encarregar da estrutura de execução e da camada de infraestrutura por si, permitindo-lhe concentrar-se num nível superior — tratando o próprio «agente» como uma nova primitiva fundamental na API do Claude, possibilitando uma maior exploração e desenvolvimento com base nela.

[Link da publicação original]

Também poderá gostar de

Relatório Matinal | Coinbase Ventures realiza o seu primeiro investimento na ENA; SpaceX planeia definir o preço do IPO em 135 dólares por ação

Visão geral dos eventos importantes do mercado a 3 de junho

Texto integral e análise do discurso do CEO da SanDisk na 42.ª Conferência Anual de Decisões Estratégicas da Bernstein

O valor central do discurso de Goeckeler reside no fornecimento de um quadro narrativo altamente transparente e logicamente claro para a transformação corporativa.

Previsão de Preço da Bitcoin para 2030: Ark Invest Prevê 710 mil dólares

Explore as previsões de preço da bitcoin para 2030 da Ark Invest e do Standard Chartered, além dos principais riscos e como posicionar a sua carteira. Análise completa na WEEX.

Preço do SOL hoje: Preço da Solana em tempo real, gráficos e dados de mercado

Descubra o preço do SOL hoje com dados em tempo real, além dos principais fatores por trás do movimento da Solana e dicas de negociação práticas. Leia a análise completa na WEEX.

O que é um ETF de Bitcoin: Spot vs. Futuros Explicado

Saiba o que é um ETF de Bitcoin, como funcionam os ETFs spot vs. futuros e porque os fluxos institucionais estão a remodelar o BTC em 2026. Análise WEEX.

Why Is Bitcoin Dropping 15% While Nasdaq Hits Record Highs?

A Bitcoin cai 15% para 66 mil dólares devido a receios de tensões geopolíticas, enquanto o Nasdaq dispara para máximos de sempre. Análise dos motores macroeconómicos, fluxos de ETF, comportamento de retalho vs. baleias e a correlação oculta entre cripto e ações.

Moedas populares

Últimas notícias cripto

Ler mais
iconiconiconiconiconicon
Apoio ao cliente:@weikecs
Cooperação empresarial:@weikecs
Trading quant. e criação de mercados:bd@weex.com
Programa VIP:support@weex.com