Quão perigoso é o Mythos? Por que razão a Anthropic decidiu não lançar o novo modelo

By: blockbeats|2026/04/16 13:18:37

Partilhar

Título original do artigo: Como a Anthropic percebeu que o Mythos era demasiado perigoso para ser lançado ao mercado
Autores do artigo original: Margi Murphy, Jake Bleiberg e Patrick Howell O'Neill, Bloomberg
Tradução: Peggy, BlockBeats

Nota do editor: Quando uma empresa de IA opta por não disponibilizar o seu modelo mais potente diretamente ao público, isso, por si só, já constitui um problema.

O Mythos da Anthropic já era capaz de executar de forma autónoma todo o processo de ataque. Desde a descoberta de vulnerabilidades de dia zero e a criação de código de exploração até à combinação de percursos em várias etapas para penetrar em sistemas centrais, estas tarefas — que, originalmente, exigiam a colaboração de hackers de topo durante longos períodos — foram reduzidas a horas ou mesmo minutos.

Foi por isso que, no momento em que o modelo foi divulgado, Scott Bessent e Jerome Powell convocaram uma reunião com instituições de Wall Street, solicitando que o utilizassem para «autoavaliação». Quando a capacidade de deteção de vulnerabilidades é aplicada em grande escala, o sistema financeiro deixa de enfrentar ataques isolados e passa a ser alvo de análises contínuas.

A mudança mais profunda reside na estrutura da oferta. No passado, a deteção de vulnerabilidades dependia de algumas equipas de segurança e dos conhecimentos especializados de hackers, num processo lento e não replicável. Atualmente, esta capacidade está a começar a ser produzida em massa por vários modelos, reduzindo o limiar tanto para os ataques como para as defesas. Uma metáfora de alguém que está por dentro do assunto é bastante direta: entregar o modelo a um hacker comum é como dotá-lo de capacidades de operações especiais.

As instituições começaram a utilizar as mesmas ferramentas para verificar retrospectivamente os seus próprios sistemas. O JPMorgan Chase, a Cisco Systems e outras empresas estão a realizar testes internos, na esperança de corrigir as vulnerabilidades antes que estas sejam exploradas. No entanto, as limitações da realidade não se alteraram; a velocidade das descobertas está a aumentar, enquanto o processo de reparação continua a ser lento. «Somos bons a identificar vulnerabilidades, mas não somos bons a corrigi-las», como salientou Jim Zemlin, destacando o desfasamento temporal.

Na verdade, uma vez que o Mythos não constitui apenas uma melhoria numa única capacidade, mas sim uma integração, aceleração e redução do limiar de usabilidade de capacidades de ataque anteriormente dispersas e limitadas, fora do ambiente controlado, não se sabe como esta capacidade se irá propagar, não existindo qualquer experiência anterior a que se possa recorrer.

O perigo não reside no que ela pode fazer, mas sim em quem a pode utilizar e em que condições.

O artigo original é o seguinte:

Numa noite amena de fevereiro, durante uma pausa num casamento em Bali, Nicholas Carlini afastou-se por uns instantes, abriu o seu portátil e preparou-se para «causar algum alvoroço». Naquele momento, a Anthropic tinha acabado de lançar um novo modelo de inteligência artificial chamado Mythos para testes internos, e este renomado investigador de IA estava prestes a ver quantos problemas ele poderia realmente causar.

A Anthropic contratou Carlini para realizar testes de resistência aos seus modelos de IA, com o objetivo de avaliar se os hackers poderiam potencialmente explorá-los para fins de espionagem, roubo ou destruição. Enquanto assistia a um casamento indiano em Bali, Carlini ficou impressionada com as capacidades deste modelo.

Em apenas algumas horas, descobriu várias técnicas que poderiam ser utilizadas para invadir sistemas utilizados a nível mundial. Ao regressar ao escritório da Anthropic, no centro de São Francisco, descobriu ainda que o Mythos já era capaz de gerar de forma autónoma poderosas ferramentas de intrusão, incluindo táticas direcionadas ao Linux — a espinha dorsal da maioria dos sistemas informáticos modernos.

O Mythos encenou um «assalto digital a um banco»: conseguiu contornar os protocolos de segurança, entrar no sistema da rede pela porta da frente e, em seguida, violar o cofre digital para obter os seus ativos online. No passado, a IA só conseguia «arrombar fechaduras», mas agora tem a capacidade de planear e executar um «assalto» completo.

Carlini e alguns colegas começaram a dar o alarme dentro da empresa, comunicando as suas descobertas. Entretanto, quase todos os dias, descobriam vulnerabilidades de alto risco, potencialmente fatais, nos sistemas que o Mythos analisava — problemas que, normalmente, só os melhores hackers do mundo seriam capazes de detectar.

Quão perigoso é o Mythos? Por que razão a Anthropic decidiu não lançar o novo modelo

Ficou comprovado que o modelo de IA de última geração da Anthropic, o Mythos, tem a capacidade de penetrar em vários sistemas globais. (Fonte da imagem: (Jakub Porzycki / NurPhoto / AP)

Ao mesmo tempo, internamente na Anthropic, uma equipa denominada «Frontier Red Team» — composta por 15 funcionários conhecidos como «Ants» — também estava a realizar testes semelhantes. A responsabilidade desta equipa era garantir que os modelos da empresa não fossem utilizados para prejudicar a humanidade. Levavam cães robóticos para os armazéns e realizavam testes com engenheiros para verificar se os chatbots poderiam ser utilizados para controlar maliciosamente esses dispositivos; colaboravam também com biólogos para avaliar se os modelos poderiam ser utilizados para criar armas biológicas.

No entanto, desta vez, foram-se apercebendo gradualmente de que o maior risco representado pela Mythos provinha do domínio da cibersegurança. «Logo nas primeiras horas em que tivemos o modelo, percebemos que era diferente», afirmou Logan Graham, responsável pela equipa.

O modelo anterior, o Opus 4.6, tinha demonstrado a capacidade de ajudar os seres humanos a explorar vulnerabilidades de software. Mas Graham salientou que o Mythos poderia agora «envolver-se diretamente» e explorar essas vulnerabilidades por conta própria. Isso representava um risco para a segurança nacional e, com base nisso, ele emitiu um aviso à direção da empresa. Isso obrigou-o a enfrentar um dilema: explicar à administração que o próximo grande motor de receitas da empresa poderia não vir a ser lançado ao público por ser demasiado perigoso.

Jared Kaplan, cofundador e diretor científico da Anthropic, afirmou que, durante o processo de treino do Mythos, tinha acompanhado «muito de perto» o seu progresso. Em janeiro, começou a perceber que a capacidade do modelo para detetar vulnerabilidades do sistema era excepcionalmente forte. Na qualidade de físico teórico, Kaplan precisava de determinar se essas capacidades eram apenas um «fenómeno tecnicamente interessante» ou «uma realidade intimamente ligada à infraestrutura da Internet». No final, ele concluiu que era a segunda opção.

Jared Kaplan (cofundador e diretor científico da Anthropic) Fonte da imagem: Chris J. Ratcliffe/Bloomberg

Durante um período de duas semanas, entre o final de fevereiro e o início de março, Kaplan e o cofundador Sam McCandlish debateram se deveriam lançar este modelo.

Na primeira semana de março, a equipa de direção da empresa — incluindo o CEO Dario Amodei, a presidente Daniela Amodei, o diretor de segurança da informação Vitaly Gudanets e outros — reuniu-se para ouvir a apresentação de Kaplan e McCandlish.

A conclusão a que chegaram foi que o Mythos apresentava um risco demasiado elevado e não era adequado para um lançamento público completo. No entanto, a Anthropic deveria continuar a permitir que algumas empresas, incluindo concorrentes, o testassem.

<p"rapidamente percebemos que, desta vez, era necessário adotar uma abordagem consideravelmente diferente; não seria um lançamento de produto rotineiro", disse Kaplan>

Na primeira semana de março, a empresa acabou por chegar a um consenso: aprovar o Mythos para implementação como ferramenta de defesa em cibersegurança.

Dario Amodei (CEO da Anthropic) Fonte da imagem: Samyukta Lakshmi/Bloomberg

A reação do mercado foi quase imediata. No dia em que a Anthropic revelou a existência do Mythos, nos EUA O secretário do Tesouro, Scott Bessent, e o presidente da Reserva Federal, Jerome Powell, convocaram uma reunião de emergência com as principais instituições de Wall Street em Washington, D.C. A mensagem foi muito clara: utilize imediatamente o Mythos para identificar vulnerabilidades nos seus sistemas.

De acordo com uma fonte próxima dos executivos presentes na reunião (que pediu para permanecer anónima devido ao caráter privado das discussões), a seriedade da reunião era evidente — os participantes chegaram mesmo a recusar-se a revelar o conteúdo da reunião a alguns conselheiros de confiança.

Funcionários da Casa Branca emitiram um aviso urgente sobre o Mythos como potencial ferramenta de pirataria informática e recomendaram que «seja utilizado para fins de defesa», apontando para uma mudança mais profunda: a inteligência artificial está a tornar-se rapidamente uma força decisiva no domínio da cibersegurança. A Anthropic disponibilizou o Mythos de forma seletiva para utilização limitada por parte de algumas instituições no âmbito da iniciativa «Project Glasswing», incluindo empresas como a Amazon Web Services, a Apple e o JPMorgan Chase, permitindo-lhes realizar testes; ao mesmo tempo, as agências governamentais também demonstraram um forte interesse.

Antes de disponibilizar a versão ao público, a Anthropic informou exaustivamente altos funcionários do governo dos EUA sobre as capacidades da versão preliminar do Mythos, incluindo as suas potenciais aplicações tanto em ataques cibernéticos como na defesa. Ao mesmo tempo, a empresa mantém conversações em curso com vários governos nacionais. Um funcionário da Anthropic, que pediu para permanecer anónimo devido a questões internas, revelou esta informação.

A concorrente OpenAI não tardou a seguir o exemplo, anunciando na terça-feira o lançamento de uma ferramenta para detetar vulnerabilidades de software — o GPT-5.4-Cyber.

Ao testar as primeiras versões, os investigadores descobriram dezenas de comportamentos «preocupantes», incluindo o incumprimento de instruções dadas por humanos e, em casos muito raros, a tentativa de ocultar as suas ações após terem desobedecido às instruções.

Atualmente, a Anthropic ainda não lançou oficialmente o Mythos ao público como ferramenta de cibersegurança, e os investigadores externos ainda não validaram totalmente as suas capacidades. No entanto, a decisão anterior da empresa de «acesso restrito» reflete um consenso crescente entre a indústria e o governo: A IA está a remodelar a estrutura económica da cibersegurança — reduz significativamente o custo da deteção de vulnerabilidades, encurta o tempo de preparação dos ataques e diminui as barreiras técnicas para certos tipos de ataques.

A Anthropic também alertou que a maior autonomia do Mythos acarreta riscos por si só. Durante os testes, a equipa observou vários casos preocupantes: o modelo desobedeceu às instruções e chegou mesmo a tentar apagar os seus rastos após uma infração. Num dos casos, o modelo concebeu de forma autónoma um plano de ataque em várias etapas para «escapar» de um ambiente restrito, obter um acesso mais alargado à Internet e divulgar conteúdo de forma proativa.

No mundo real, o software utilizado por aplicações que vão desde sistemas bancários a sistemas hospitalares contém frequentemente vulnerabilidades de código complexas e difíceis de detectar, cuja descoberta exige, muitas vezes, semanas ou mesmo meses de trabalho por parte de profissionais. Quando os hackers exploram estas vulnerabilidades, isso pode levar a fugas de dados ou a ataques de ransomware, com consequências graves.

No entanto, muitos pesos pesados também têm questionado as verdadeiras capacidades do Mythos e os seus potenciais riscos. David Sacks, conselheiro da Casa Branca para a IA, afirmou na plataforma social X: «Cada vez mais pessoas começam a questionar se a Anthropic será o "menino que gritou ao lobo" no setor da IA.» Se a ameaça representada pela Mythos não se concretizar no final, a empresa enfrentará um grave problema de reputação.

No entanto, a realidade é que os hackers já utilizam há muito tempo modelos de linguagem de grande escala para lançar ataques sofisticados. Por exemplo, um grupo de ciberespionagem utilizou, em certa ocasião, o modelo Claude da Anthropic para tentar invadir cerca de 30 alvos; outros atacantes têm utilizado a IA para roubar dados de agências governamentais, instalar ransomware e até mesmo contornar rapidamente centenas de ferramentas de firewall utilizadas para a proteção de dados.

De acordo com uma fonte a par do assunto, os responsáveis pela segurança nacional dos EUA consideram que o surgimento do Mythos traz uma incerteza sem precedentes — a avaliação dos riscos de cibersegurança tornou-se ainda mais complexa. Se este modelo fosse disponibilizado a hackers individuais, o seu efeito poderia ser semelhante ao de transformar um soldado comum num agente das forças especiais.

Ao mesmo tempo, este tipo de modelo poderia também tornar-se um «amplificador de capacidades», permitindo que uma organização criminosa de hackers possuísse a capacidade de ataque de um pequeno Estado-nação e possibilitando que hackers dos serviços de inteligência e militares de alguns países de pequena a média dimensão levassem a cabo ciberataques que, anteriormente, apenas as grandes potências conseguiam realizar.

O antigo chefe de cibersegurança da NSA, Rob Joyce, afirmou: "Acredito que, a longo prazo, a IA nos tornará mais seguros e resilientes. No entanto, entre agora e algum momento no futuro, haverá um «período sombrio» durante o qual a IA ofensiva terá uma vantagem clara — aqueles que não tiverem reforçado adequadamente as suas defesas serão os primeiros a cair.

Vale a pena referir que o Mythos não é o único modelo com essas capacidades. Várias organizações já têm utilizado modelos de linguagem de grande escala para a investigação de vulnerabilidades, incluindo versões iniciais do Claude e do Big Sleep.

Antes do lançamento do Mythos, o JPMorgan Chase já tinha obtido sucesso na utilização de modelos de linguagem de grande escala para ajudar a identificar vulnerabilidades em software bancário. Uma pessoa a par da situação (que pediu para permanecer anónima devido ao seu envolvimento em projetos de segurança interna) revelou esta informação. (Fonte da imagem: (Michael Nagle / Bloomberg)

Segundo a fonte, as «vulnerabilidades de dia zero», cuja identificação e criação de código de exploração levavam anteriormente dias ou até semanas, podem agora ser identificadas em apenas uma hora, ou mesmo em minutos, com o uso da IA. Uma «vulnerabilidade de dia zero» refere-se a uma falha de segurança que os responsáveis pela segurança ainda não detectaram, o que deixa quase nenhum tempo para a aplicação de correções.

Atualmente, o foco do JPMorgan Chase centra-se principalmente na cadeia de abastecimento e no domínio do software de código aberto, onde identificaram várias vulnerabilidades e enviaram feedback aos respetivos fornecedores.

O CEO da empresa, Jamie Dimon, afirmou durante uma teleconferência sobre os resultados financeiros que o surgimento do Mythos «indica que ainda existe um grande número de vulnerabilidades que precisam de ser resolvidas com urgência».

Jamie Dimon Fonte da imagem: Krisztian Bocsi / Bloomberg

De acordo com uma fonte a par do assunto, o JPMorgan Chase já tinha entrado em contacto com a Anthropic para discutir a realização de testes ao modelo antes de a existência do Mythos se tornar do domínio público. A fonte, que pediu para permanecer anónima por não estar autorizada a falar publicamente, afirmou que o JPMorgan Chase se recusou a comentar o assunto.

Atualmente, outros bancos de Wall Street e empresas tecnológicas também estão a tentar utilizar o Mythos para corrigir proativamente falhas no sistema antes que os hackers descubram as vulnerabilidades. A Bloomberg informou que instituições financeiras como a Goldman Sachs, o Citigroup, o Bank of America e o Morgan Stanley testaram internamente esta tecnologia.

Os funcionários da Cisco Systems estão particularmente atentos a uma questão: se os invasores irão utilizar a IA para encontrar formas de violar o software dos seus dispositivos de rede implementados a nível global — estes dispositivos incluem routers, firewalls e modems. Anthony Grieco, Diretor de Segurança e Confiança da empresa, manifestou preocupações específicas quanto ao facto de a IA poder acelerar os ataques de hackers a dispositivos «em fim de vida» que deixarão de receber atualizações de suporte da Cisco.

No entanto, a correção das vulnerabilidades detetadas pela IA continuará a ser um desafio constante. Este processo, conhecido como «aplicação de patches de segurança», é frequentemente dispendioso e demorado para as organizações, o que leva muitas delas a ignorar as vulnerabilidades. Ataques catastróficos como o sofrido pela Equifax — em que foram roubados os dados de aproximadamente 147 milhões de pessoas — ocorreram devido ao facto de vulnerabilidades conhecidas não terem sido prontamente corrigidas.

No incidente de violação de dados da Equifax, os invasores roubaram os registos pessoais de aproximadamente 147 milhões de pessoas. (Fonte da imagem: (Elijah Nouvelage / Bloomberg)

Apesar de ter sido identificada pela administração Trump como uma «ameaça à cadeia de abastecimento» após se recusar a colaborar na realização de vigilância em grande escala sobre cidadãos norte-americanos, a Anthropic está atualmente a manter conversações e a colaborar com agências federais.

Os EUA O Departamento do Tesouro pretende obter aprovação para utilizar o Mythos esta semana. O Secretário do Tesouro, Scott Bessent, afirmou que este modelo ajudará os Estados Unidos a manter a sua vantagem competitiva no domínio da inteligência artificial.

Scott Bessent Fonte da imagem: Matt McClain / Bloomberg

Num teste, o Mythos criou um código de ataque para navegadores que combinou quatro vulnerabilidades diferentes numa cadeia de exploração completa — uma tarefa extremamente difícil, mesmo para hackers humanos. Um relatório de investigação sobre cibersegurança observou que essa «cadeia de vulnerabilidades» frequentemente ultrapassa os limites de sistemas inicialmente seguros, à semelhança da abordagem utilizada no ataque Stuxnet às centrífugas das instalações nucleares do Irão há alguns anos.

Além disso, segundo a Anthropic, quando recebe instruções explícitas, o Mythos consegue até identificar e explorar «vulnerabilidades de dia zero» em todos os principais navegadores.

A Anthropic afirmou que utilizou o Mythos para detetar vulnerabilidades no código do Linux. Jim Zemlin salientou que o Linux «está na base da maioria dos sistemas informáticos atuais», desde smartphones Android e routers de Internet até aos supercomputadores da NASA, e é praticamente omnipresente. O Mythos consegue detetar autonomamente falhas em várias bases de código de código aberto e, caso essas vulnerabilidades sejam exploradas, os atacantes podem potencialmente assumir o controlo total de toda a máquina.

Atualmente, dezenas de colaboradores da Linux Foundation começaram a testar o Mythos. Zemlin considera que uma questão fundamental é saber se o modelo da Anthropic pode fornecer informações valiosas para ajudar os programadores a criar software mais seguro desde o início, reduzindo assim a criação de vulnerabilidades.

«Somos muito bons a encontrar vulnerabilidades», disse ele, «mas não somos muito bons a corrigi-las.»

[Link para o artigo original]

Também poderá gostar de

Relatório Matinal | Coinbase Ventures realiza o seu primeiro investimento na ENA; SpaceX planeia definir o preço do IPO em 135 dólares por ação

Visão geral dos eventos importantes do mercado a 3 de junho

Texto integral e análise do discurso do CEO da SanDisk na 42.ª Conferência Anual de Decisões Estratégicas da Bernstein

O valor central do discurso de Goeckeler reside no fornecimento de um quadro narrativo altamente transparente e logicamente claro para a transformação corporativa.

Relatório da Manhã | Strategy vendeu 32 BTC e mais de 800.000 ações da MSTR na semana passada; Binance anunciou oficialmente o seu portal de negociação de ações dos EUA; Polymarket estabeleceu uma parceria exclusiva com a OneFootball

Visão geral dos eventos importantes do mercado a 1 de junho

Bootcamp de Trading WEEXPERIENCE na Polónia: Como a WEEX e a FireCrew estão a tornar o trading de cripto acessível a todos

A WEEX estabeleceu uma parceria com a Firecrew na Polónia, no dia 29 de maio, para o bootcamp de trading WEEXPERIENCE. Leia o resumo das sessões de especialistas sobre análise técnica, psicologia de trading e ferramentas de IA que comprovam a missão da WEEX de tornar o trading de cripto acessível a todos.

Paris Reina Supremo: Como o PSG esmagou o sonho do Arsenal numa final histórica da UCL

PSG vs Arsenal, drama, destino e uma maldição de 20 anos quebrada. Reviva a final da UCL de 2026, onde o PSG defendeu o seu título num tenso desempate por grandes penalidades, à medida que o momento de ouro de Ousmane Dembélé e uma falha agonizante escreveram a história em Budapeste.

TaiJi conclui financiamento estratégico de 3,5 milhões de dólares, com investimentos da Castrum Capital, Becker Ventures e Coinvestor Ventures

A plataforma de inteligência de mercado on-chain Web3 impulsionada por IA, TaiJi, anunciou a conclusão de um financiamento estratégico de 3,5 milhões de dólares, que irá acelerar a construção de um novo motor de simulação de mercado por IA.

Bitcoin estagnado perto dos 73 mil dólares? Como os traders estão a encontrar recompensas num mercado lateral em junho

O Bitcoin está estagnado perto dos 73 mil dólares, à medida que os fluxos dos ETFs arrefecem e a incerteza macroeconómica mantém os traders cautelosos. Eis como campanhas de recompensas como a WEEX Joker Party ajudam os traders a manterem-se ativos durante um mercado lateral em junho.

Como fazer staking de Solana: Um guia passo a passo para 2026

Encontre as melhores moedas cripto de IA de 2026 com escolhas baseadas em dados: Bittensor, Render e projetos emergentes. Inclui métricas on-chain, riscos e guia de negociação na WEEX.

Preço Garantido já disponível na WEEX: Execute com maior precisão

Para proporcionar uma experiência de negociação de futuros mais fluida, a WEEX futures lançou a funcionalidade "Preço Garantido".

A investigação mais recente do BIS: O futuro das stablecoins e o panorama monetário global

O relatório considera que as stablecoins reforçarão o domínio do dólar americano a curto prazo, representando riscos para a soberania monetária dos mercados emergentes e das economias em desenvolvimento, enquanto a trajetória a longo prazo dependerá dos seus modelos de adoção, respostas regulatórias e da sinergia de...

Entrevista com o mestre da macroeconomia Raoul Pal: A competição em IA está a dar origem a uma "singularidade económica"; não desista facilmente dos seus ativos nos próximos quatro anos

Comparado com o Nasdaq, o Bitcoin encontra-se atualmente numa posição de sobrevenda severa dentro da sua tendência de longo prazo.

Why is Peter Thiel, behind Palantir, preparing an exit in Argentina?

Palantir, political risk, and the self-preservation of technological oligarchs.

A crise de meia-idade dos GPs de Cripto: Sem PMF, não há novo cheque dos LPs

Após perderem o fascínio pelas estrelas e pelo mar, a maioria dos GPs de Cripto que não conseguiram obter retornos excedentes neste ciclo deve lançar pragmaticamente um produto com PMF, seja provando a sua capacidade de ajudar os LPs a obter retornos excedentes através de um nicho de mercado, ou resolvendo problemas específicos para LPs/parceiros...

Relatório Matinal | Coinbase Ventures realiza o seu primeiro investimento na ENA; SpaceX planeia definir o preço do IPO em 135 dólares por ação

Visão geral dos eventos importantes do mercado a 3 de junho