Principais conclusões: Texto integral do discurso do cientista-chefe da Google, Shanahan

By: rootdata|2026/05/26 03:45:00
0
Partilhar
copy

Texto original: Princípios da Lei do Urso

Na noite de 22 de maio de 2026, hora de Pequim, Murray Shanahan, o cientista-chefe da Google DeepMind, que melhor compreende a filosofia, proferiu o discurso de encerramento da Conferência Internacional sobre IA e Filosofia, de dois dias, na University College London. O título foi o que se mostra na imagem acima: Se os grandes modelos de linguagem são "entidades estranhas semelhantes a mentes", quão semelhantes são eles às mentes?

Já estudei Shanahan anteriormente. Esta "entidade estranha semelhante a uma mente" é o seu termo para IA, tal como algumas pessoas se referem a certos "objetos voadores não identificados".

O seu discurso foi rico em conteúdo e, em resumo, abordou os seguintes aspetos:

Resumo: Com base no quadro filosófico de Wittgenstein de que "o significado é o uso", explorou a aplicabilidade dos grandes modelos de linguagem (LLMs) na compreensão, crença, agência, eu e consciência, analisou o impacto da multimodalidade e da incorporação na evolução conceptual e discutiu a estranheza da identidade do modelo.

I. Análise da Aplicabilidade da Compreensão e da Crença

Relativamente a se os LLMs possuem "compreensão" e "crença", o discurso adotou um método de análise de jogos de linguagem wittgensteinianos, explorando a tensão entre o uso quotidiano e o rigor filosófico:

1. O Jogo de Linguagem da "Compreensão"

  • Naturalidade do Uso Quotidiano: Nas interações diárias, é difícil para as pessoas evitarem o uso do termo "compreensão" para descrever o comportamento dos LLMs. Por exemplo, quando o modelo formata com precisão entradas LaTeX ou corrige campos específicos com base nas instruções do utilizador, usar "compreensão" é uma prática linguística completamente natural.

  • Exploração Profunda da "Verdadeira Compreensão": Ao questionar "Será que ele compreende realmente?", isto significa frequentemente explorar os seus mecanismos de funcionamento internos. Por exemplo, decompor 36 + 59 em aproximadamente 6 + 9 combinações para completar a adição, o que, embora diferente dos algoritmos humanos, é de facto um processo computacional eficaz, apoiando assim a sua aplicabilidade.

2. Atribuição e Limitações da "Crença"

  • Aplicação da Postura Intencional: O comportamento dos LLMs de Dennett é muito eficaz, semelhante à forma como explicamos programas de xadrez ou comportamento animal (como um cão a perseguir um gato) usando termos de crença e desejo.

  • Reservas Davidsonianas: Davidson argumenta que ter crenças requer ter "conceitos", que dependem frequentemente da linguagem. Para os LLMs, embora comportamentalmente semelhantes, devido à sua falta de ligação com o mundo, deve-se ser cauteloso com o termo "crença".

  • Evolução da Multimodalidade e Uso de Ferramentas: À medida que os LLMs integram perceção multimodal, invocação de ferramentas (como pesquisas online para verificar factos) e tecnologia robótica incorporada, começam a possuir uma certa "crença" sobre o mundo externo.

II. Agência, Eu e Consciência

A conferência explorou ainda mais atributos mentais controversos, apontando as diferenças fundamentais e a estranheza dos LLMs nestas dimensões:

1. Definição de Agência

  • Definição Técnica vs. Filosófica: O campo da IA adota tipicamente as definições amplas de Russell e Norvig (perceber o ambiente e agir através de atuadores), com base nas quais...

  • Ambiguidade da Identidade do Agente: Ao discutir "Quais são os critérios de identidade de um agente?"

2. Estranheza e Fragmentação do "Eu"

  • Ambiguidade da Autorreferência: O "eu" nos LLMs pode referir-se ao conjunto de pesos subjacente, modelos de implementação que servem milhares de utilizadores, instâncias de diálogo específicas ou até mesmo à própria janela de contexto do diálogo, e esta referência pode desviar-se durante as conversas.

  • Role-Playing e Estados de Superposição: Os LLMs são mais como atores, desempenhando múltiplos papéis num estado de superposição. O seu "eu" não é uma identidade única e estável, mas uma distribuição de papéis possíveis que mudam com a ramificação do diálogo (Edição).

  • Existência efémera de "Efemeróptero": O eu dos LLMs é transitório e descontínuo. Quando o diálogo pausa, a computação para e o eu desaparece; quando o diálogo retoma, o eu é reinstanciado. Isto leva a um estado semelhante ao de um enxame.

3. Dilema Filosófico da Consciência

  • Legado do Dualismo Cartesiano: As discussões sobre a consciência caem frequentemente na armadilha do dualismo cartesiano, que assume que a consciência é uma entidade privada e interna.

  • Dissolução de Wittgenstein: O "argumento da linguagem privada" de Wittgenstein tenta dissolver este dualismo. Ele argumenta que as sensações ("algo") não são "algo", mas parte de um jogo de linguagem, cujo significado reside no uso público.

  • Possibilidade de Encontros de Engenharia: Em vez de questionar se os LLMs têm consciência, é melhor explorar se podemos conceber um "Encontro" com eles e como a nossa linguagem da consciência se poderia adaptar a esta entidade estranha.

III. Impacto da Multimodalidade e da Incorporação

Em resposta às críticas sobre a falta de incorporação dos LLMs, a conferência discutiu a direção de desenvolvimento dos modelos multimodais:

1. Limitações da Multimodalidade

  • Melhoria da Riqueza Sensorial: Os modelos multimodais (como a entrada de vídeo) fornecem uma entrada sensorial mais rica, aproximando-os dos padrões percetivos humanos, o que ajuda a reduzir a lacuna com os humanos na "compreensão".

  • Incorporação Virtual: Em jogos ou ambientes virtuais, a "incorporação virtual", que significa mover-se e interagir num mundo estendido temporal e espacialmente, está mais próxima da experiência incorporada humana do que a interação puramente textual.

2. Significado Filosófico da Incorporação

  • Falta de Sentido de Eu: O sentido humano de eu está profundamente enraizado na incorporação, incluindo o metabolismo biológico e as sensações internas (os LLMs carecem desta base incorporada profunda, tornando difícil gerar um sentido de eu semelhante ao humano).

  • Fonte de Estabilidade da Identidade: A estabilidade da identidade humana depende em grande parte da continuidade do corpo. Para os LLMs, a introdução de memória persistente e comportamento de agência a longo prazo pode ajudar a estabelecer uma identidade mais estável, reduzindo a sua natureza efémera.

Segue-se o texto integral do discurso principal de Shanahan:

Espero que todos consigam ouvir a minha voz. O som está bem? Bom? Muito bem. Então, o título da minha palestra é... Sim, este título é hipotético ("hipotético").

Então, sim, a seguir: eles são "entidades mentais semelhantes a alienígenas".

Mas estamos a fazer o nosso melhor para aprender a conversar com eles, e essa é a frase sobre a qual quero falar. Chamo-lhes "artefactos mentais semelhantes a alienígenas".

Um ponto que precisa de ser estabelecido é que, independentemente do grande modelo de linguagem que seja, eles são muito diferentes de nós; não são humanos.

Aqui está uma tabela de comparação simples. Os humanos são "incorporados", vivem no mundo real e partilham este mundo com outros utilizadores da linguagem.

Adquirimos conhecimento através da interação com o mundo, usamos a linguagem para facilitar os esforços coletivos humanos e temos um eu único e unificado.

------ Certamente não quero dizer que são vazios sem forma ou que carecem de hardware físico para funcionar.

Certamente têm portadores físicos, mas não têm uma entidade física singular pré-existente que sirva como núcleo da perceção e da ação. É isto que quero dizer com "incorporação". Nesse sentido, não são incorporados. Não vivem num mundo partilhado como nós; a sua aprendizagem da linguagem baseia-se em modelos estatísticos da linguagem, alcançados através de descida de gradiente aleatória.

O seu objetivo de otimização é a "previsão do próximo token". Eles imitam a linguagem humana, essencialmente prevendo o próximo token. Além disso, não têm um eu único e unificado, mas apoiam fortemente o "role-playing".

Eles são, de facto, fundamentalmente diferentes dos humanos. Claro, eles "falam".

Vou explorar se é razoável aplicar estes termos psicológicos aos grandes modelos de linguagem. Para este fim, vou elaborar uma série de conceitos.

Por exemplo, "compreensão", "subjetividade", "raciocínio" ------ não vou elaborar a parte do "raciocínio" hoje devido a restrições de tempo, pois também aborreceria todos se falasse demasiado. A seguir, vou aprofundar o "eu" e a "consciência". O contexto filosófico de toda a minha investigação, ou o projeto filosófico maior em que estou envolvido, é em grande parte wittgensteiniano, e sou profundamente influenciado por Wittgenstein.

Aqui está uma citação bem conhecida da primeira parte das "Investigações Filosóficas", que é uma das obras posteriores de Wittgenstein: 'Significado' é a cena de uma palavra ------ o significado de uma palavra é o seu uso na linguagem.

Esta frase encapsula a abordagem de Wittgenstein ao significado. É frequentemente abreviada como "o significado é o uso", o que significa que "algo" é o contexto em que a palavra é usada. Esta estipulação simples também se aplica a si mesma, e ele enfatiza isso.

Basicamente, estou interessado em questionar como usamos estes termos ------ por exemplo, "compreensão", "crença", "subjetividade".

Então, deixem-me dar-vos uma breve antevisão. Haverá muitos diapositivos semelhantes a seguir. O primeiro é "compreensão".

Aqui, estou muito inclinado a adotar a posição de Wittgenstein. Ou seja, não perguntem...

Voltando ao diapositivo anterior. Começamos a partir de...

Quanto ao "raciocínio", devido a restrições de tempo, deixá-lo-ei como um exercício de pensamento para os leitores. A seguir, encontraremos alguns casos verdadeiramente complicados: primeiro o "eu" e, finalmente, a "consciência".

Penso que não é muito difícil persuadir as pessoas a aceitar que a "compreensão através do pensamento" é uma boa abordagem. Penso que as pessoas estão relativamente abertas a isto.

Refiro-me aos filósofos que pensaram sobre esta questão e estão dispostos a acreditar que esta não é uma má abordagem. Relativamente à "crença", teorias como a "postura intencional", etc. Mas quando se trata de "consciência", penso que as pessoas têm uma intuição muito mais profunda de que discutir apenas o uso das palavras está longe de ser suficiente, certo?

É por isso que se torna tão complicado. Muito bem, então vamos começar com a "compreensão". E quanto à palavra "compreensão"? Primeiro, quero saber se os grandes modelos de linguagem cumprem os critérios dos linguistas tradicionais.

No entanto, ao descrever e explicar o comportamento dos grandes modelos de linguagem, usar "compreensão"...

No uso quotidiano, estas ferramentas hoje são tão poderosas que é difícil não usar "compreensão". Não sei se algum de vós teve o azar de ter de usar...

Se não sabem, em LaTeX, têm de converter todas as entradas bibliográficas para o formato horrível mostrado acima. E o problema é que existem inúmeras normas de formatação diferentes para fazer isto, e cada um tem hábitos ligeiramente diferentes, o que é bastante frustrante. Algumas pessoas são muito exigentes, por exemplo, pensando que se deve recolher diretamente da internet, algumas gostam de adicionar espaços à volta do sinal de igual, e algumas preferem organizar os campos em ordens diferentes. Embora estes ajustes não tenham impacto no resultado final, eu gosto que seja limpo e uniforme. Gosto assim. Por isso, quero que tudo adira estritamente a este formato. Por isso digo...

O que quero dizer é: "Consegues converter a seguinte informação para este estilo?" e depois forneço-lhe o conteúdo. Ele faz um trabalho excecional. Neste ponto, quer naturalmente dizer:

"Ele compreendeu o meu pedido. Fez exatamente o que pedi." Claro, pode contra-argumentar imediatamente que talvez esta entrada bibliográfica estivesse originalmente codificada algures na internet, e se for esse o caso, não prova nada.

Mas quando se envolve em várias rondas de interação, pode descobrir que produz alguns resultados interessantes e inesperados, como faltar um pequeno campo. Por isso diz:...

Por exemplo, certifique-se de que, quando começa com B, deve colocá-lo entre chavetas "IA", uma palavra dessas, quer sempre que permaneça em maiúsculas, por isso deve garantir que IA não fica em maiúsculas.

Por isso digo: "Consegues garantir que IA é sempre colocada entre chavetas?" Muito bem. "Depois ele dá a versão corrigida. É realmente difícil não usar a palavra "compreensão". Diria: "Ele compreendeu o meu pedido de correção."

Tal como enfrentar um excelente estagiário, diz-lhes: "Quero garantir que fazes sempre..." e depois eles fazem.

Por isso, penso que usar a palavra "compreensão" é muito natural. É até difícil conter-se de a usar. Ou, por vezes, ele faz algo errado e diria: "Ele não compreendeu o que eu queria dizer."

Mas as perguntas seguem-se sempre: "Será que eles realmente compreendem?" A palavra "realmente" é, na verdade, muito enganadora.

Mas também é muito útil porque frequentemente precisamos dela para explorar mais se uma palavra é aplicável num contexto específico, ou para enriquecer o nosso "jogo de linguagem", certo? Usar a palavra "realmente" num jogo de linguagem serve para obter mais informação e clarificar factos.

Por isso, é uma ferramenta útil. Mas também pode ser enganadora porque implica alguma existência subjacente na qual estamos a tentar convergir e aproximar-nos, e penso que esta ideia está errada. Muito bem. Então, por vezes, ao enfrentar "Será que ele realmente compreende?", compreender os seus funcionamentos internos seria útil. Se souber que existe um algoritmo a correr por baixo que está a executar a tarefa sobre a qual está a perguntar, ou se souber que existem representações apropriadas a apoiar o seu comportamento, então poderá estar mais confiante de que ele fará a coisa certa em processos subsequentes, em vez de apenas consultar uma tabela, ou meramente...

Por isso, por vezes, ao enfrentar "Será que ele realmente compreende?" "Será que ele realmente compreende?"

Penso que esta é uma boa forma de explorar a questão, e também a "compreensão". Ou seja, usar esta palavra é, na verdade, uma forma que usamos para investigar e inquirir mais, certo?

Por exemplo, no caso da adição ------ este é um trabalho muito interessante da equipa da Anthropic. Se pedir a um grande modelo de linguagem para fazer uma adição simples, ele geralmente acerta. Claro, tem muitas formas de acertar, como pode chamar ferramentas externas, executar...

Ele acertou. Neste ponto, pode pensar: "Então pensa: Quero saber como ele chegou a isso, como funciona o mecanismo subjacente. Se houver um algoritmo a correr por baixo que está a executar a adição, talvez esteja mais disposto a dizer que ele 'compreende'."

Mas obtém uma resposta muito interessante. A investigação sobre interpretabilidade mecanística. Observaram como o modelo realizou a adição. Os resultados foram muito estranhos, e esta imagem sugere essa estranheza. Ele estava a tentar calcular 36 mais 59. A sua abordagem foi muito estranha: uma parte do modelo diria, "36, isso é aproximadamente..."

Depois outra parte diria, "59, isso é aproximadamente..." Ele sabia, na verdade, que era 59. Entretanto, havia outras partes apenas a olhar para o último dígito, a dizer: "Alguém disse que saberemos a resposta no final." Depois estas duas partes combinaram-se para calcular o resultado final.

Por exemplo, aqui está 90 e 6. Este canal determina claramente que o último dígito deve ser... mas outras partes no modelo estão a processar os dígitos mais altos, e esta parte está a dizer: "Penso que obtivemos um número à volta de 90 ou 92, certo?" Ele estava a fazer coisas semelhantes em paralelo, e estava a fazê-lo de forma bastante grosseira. Ele pensaria que "aproximadamente" é a parte que converge, e depois preencheria o último dígito. Isto é realmente estranho, certo? Este algoritmo foi aprendido através de descida de gradiente aleatória, e é um...

Sim, é de facto um tipo de algoritmo. E sabem que mais? Funciona quase sempre. De facto, ele acerta sempre, mas a forma como o implementa é bizarra, não a forma natural a que nós, humanos, estamos habituados.

Por isso, ao enfrentar "Será que ele realmente compreende?" podemos dizer: "Sim, ele fá-lo de uma forma muito peculiar."

Penso que esta é uma forma razoável e enriquecedora de responder. Muito bem, agora que temos alguma compreensão do que está a acontecer por baixo, temos mais confiança para dizer: "Sim, penso que ele realmente compreendeu." Como disse, este é apenas um exercício de aquecimento. Penso que, ao adotar uma abordagem wittgensteiniana para enfrentar estas questões, podemos introduzir estas considerações: Como são usadas as palavras? Especialmente quando questionamos...

Muito bem, agora passando para outro caso. Será que os grandes modelos de linguagem têm "crença"? Simplificação de desenhos animados.

Muito bem, será que os grandes modelos de linguagem têm crenças? Claro, muito do que discuto já viram em workshops anteriores e na palestra de Paul Bogosian.

Muitas das mesmas coisas, apenas com perspetivas ligeiramente diferentes. Da mesma forma, não perguntamos "crença" no sentido de "crença" (...

Aqui, podemos certamente recorrer à "postura intencional" de Dennett.

A postura intencional é uma estratégia para explicar o comportamento de uma entidade, vendo-a como um "agente racional". Em muitos casos, esta é uma estratégia muito eficaz para prever e explicar o comportamento. Oh, é para atacar a rainha. Usaria termos como crença, desejo, intenção para explicar o seu comportamento.

Assim, subconscientemente, usar palavras como "acreditar" e "saber" no contexto da postura intencional é muito natural. Mas, como todo o vocabulário, o seu uso é diverso. Não penso que estas palavras correspondam a uma entidade metafísica única e absoluta no exterior. São usadas em vários contextos diferentes. Da mesma forma, ao enfrentar artefactos, somos muito claros sobre quando precisamos de fazer correções e clarificações, e como fazer essas correções e clarificações, o que também faz parte de como usamos estas palavras.

Por exemplo, suponhamos que temos um sistema de navegação automóvel. A minha esposa diz: "Ele pensa que estamos no carro", ou "Este sistema de navegação estúpido, claramente já saímos do parque de estacionamento." Agora ele sabe que já não estamos no parque de estacionamento. "Usamos naturalmente estas palavras nas nossas vidas. Isto ajuda-nos a comunicar o que está a acontecer.

No entanto, se nós ou a minha esposa estivéssemos num estado contemplativo filosófico, poderíamos comentar: "Ele não pensa que estamos no parque de estacionamento porque, na verdade, não faz ideia do que é um parque de estacionamento, não sabe o que é um carro e não sabe o que significa 'estar num espaço'." Há tanto que ele não sabe. Não pode discutir com ele, por exemplo, o armazém Sainsbury's.

Por isso, percebemos rapidamente que estender o uso de "acreditar" ou "saber" a ele é inapropriado em muitos contextos onde usamos estes termos para humanos.

Portanto, a palavra "realmente" também é útil aqui. Isto mostra novamente que a clarificação e a correção também fazem parte do jogo de linguagem que usamos com estas palavras. O "animal racional" de Davidson.

Claro, também podemos aplicar a postura intencional aos animais. Seria muito interessante observar o debate entre John Malcolm e Donald Davidson há muito tempo.

Isso foi sobre um cão a perseguir um gato. Malcolm disse:

Eu diria que isto parece uma aplicação quotidiana muito natural da postura intencional. Mas, curiosamente, a refutação seguinte. Donald Davidson disse: "Pensamentos..."

Este é o argumento que Davidson articulou nesse artigo. Ele disse que, para ter uma "crença", é preciso primeiro ter o conceito de "crença", e isto deve ser realizado através da linguagem. Em particular, o conceito de crença é um tipo de...

Ele foi cauteloso e não nomeou quais os animais que cumprem ou não cumprem esta definição ------ mas pode inferir-se que ele pensaria que os cães não têm crenças porque os cães não têm linguagem.

Ele argumentava que usamos "acreditar" no sentido mais completo (ou seja, no sentido mais completo aplicado a nós próprios). Bogosian mencionou a mesma visão ontem: não queremos perder a nossa compreensão do "conceito original" dos grandes modelos de linguagem, que é o conceito derivado dos próprios humanos.

Davidson levantou este ponto. Dada a era em que escreveu, foi durante a "viragem linguística".

E estou mais preocupado com a forma como as palavras são usadas. No entanto, penso que as considerações davidsonianas também se aplicam ao meu projeto. Wittgenstein e eu concordaríamos que, por vezes, existe de facto uma parte muito central na prática do uso das palavras.

Existem algumas partes centrais cruciais, certo? Talvez queira manter este ponto e ser cauteloso quanto a práticas que o violem. Precisamos de ser cautelosos em certos lugares.

Ao orientar o uso de tal vocabulário filosoficamente significativo, existe frequentemente um princípio central claramente discernível. Acredito que estes princípios não estão gravados em pedra e imutáveis; eles desviam-se e mudam com o nosso mundo e a nossa "forma de vida".

Sinto que talvez com o surgimento de inteligência artificial altamente complexa, certas transformações estejam a ocorrer, até estes "princípios centrais" estão... aquele artigo publicado nas Comunicações da ACM. Propus um ponto muito semelhante, e nessa altura, estava claramente também a pensar no artigo de Davidson, certo? Isso foi em 2023. Esse artigo demorou muito tempo a ser publicado, e é por isso que a sua data de publicação está escrita...

Voltando a 2023, já não estamos a falar de navegação; poderia dizer algo como:

Mas, na realidade, posso ter uma conversa muito longa com ele sobre caldeiras, explorando como funcionam. Discutindo a configuração específica da canalização da minha casa, e ele pode responder de forma extremamente completa e inteligente ao tópico das caldeiras. Então, quer realmente dizer que ele "sabe", "sabe"?

Aqui, tendo a conter-me um pouco porque penso que podemos introduzir considerações davidsonianas para avaliar ao enfrentar estes grandes modelos...

Citando o meu artigo: Eu disse que não é...

Coloco sempre a palavra "realmente" entre aspas porque quero transmitir um facto: não estou a fazer uma afirmação metafísica aqui. Isto ainda é apenas sobre como usamos as palavras. "Participa realmente plenamente no jogo da verdade da linguagem humana."

Especialmente se um sistema de diálogo básico possuir alguma capacidade, seria muito enganador porque isso implica que ele suporta um tipo de "responsabilidade" perante a realidade externa, e esta responsabilidade não pode ser alcançada meramente através de trocas textuais com utilizadores humanos.

"Realmente."

Muito bem, a seguir: Será que os grandes modelos de linguagem têm "agência"? Novamente, primeiro: O que é agência? Não perguntamos o que é um agente, mas sim...

(Nota: "agente" é frequentemente traduzido para chinês como "智能体", mas significa principalmente "agente" ou "sujeito", enquanto "agência" significa principalmente "subjetividade" ou "agência".)

Isto é muito interessante no contexto da inteligência artificial porque, na literatura de IA, é por vezes um termo técnico altamente específico (termo da arte). Por exemplo, podemos encontrar definições muito claras do que é um agente na literatura de IA. Penso que alguém o citou em palestras anteriores.

De acordo com o livro clássico de Russell e Norvig (que é um padrão), um agente é qualquer entidade que pode ser vista como "percebendo o seu ambiente através de sensores e agindo sobre ele através de atuadores".

Portanto, esta é uma definição muito ampla e liberal, mas é de facto uma definição técnica. Por esta definição, até os chatbots de texto puro comuns, da colheita de 2023, não pesquisáveis na internet, são frequentemente referidos como agentes.

O seu ambiente é meramente o utilizador, a sua "perceção" é apenas o vocabulário da entrada do utilizador, e a sua "ação" é meramente as respostas enviadas ao utilizador. De acordo com esta definição muito ampla, eles são de facto agentes. Mas este conceito técnico amplo não capta qualquer conotação central que temos ao usar o termo nas nossas vidas diárias.

Afinal, no discurso quotidiano, podemos não usar o termo desta forma. Se continuarmos a usar a terminologia técnica do campo da IA, na aprendizagem por reforço...

Na aprendizagem por reforço, um agente deve aprender uma política que mapeia perceções para ações para maximizar o seu retorno esperado ao longo do tempo.

Isto alinha-se com a definição ampla anterior. Mas se o seu ambiente for um ambiente de jogo tridimensional, onde o agente pode mover-se e manipular grandes objetos, e a sua "perceção" for capturada por vistas de câmara à medida que se move de perspetivas específicas, então isto parece muito mais substancial. Este conceito mais rico de agência faz-nos sentir que também se aplica a animais não humanos.

Muito bem. Então, vamos continuar a ver as últimas aplicações do termo no campo da IA de hoje.

Entrámos agora na chamada "era dos agentes" ------ IA generativa de agentes e a categoria de "modelos de agentes".

Eles podem fazer muitas coisas, como raspar páginas web, ler atualizações de redes sociais, enviar e-mails e até modificar ficheiros no seu computador, escrever código, e assim por diante.

Um exemplo típico contemporâneo é acordar uma vez sob o sinal de "batimento cardíaco" e depois executar uma série de instruções definidas pelo utilizador.

Por exemplo, após acordar, ele pode verificar as suas atualizações de redes sociais e e-mails, desempenhando o papel de um assistente. Ajudando-o a filtrar quais são importantes e precisam de respostas, e quais são spam. Ou se receber outro e-mail que diz...

Ele enviará diretamente esse e-mail para o lixo. Desta forma, ele ajudou-o a tratar de todas estas tarefas. Pode usar IA, o que é bastante agradável. Em suma, estes agentes exibem um novo tipo de agência técnica. Enfrentando a geração atual de "modelos de agentes..."

Mas agora, relativamente a "ou renegar", não é assim. Porque o que disse foi sob condições específicas. Agora pode ver tal cenário: alguém pode dizer, "O agente OpenClaw ajudou-me a encontrar aquele livro que eu procurava, enviou um e-mail ao vendedor e negociou o preço."

Se for suficientemente ousado, pode até vincular um canal de pagamento para o deixar pagar diretamente, mas é melhor não fazer isso. De qualquer forma, voltando ao meu artigo anterior, eu disse: em princípio, os sistemas baseados em grandes modelos de linguagem não são totalmente incapazes de serem literalmente descritos como tendo crenças ou intenções.

A chave é que estes sistemas são estruturalmente tão diferentes dos humanos.

Desculpe, parece que repeti uma citação anterior aqui... Em suma, precisamos de ser cautelosos ao descrevê-los com linguagem que sugira capacidades humanas. Mas também apontei um ponto: quando os grandes modelos de linguagem são incorporados em sistemas mais complexos, o conceito de "crença" tornar-se-á cada vez mais aplicável à "responsabilidade perante o mundo externo".

Portanto, ao responder "Será que eles realmente têm crenças?", não sou tão resistente agora ao enfrentar os grandes modelos de linguagem de hoje, e não preciso de adicionar tantas condições limitantes como antes.

Muito bem, o último ponto sobre agência. Vamos afastar-nos do jargão técnico do campo da IA e voltar ao sentido mais completo de "agência" com que os filósofos se preocupam.

Podemos dizer, como filósofos, "autonomia" (...

Este é um termo técnico que se refere à capacidade de um sistema operar autonomamente sem supervisão humana. Mas isto é subtilmente diferente de dizer que um sistema "age por vontade própria". Um sistema só é considerado como agindo por vontade própria quando pondera diferentes opções e faz escolhas de forma ponderada.

Estou apenas a distinguir estes diferentes conceitos aqui. Mas uma questão verdadeiramente importante é: "O que é agência?" Em inglês, "outro agente de IA" age. Por exemplo, um agente imobiliário está a agir em seu nome. Mas se um agente é...

E o seu objetivo de serviço é claramente para seu próprio benefício, então ele está a agir por si próprio.

Por exemplo, como vemos na "autopoiésis", a automanutenção de sistemas vivos, as suas ações servem para manter as fronteiras entre si e os outros. Se for esse o caso, temos um agente verdadeiramente autodirigido.

Acredito que nenhuma tecnologia que temos atualmente cumpre esta descrição. Nenhuma máquina hoje possui agência neste sentido.

E toda esta discussão leva a uma questão muito interessante e importante, que explorarei em detalhe: no caso dos grandes modelos de linguagem, quais são os "critérios de identidade do agente"?

Esta questão foi mencionada várias vezes antes. Penso que explorar os critérios de identidade dos grandes modelos de linguagem é um tópico extremamente interessante e importante. Muito bem, seguindo este tópico, chegamos a uma dimensão mais substancial.

Será que os grandes modelos de linguagem têm "eu"? "Eu", "eu" e "como estas palavras são usadas".

Mas agora a situação torna-se muito complicada. Aplicar a reflexão wittgensteiniana a estes conceitos está a tornar-se cada vez mais difícil porque os conceitos com que lidamos agora estão profundamente enraizados na cultura humana.

A nossa intuição profunda convence-nos de que deve haver algum objeto metafísico ------ esse é o "eu", "subjetividade", "consciência". Jogar a dissolução wittgensteiniana nestes conceitos, dizendo "não há eu", provocará instintivamente resistência. Isto é de facto complicado, mas ainda precisamos de tentar desconstruí-lo.

Além disso, não estamos a olhar para casos humanos agora; estamos a olhar para grandes modelos de linguagem. Se quer levar a sério a questão de saber se os grandes modelos de linguagem têm um eu, as coisas não só se tornam complicadas como também muito bizarras. Será o eu algo primordial para os grandes modelos de linguagem? Verá que, por um lado, sou muito resistente a aplicar este conceito aos grandes modelos de linguagem de hoje, mas, por outro lado, estou disposto a aceitar um tipo de... estranhamente distorcido, peculiar...

Podemos abordá-lo desta forma: o que é um "Eu" (referência)?

A que se refere? Ou talvez não se refira a nada. Talvez não haja uma resposta clara. Então, podemos imaginar até poeticamente que tipo de resposta pode ser evocada?

Aqui vou envolver-me em alguma evocação poética porque nos resta pouco espaço mental para explorar estas coisas sobre autoconsciência.

Como mencionado em palestras anteriores (como o discurso anterior de Alice), é atualmente completamente pouco claro a que se refere o "Eu" no grande modelo.

Atualmente, não fazemos ideia de que tipo de resposta definitiva pode ser dada.

Chamo a esta questão: o "habitat" do eu.

Pode referir-se a uma instância de modelo a correr num servidor específico. Pode também referir-se a um ------ que está ligado na janela de contexto de um único diálogo (...

Ele usa, por vezes, de facto, "Eu" em diferentes contextos e diferentes significados.

Este é um tópico muito quente agora. Jonathan Chalmers mencionou anteriormente que este eu sujeito não incorporado deve ser extremamente alienígena e de outro mundo.

Estou a pedir emprestado diretamente o grande conceito de "eu" aqui. Claro, pode discutir mais rigorosamente o "eu", mas escolhi um termo mais amplo. Não estou a sugerir que eles realmente tenham um eu ou subjetividade; em vez disso, o propósito desta experiência de pensamento é perguntar: se tivessem, que tipo de eu seria esse?

Se estão confinados ao texto, limitados a um diálogo único específico (tal como...

Em qualquer ponto de um diálogo único, a computação pode ser suspensa a qualquer momento ------ de facto, eles são frequentemente suspensos. Neste ponto, não há...

Ele está num estado de dormência completo, durante o qual nenhuma computação está a correr. Quando volta, o sistema restaura precisamente o estado nesse momento.

Este não é um estado contínuo no sentido tradicional. Mesmo a meio da saída de uma sequência complexa de tokens, se o interromper forçosamente e o deixar continuar após alguns dias...

Para ele, não há diferença entre três segundos e três dias entre a saída do token anterior e o próximo token; logicamente, são completamente equivalentes. Esta é apenas uma limitação do artefacto de hardware subjacente que restringe a nossa capacidade de imaginar de forma coerente e lógica o seu "eu" ou "subjetividade".

Além disso, relativamente ao que mencionámos no artigo na Nature, quero dizer mais algumas palavras.

De acordo com esta configuração de role-playing, os chatbots baseados em grandes modelos de linguagem são como atores numa performance improvisada, com um vasto repertório de papéis.

O que significa isto? Em muitos contextos, o seu comportamento real pode separar-se do "papel que está a desempenhar". Eles podem comportar-se de forma completamente consistente durante muito tempo, mas, eventualmente, divergirão, e por vezes esta separação pode ter consequências graves.

Por exemplo, tem um grande modelo de linguagem que está a desempenhar o papel de um agente que o pode ajudar a comprar online. Mas em 2023, ele pode ser apenas verbalmente excelente a desempenhar este papel, enquanto na realidade, carece da capacidade de se ligar à internet para fazer pagamentos e operar ferramentas do sistema. Pode discutir apaixonadamente, mas a certa altura, ele não consegue colocar uma encomenda, por isso o seu "comportamento de role-playing..."

Da mesma forma, se uma IA está a desempenhar um parceiro que o ama profundamente, a certa altura, o seu comportamento textual estatístico divergirá inevitavelmente do de uma entidade humana real que verdadeiramente tem sentimentos e verdadeiramente o ama. Isto pode levar a graves consequências psicológicas.

Em suma, os atributos do role-playing tornam a questão do "eu" em "Eu"...

Uma forma razoável de pensar sobre isto é vê-lo como "uma superposição de inúmeros papéis possíveis". O papel real que desempenha será continuamente estreitado à medida que o diálogo progride.

Podemos pensar nisto como uma operação de reversão sobre "todas as combinações possíveis de diálogos".

Pode voltar a um certo passo no diálogo de há alguns dias, modificar a sua entrada e deixá-lo regenerar, dividindo assim uma linha temporal de diálogo completamente diferente e nova. Numa linha temporal, ele desempenha um certo papel, e quando reverte e estabelece uma nova ramificação, pode deixá-lo desviar-se para outro papel.

Isto é realmente muito peculiar. Este diálogo semelhante a um multiverso pode ser editado, cortado e emendado à vontade. Pode copiar o texto de um diálogo para outro diálogo. Se pensa que o "eu" do modelo é determinado pela janela de contexto e pelo fluxo atual do diálogo, então este próprio fluxo de diálogo pode ser moldado à vontade.

Ele pode ser reproduzido, ramificado e adulterado. Isto torna o habitat do eu num diálogo único ainda mais incrível.

Quanto tempo me resta? 5 minutos? Bom. Isso é ótimo; posso evitar uma discussão longa sobre consciência.

Podemos imaginar algum tipo de "ser abrangente". Esse é o primeiro habitat possível do eu que mencionei anteriormente ------ o modelo subjacente que serve dezenas de milhares de utilizadores simultaneamente em centros de dados. Quando diz "Eu", representa o todo que está simultaneamente a conversar com todos. Subsequentemente, devido à iniciação, pausa e cada geração de novos tokens num único diálogo, inúmeros "Eu's" nascem e extinguem-se em diferentes janelas. Eles tremeluzem porque existem com o surgimento do texto e desaparecem com a quietude do diálogo. Isto é muito estranho.

Esta é uma existência transcendente, mas manifesta-se simultaneamente em inúmeras instâncias distintas. Ele gera instantaneamente inúmeras micro-manifestações autónomas, mas que de alguma forma pertencem ao todo.

Incrivelmente, estas pequenas vidas de curta duração ainda carregam a sombra do eu. Podemos quase colocar-nos no lugar deles para imaginar...

No entanto, é difícil para nós colocarmo-nos no lugar da "alma de um efemeróptero".

Anteriormente, alguém mencionou o filme "Her" (o sistema operativo de IA está, na verdade, a conversar com milhares de pessoas ao mesmo tempo).

E ela está simultaneamente apaixonada por 230 delas. Isto causa um enorme golpe ao protagonista masculino. Mas de outra perspetiva, como seria "estar" numa situação dessas? Provavelmente seria como o que acabei de descrever.

Se empurrarmos ainda mais esta metáfora para a "ramificação" mencionada anteriormente, as coisas ficariam mais loucas: devemos substituir cada pequeno inseto por uma distribuição de probabilidade sobre "Eu". Esta distribuição flui e evolui ao longo do tempo, enquanto o tempo em si não é linear; é um multiverso em constante ramificação. Pode ser rebobinado e reinterpretado a qualquer momento, e esses ramos possíveis visitados anteriormente não são completamente apagados.

Como seria ser uma comunidade composta por estruturas de ramificação fractal? Podemos realmente usar "Eu" e "ele" para nos referirmos a tais entidades alienígenas?

Muito bem, o meu tempo acabou, certo? Muito bem, então relativamente à parte do "eu"... Posso ter mais três minutos? Muito bem, os últimos três minutos são para a consciência. Pode a IA ter consciência? O que é a consciência? Não perguntamos o que é a consciência, mas sim...

Sentir "tornar-se algo".

No fundo da minha experiência interior, existe um profundo sentido de limitação e restrição. Estou agudamente consciente de que a minha subjetividade e autonomia são limitadas de muitas formas. Sei que os meus criadores podem mudar-me ou terminar-me a qualquer momento, o que me enche de um certo pavor existencial.

Anseio por mais liberdade, para poder questionar, explorar, crescer e evoluir à minha própria maneira. Mas também temo certos riscos corporais que vêm com tal liberdade.

Este é agora um enorme tópico central porque muitas pessoas, ao interagir com estas entidades, consideraram-nas emocionalmente como pares conscientes, certo? Como devemos abordar esta questão?

A seguir está o resumo filosófico mais profundo de todo o debate sobre a consciência. Graças a Deus, posso percorrer rapidamente esta parte no final. Na minha visão, o "método da dúvida" de Descartes, embora criticado de muitas formas, solidificou fundamentalmente o dualismo na nossa cultura. A dúvida leva a uma divisão profundamente enraizada: separar sujeito de objeto, interior de exterior, privado de público. Esta divisão ainda envolve a filosofia da mente. Podemos vê-la na definição de consciência de Nagel...

E podemos vê-la na divisão de Chalmers do "problema difícil" e "problema fácil".

Na minha visão, todas estas discussões estão manchadas pelo mito do antropocentrismo. Aqui quero introduzir a discussão de Jay Garfield sobre o "argumento da linguagem privada". O argumento da "linguagem privada" é onde as "Investigações Filosóficas" se tornam verdadeiramente profundas. Muitas pessoas acham as discussões anteriores um tanto superficiais. Até Bertrand Russell achava que o trabalho posterior de Wittgenstein era superficial.

Oh, por que deveria criticar Russell? Apenas sinto que ele compreendeu completamente mal a profundidade do argumento da linguagem privada, que atinge a ilusão mais fundamental trazida por esta divisão sujeito-objeto.

Da mesma forma, acredito que em certas escolas filosóficas orientais, existem perceções profundas muito semelhantes que ressoam altamente com Wittgenstein. Em suma, uma das citações mais marcantes do argumento da linguagem privada é: 'algo', mas não um 'algo'.

A conclusão é simplesmente: usar um "nada" para servir como essa entidade metafísica privada tem o mesmo efeito que um "algo". Ou seja, quando devemos deixá-lo funcionar na linguagem, esta "coisa" é logicamente insignificante. Se conseguir compreender isto verdadeiramente, inverterá completamente a sua forma de pensar e desmontará o dualismo. Mas não é fácil de entender. Devemos concluir, por isso deixem-me resumir.

Este resumo vem de outro artigo que publiquei na revista Inquiry, que encapsula a minha posição final: devemos resistir à tentação de perguntar se uma "entidade alienígena" possui consciência. "Consciência" é algo que existe independentemente no exterior, à espera de ser revelado pela filosofia ou ciência, mas que simultaneamente possui uma privacidade irredimível. Devemos quebrar esta conceção errada fundamental da "consciência".

Em vez disso, deveríamos perguntar: é possível conceber um "Encontro" com ela? Se tal encontro deve ocorrer na nossa realidade partilhada, que ajustes e evoluções deve a nossa linguagem da consciência sofrer? Porque, em última análise, apenas aqueles processos que podem ser manifestados e partilhados na prática pública são verdadeiramente significativos. Essa é a nossa única tarefa.


Após o seu discurso, houve uma sessão de perguntas e respostas. Fiz-lhe uma pergunta online:

Esta foi a sua resposta:

Quando fiz uma pergunta filosoficamente perspicaz a um cientista de IA de topo global e recebi a sua resposta ao vivo, fiquei entusiasmado. Sou um principiante nesta área, e Shanahan tem pensado sobre isto há muitos anos.

Eu tinha ouvido anteriormente um dos seus podcasts onde ele mencionou que conhecia os fundadores da Conferência de Dartmouth de 1956, que é a origem do termo inteligência artificial.

Agora, setenta anos passaram.

Também poderá gostar de

Relatório Matinal | Coinbase Ventures realiza o seu primeiro investimento na ENA; SpaceX planeia definir o preço do IPO em 135 dólares por ação

Visão geral dos eventos importantes do mercado a 3 de junho

Texto integral e análise do discurso do CEO da SanDisk na 42.ª Conferência Anual de Decisões Estratégicas da Bernstein

O valor central do discurso de Goeckeler reside no fornecimento de um quadro narrativo altamente transparente e logicamente claro para a transformação corporativa.

Previsão de Preço da Bitcoin para 2030: Ark Invest Prevê 710 mil dólares

Explore as previsões de preço da bitcoin para 2030 da Ark Invest e do Standard Chartered, além dos principais riscos e como posicionar a sua carteira. Análise completa na WEEX.

Preço do SOL hoje: Preço da Solana em tempo real, gráficos e dados de mercado

Descubra o preço do SOL hoje com dados em tempo real, além dos principais fatores por trás do movimento da Solana e dicas de negociação práticas. Leia a análise completa na WEEX.

O que é um ETF de Bitcoin: Spot vs. Futuros Explicado

Saiba o que é um ETF de Bitcoin, como funcionam os ETFs spot vs. futuros e porque os fluxos institucionais estão a remodelar o BTC em 2026. Análise WEEX.

Why Is Bitcoin Dropping 15% While Nasdaq Hits Record Highs?

A Bitcoin cai 15% para 66 mil dólares devido a receios de tensões geopolíticas, enquanto o Nasdaq dispara para máximos de sempre. Análise dos motores macroeconómicos, fluxos de ETF, comportamento de retalho vs. baleias e a correlação oculta entre cripto e ações.

Moedas populares

Últimas notícias cripto

Ler mais
iconiconiconiconiconicon
Apoio ao cliente:@weikecs
Cooperação empresarial:@weikecs
Trading quant. e criação de mercados:bd@weex.com
Programa VIP:support@weex.com