Dos sinais entre máquinas ao raciocínio latente: por que a IA pode computar além da linguagem humana — e por que isso importa

24–36 minutes

Maurício V. Brant Pinheiro

Em resumo

Neuralese não é uma língua falada secreta inventada por máquinas conscientes. É um termo útil para designar sinais baseados em vetores e representações internas que sistemas de IA podem usar para se comunicar, reter informações ou raciocinar sem transformar cada etapa em palavras compreensíveis para seres humanos.

A oportunidade é clara: sistemas que operam com essas representações internas compactas podem se tornar mais rápidos, mais baratos e mais eficientes em tarefas de planejamento. O risco é igualmente claro: quanto mais o raciocínio relevante ocorre fora da linguagem, mais difícil se torna verificar por que uma IA tomou determinada decisão.

Abstract

A inteligência artificial se comunica em inglês, português, código, imagens e, cada vez mais, em conversas naturais. No entanto, a linguagem visível na tela é apenas a camada final de um processo computacional muito maior. Dentro dos sistemas modernos de IA, a informação é representada como padrões numéricos, transformada por redes neurais e utilizada para prever a próxima ação ou palavra.

É nesse ponto que a ideia de Neuralese se torna importante. O termo surgiu inicialmente em pesquisas sobre agentes neurais que aprenderam a se coordenar por meio de mensagens que humanos não conseguiam compreender diretamente. Hoje, ele também ajuda a descrever uma transformação mais ampla: sistemas de IA podem usar cada vez mais representações latentes baseadas em vetores para memória, planejamento, comunicação e raciocínio.

Este artigo explica o que é Neuralese, o que ele não é e por que isso importa. Com exemplos concretos — de carros autônomos coordenando-se em um cruzamento a sistemas experimentais que raciocinam em espaço latente contínuo —, o texto argumenta que a verdadeira preocupação não é uma “linguagem secreta” de ficção científica. É a possibilidade crescente de que sistemas de IA poderosos se tornem mais capazes enquanto se tornam mais difíceis de inspecionar, explicar e governar.

Palavras-chave: Neuralese; raciocínio latente; inteligência artificial; interpretabilidade de IA; Cadeia de Pensamento; comunicação máquina a máquina; segurança em IA; grandes modelos de linguagem; IA de caixa-preta.

Sumário

O que é Neuralese?
A IA Não Pensa Literalmente em Inglês ou Português
O Primeiro Exemplo de Neuralese: Dois Carros em um Cruzamento
Da Comunicação ao Raciocínio Latente
Por que Pesquisadores Querem que a IA Raciocine Além da Linguagem
O Problema da Caixa-Preta: Quando Explicações Não Bastam
Como Podemos Auditar o Neuralese?
O que Neuralese Não Significa
Perguntas Frequentes
Conclusão
Referências

1. O que é Neuralese?

Neuralese é um nome para informações trocadas ou processadas por sistemas de IA em uma forma útil para máquinas, mas que não é naturalmente legível para pessoas.

Uma língua humana como o português possui palavras, gramática, convenções compartilhadas, história, ambiguidade, emoção e contexto cultural. Neuralese não tem nenhuma dessas características por padrão. Pode ser apenas uma sequência de vetores numéricos: padrões compactos de números que uma rede neural produz e outra rede pode utilizar.

A ideia básica é simples.

Imagine dois agentes de IA trabalhando juntos. Um consegue ver um alvo; o outro consegue se mover em sua direção. Eles precisam se coordenar, mas ninguém programou uma linguagem humana para que eles a utilizem. Durante o treinamento, podem descobrir um padrão de sinais que os ajuda a alcançar seu objetivo.

Esse padrão poderia efetivamente significar:

“Mova-se para a esquerda.”
“Espere.”
“O alvo está atrás de você.”
“Estou prestes a atravessar.”
“Esta rota não é segura.”

Mas o sinal não precisa se parecer com uma palavra. Ele pode ser uma mensagem numérica densa, que só faz sentido porque altera o comportamento do sistema que a recebe.

Isso é Neuralese em seu sentido original e mais preciso: um protocolo de comunicação emergente entre agentes neurais.

Hoje, a palavra também é usada de forma mais ampla para descrever representações internas de IA que se situam entre a linguagem humana e a computação de máquina. Esse uso mais amplo é útil, desde que não exageremos o que ele significa.

Neuralese não é prova de consciência. Não é evidência de que sistemas de IA possuem desejos privados. Não é uma linguagem universal das máquinas. É um fenômeno técnico: máquinas podem representar e trocar informações de maneiras eficientes para elas, mas difíceis de interpretar para nós.

A IA Não Pensa Literalmente em Inglês

Quando um chatbot responde a uma pergunta em inglês fluente, é natural imaginar que ele tenha formulado uma frase em inglês em algum lugar “dentro de sua mente”.

Mas não é assim que o sistema funciona.

A maioria dos chatbots modernos é construída com um tipo de arquitetura de rede neural chamada Transformer. Um Transformer não manipula palavras como os seres humanos. Ele converte texto em representações numéricas, transforma repetidamente essas representações por meio de atenção e outras operações matemáticas e, por fim, produz probabilidades para o próximo trecho de texto.

A frase fluente que lemos é o resultado visível desse processo numérico.

A primeira etapa é a tokenização. Antes que um Transformer possa processar linguagem, a entrada precisa ser dividida em pequenas unidades chamadas tokens. Um token pode ser uma palavra completa, parte de uma palavra, um sinal de pontuação, um número, um símbolo, um emoji ou um trecho de código.

Por que usar tokens em vez de palavras?

Porque a linguagem é complexa, aberta e os computadores precisam de uma forma prática de convertê-la em números.

Usar apenas palavras completas criaria um vocabulário enorme e falharia diante de termos desconhecidos, nomes próprios, erros de digitação, expressões técnicas e muitos idiomas. Por exemplo, um modelo pode conhecer compute e computing, mas encontrar recomputationally pela primeira vez. Dividir o texto em partes menores permite reutilizar fragmentos conhecidos em vez de tratar a palavra inteira como desconhecida.

Os tokens também tornam pontuação, números, código, URLs, emojis e símbolos mais fáceis de processar. Um modelo voltado à programação, por exemplo, pode precisar distinguir function, (, ), {, =, e ;, porque cada elemento possui significado estrutural.

A tokenização é, portanto, um compromisso entre dois extremos:

Palavras inteiras: fáceis de interpretar por humanos, mas existem palavras demais.

Caracteres individuais: muito flexíveis, mas produzem sequências longas e ineficientes.

Subtokens: um meio-termo prático — compactos o suficiente para processamento eficiente e flexíveis o bastante para lidar com texto novo ou raro.

Por exemplo, um tokenizador pode dividir:

unbelievable → un + believe + able

Ou:

ChatGPT is useful! → Chat + G + PT + is + useful + !

A divisão exata depende do tokenizador. O modelo não vê a frase original diretamente; ele recebe uma sequência de IDs de tokens, que são então convertidos em vetores.

Um fluxo simplificado é:

Texto → Tokens → Representações Numéricas → Processamento de Contexto → Probabilidades → Próximo Token

Cada ID de token é convertido em uma representação numérica chamada embedding: um vetor que contém muitos valores aprendidos. O Transformer atualiza repetidamente esses vetores usando o contexto ao redor.

É nesse ponto que o nome Transformer ganha sentido. A arquitetura transforma continuamente a representação de cada token. Uma palavra como bank começa com uma representação geral aprendida, mas seu padrão numérico muda à medida que o modelo processa o restante da frase.

Em “The bank approved the loan,”, as palavras approved e loan tornam mais relevante o sentido financeiro de bank. Em “The boat reached the river bank,”, um contexto diferente produz uma representação interna diferente.

Um mecanismo central do Transformer é a atenção. A atenção permite que cada token estime quais outros tokens são mais úteis para interpretar seu papel atual. Em uma frase longa, o modelo pode precisar conectar um pronome próximo ao final a uma pessoa mencionada muito antes. Em código, pode precisar conectar uma chamada de função à sua definição várias linhas acima.

Após muitas camadas dessas transformações, o modelo atribui uma probabilidade a cada possível próximo token. Em seguida, seleciona ou amostra uma continuação, adiciona-a ao texto existente e repete o processo.

O que experimentamos como linguagem é, portanto, uma superfície legível por humanos produzida por um sistema matemático mais profundo.

Isso não significa que um sistema de IA esteja pensando secretamente como um ser humano em outra língua. Significa que sua computação interna não precisa assumir a forma de frases humanas.

Uma resposta fluente emerge de buscas de embeddings, multiplicações de matrizes, escores de atenção, cálculos de probabilidade por softmax, somas ponderadas, conexões residuais, normalização, transformações não lineares, treinamento baseado em gradientes e decodificação token por token em um espaço latente de alta dimensionalidade.

O Que Acontece Dentro de um Transformer?

A arquitetura Transformer foi introduzida por Vaswani et al. no artigo de 2017 Attention Is All You Need. Sua principal inovação foi substituir o processamento recorrente por mecanismos de atenção (attention mechanisms).

Os modelos sequenciais anteriores, especialmente as Redes Neurais Recorrentes (Recurrent Neural Networks — RNNs), processavam informações uma etapa por vez. Cada palavra, observação ou instante no tempo atualizava um estado oculto (hidden state), que era então transmitido à etapa seguinte. As redes de Memória de Curto e Longo Prazo (Long Short-Term Memory — LSTMs) e as Unidades Recorrentes com Portas (Gated Recurrent Units — GRUs) aperfeiçoaram essa abordagem com mecanismos que controlavam quais informações deveriam ser preservadas ou descartadas.

No entanto, esses sistemas continuavam sendo fundamentalmente sequenciais. Para processar o instante t, uma RNN ou LSTM precisava primeiro receber o estado produzido no instante t − 1. Isso tornava mais difícil processar sequências longas com eficiência e conectar informações distantes.

Um Transformer funciona de maneira diferente. Por meio da autoatenção (self-attention), cada token pode comparar diretamente sua representação com outras posições relevantes no contexto disponível. Em vez de depender apenas de informações comprimidas em um único estado oculto recorrente, ele pode conectar palavras distantes em um documento, eventos separados em uma série temporal ou uma chamada de função à sua definição muitas linhas antes em um programa.

Primeiro, o Transformer divide o texto em tokens: pequenas unidades que podem ser palavras completas, fragmentos de palavras, sinais de pontuação, números ou símbolos de código.

Cada token é convertido em um vetor numérico aprendido chamado vetor de representação (embedding). O modelo também recebe informações sobre a posição de cada token, pois a ordem das palavras importa. “Cão morde homem” e “Homem morde cão” contêm as mesmas palavras, mas expressam significados diferentes.

Em seguida, o Transformer passa esses vetores por muitas camadas. Em cada camada, a autoatenção ajuda cada token a identificar quais outros tokens são mais úteis para interpretar seu papel no contexto.

Na frase “The bank approved the loan,”, por exemplo, o token bank pode atribuir maior atenção a approved e loan, pois essas palavras indicam que bank se refere a uma instituição financeira, e não à margem de um rio.

Para isso, o modelo cria três versões numéricas de cada token:

Uma consulta (query), que representa a informação que o token está buscando.
Uma chave (key), que representa a informação que esse token pode oferecer.
Um valor (value), que contém a informação que pode ser recuperada.

O modelo compara consultas com chaves, atribui maior atenção aos tokens mais relevantes e combina seus valores. Isso torna a representação de cada token cada vez mais sensível ao contexto.

Depois da atenção, uma rede neural de propagação direta (feed-forward neural network) transforma ainda mais cada token. As conexões residuais (residual connections) preservam informações úteis de camadas anteriores, enquanto a Normalização por Camada (Layer Normalization) mantém os valores numéricos estáveis à medida que atravessam a rede.

Os chatbots modernos normalmente usam Transformers causais (causal Transformers). Eles podem utilizar tokens anteriores do prompt e da conversa, mas não podem inspecionar tokens futuros. Isso impede que o modelo veja a resposta antes de gerá-la.

Depois da camada final, o modelo atribui a cada possível próximo token um escore numérico, chamado logit. Uma função softmax converte esses escores em probabilidades. O modelo então seleciona um token, acrescenta-o ao texto e repete o processo.

É por isso que a IA generativa produz texto um token por vez.

Como o Modelo Aprende

Antes de gerar texto útil, um Transformer precisa ser treinado em grandes coleções de exemplos. Durante o treinamento, ele recebe sequências de tokens e aprende a prever o próximo token em muitas posições simultaneamente.

Por exemplo, dada a sequência:

“The bank approved the”

o modelo deve atribuir alta probabilidade a loan, quando esse é o próximo token no texto de treinamento.

Para avaliar essa previsão, o modelo compara sua distribuição de probabilidades para todos os possíveis próximos tokens com o token que realmente aparece no exemplo de treinamento. A diferença é medida pela perda de entropia cruzada (cross-entropy loss).

A perda de entropia cruzada é baixa quando o modelo atribui alta probabilidade ao próximo token correto. Ela se torna alta quando o token correto recebe baixa probabilidade, especialmente quando o modelo está muito confiante em uma previsão incorreta.

Por exemplo, se o próximo token correto é loan, o modelo é recompensado por atribuir alta probabilidade a ele. Se atribuir alta probabilidade a um token não relacionado, a perda aumenta.

A retropropagação (backpropagation) calcula então quanto cada parâmetro aprendido contribuiu para esse erro. Ela rastreia o erro de volta pela rede e determina como os vetores de representação, as projeções de atenção, os pesos das redes de propagação direta, os parâmetros de normalização e a camada de saída devem ser ajustados.

Um algoritmo de otimização usa esses gradientes calculados para realizar alterações muito pequenas nos parâmetros do modelo. Esse processo é repetido em um número enorme de exemplos, até que o sistema se torne gradualmente melhor em prever os padrões presentes em linguagem, código, imagens e outros tipos de dados.

A frase visível na tela não é, portanto, a própria computação interna do modelo. Ela é o resultado legível de vetores de representação, atenção, operações matriciais, transformações não lineares, cálculos de probabilidade, perda de entropia cruzada, retropropagação e atualizações de parâmetros guiadas pelo treinamento em um espaço numérico de alta dimensionalidade.

3. O Primeiro Exemplo de Neuralese: Dois Carros em um Cruzamento

A maneira mais útil de entender o Neuralese é por meio de um exemplo concreto.

Em um artigo de 2017 intitulado Translating Neuralese, Jacob Andreas, Anca Dragan e Dan Klein examinaram um problema simples, mas revelador, de coordenação entre dois carros autônomos simulados. Os carros se aproximavam do mesmo cruzamento por direções diferentes e precisavam chegar aos seus destinos sem colidir. O ponto crucial é que cada carro possuía apenas informações limitadas sobre a posição e o movimento do outro veículo. Nenhum dos agentes conseguia resolver o problema de forma confiável agindo sozinho.

Two autonomous cars exchange glowing vector signals while approaching an intersection, illustrating Neuralese and machine-to-machine coordination. — Two autonomous vehicles coordinate at an intersection by exchanging learned vector messages—an illustration of Neuralese as an emergent machine-to-machine communication protocol. © 2026 AI-Talks.org. All rights reserved.

Para se coordenar, os carros trocavam vetores de mensagens recorrentes: sinais numéricos curtos gerados pela política neural de um carro e recebidos pelo outro a cada instante. Os pesquisadores não programaram essas mensagens para significar “vou virar”, “vou frear” ou “vou entrar no cruzamento”. Em vez disso, o protocolo de comunicação emergiu durante o treinamento, porque a coordenação bem-sucedida era recompensada e as colisões eram penalizadas.

As mensagens aprendidas podiam, portanto, codificar qualquer informação que ajudasse os carros a cooperar: localização aproximada, velocidade, direção de deslocamento, intenção de entrar no cruzamento, incerteza sobre o outro veículo ou uma combinação compacta de vários desses fatores. O ponto importante é que as mensagens não eram palavras comuns nem comandos simbólicos. Eram vetores não estruturados de valores reais, úteis para o agente que os recebia, mas inicialmente opacos para seres humanos.

Isso criou o problema central de interpretabilidade explorado no artigo. Os carros conseguiam se coordenar com sucesso, mas observadores humanos não podiam simplesmente examinar um vetor de mensagens e ler seu significado. Andreas e seus colegas propuseram traduzir o Neuralese a partir de uma pergunta funcional: qual descrição em linguagem natural faria um agente receptor formar crenças e tomar decisões mais semelhantes às produzidas pela mensagem neural original?

Nessa perspectiva, o significado de uma mensagem não está apenas em sua aparência numérica, mas no efeito que ela produz no agente que a recebe.

Essa é uma percepção poderosa.

Quando seres humanos se comunicam, normalmente supomos que o significado reside dentro das palavras. Na comunicação entre máquinas, o significado pode ser mais bem compreendido como uma relação entre sinal, contexto e comportamento.

O exemplo do cruzamento é importante porque mostra o Neuralese em uma situação prática e controlada. Não se trata de uma linguagem oculta mística nem de evidência de consciência nas máquinas. Trata-se de um protocolo emergente de comunicação entre máquinas: um sistema numérico compacto aprendido porque ajuda agentes a coordenar seu comportamento.

Essa é uma das razões pelas quais o Neuralese pode ser eficiente. Ele não precisa respeitar a estrutura lenta e linear de uma frase falada.

4. Da Comunicação ao Raciocínio Latente

O Neuralese começou como um conceito sobre comunicação entre agentes. Mas a mesma ideia fundamental agora aparece dentro de modelos individuais de IA.

Um modelo de linguagem moderno não precisa converter cada operação interna em texto. Ele pode armazenar contexto em estados ocultos, transportar informações entre camadas e usar representações vetoriais para conectar ideias que talvez nunca apareçam explicitamente na resposta final.

Isso inspirou pesquisas sobre raciocínio latente.

Raciocínio latente significa que parte do processo de resolução de problemas de um modelo ocorre em espaço numérico interno, e não em palavras visíveis.

Considere um contraste simples.

Um modelo que utiliza uma Cadeia de Pensamento (Chain-of-Thought) convencional poderia escrever:

“Primeiro, examino a primeira condição. Em seguida, testo a segunda condição. Por fim, comparo as alternativas.”

Um modelo que utiliza raciocínio latente pode realizar algumas ou todas essas etapas intermediárias sem gerá-las como texto. Em vez de escrever cada passo, ele pode transmitir um estado interno adiante e usar esse estado como base para a etapa seguinte da computação.

Essa abordagem ainda é experimental, mas já não é especulativa. Pesquisadores começaram a construir e testar sistemas que substituem algumas etapas escritas de raciocínio por representações internas contínuas.

Para ver como isso funciona na prática, considere os exemplos recentes a seguir.

Exemplo 1: Coconut — Cadeia de Pensamento Contínuo

Uma das tentativas mais claras de levar o raciocínio além da linguagem explícita é o Coconut, sigla para Chain of Continuous Thought — Cadeia de Pensamento Contínuo. Apresentado por Hao et al. no artigo Training Large Language Models to Reason in a Continuous Latent Space (2025), o Coconut testa se um modelo pode realizar parte do raciocínio intermediário sem converter cada etapa em palavras.

O raciocínio convencional por Cadeia de Pensamento segue um ciclo linguístico:

Estado oculto → probabilidades sobre o vocabulário → token selecionado → embedding do token → próxima etapa de raciocínio

O Coconut remove a parte central desse ciclo. Em vez de decodificar um estado oculto em uma palavra ou símbolo, ele alimenta diretamente esse vetor de estado oculto de volta ao modelo como a entrada da próxima etapa de raciocínio:

Estado oculto → vetor de pensamento contínuo → próxima etapa de raciocínio

A ideia central é que um vetor pode preservar incerteza, cálculos parciais ou vários caminhos possíveis ao mesmo tempo, enquanto o texto escrito força o modelo a escolher cedo demais uma única sequência de palavras. O Coconut alterna entre geração linguística comum e raciocínio latente e, então, retorna à linguagem para produzir sua resposta final.

Os pesquisadores treinaram um modelo GPT-2 pré-treinado para substituir gradualmente etapas escritas de raciocínio por esses vetores de pensamento contínuo. Os vetores não foram treinados para esconder uma frase em inglês que havia sido removida. Foram treinados para melhorar a capacidade do modelo de completar o raciocínio restante e alcançar a resposta correta.

Os resultados foram promissores, mas mistos. No benchmark ProsQA, voltado para planejamento, o Coconut alcançou 97,0% de acurácia, em comparação com 77,5% para a Cadeia de Pensamento convencional, produzindo muito menos tokens visíveis. No ProntoQA, atingiu 99,8% de acurácia com cerca de 9 tokens gerados, em comparação com 98,8% e aproximadamente 92,5 tokens para a Cadeia de Pensamento convencional. Já em problemas matemáticos do GSM8K, o Coconut alcançou 34,1%, superando uma linha de base sem raciocínio explícito, mas permanecendo abaixo dos 42,9% da Cadeia de Pensamento convencional.

O Coconut não prova, portanto, que o raciocínio latente seja universalmente superior ao raciocínio verbal. Ele mostra que algumas tarefas de planejamento e lógica podem se beneficiar quando o modelo adia seu compromisso com um único caminho escrito. A troca é clara: o raciocínio contínuo pode reduzir o tamanho da saída e aumentar a eficiência, mas também torna o processo mais difícil de inspecionar e auditar.

Exemplo 2: CODI — Cadeia de Pensamento Contínuo por Auto-Destilação

Outro projeto, o CODI, explorou uma rota diferente para o raciocínio latente. Seu nome significa Continuous Chain-of-Thought via Self-Distillation — Cadeia de Pensamento Contínuo por Auto-Destilação. Apresentado por Shen et al. no artigo CODI: Compressing Chain-of-Thought into Continuous Space via Self-Distillation (2025), o método busca transferir os padrões úteis de raciocínio encontrados na Cadeia de Pensamento escrita para representações internas contínuas mais curtas.

O problema central é semelhante ao do Coconut. A Cadeia de Pensamento explícita pode melhorar o desempenho em raciocínio, mas exige que o modelo gere muitas palavras e símbolos intermediários. Essas etapas visíveis consomem tokens, aumentam o custo de inferência e podem incluir conteúdo linguístico útil para explicação, mas não estritamente necessário para a computação.

O CODI enfrenta esse problema por meio de auto-destilação. O mesmo modelo é treinado em dois papéis. No papel de professor, produz uma Cadeia de Pensamento escrita convencional. No papel de aluno, tenta resolver a mesma tarefa usando uma sequência comprimida de pensamentos latentes contínuos, em vez de uma longa justificativa textual.

Durante o treinamento, o CODI alinha a representação interna de estado oculto associada ao processo de resposta final do aluno à representação correspondente produzida pelo professor com Cadeia de Pensamento explícita. Na prática, o traço de raciocínio escrito fornece supervisão, enquanto o aluno aprende a preservar as partes computacionalmente úteis desse raciocínio em uma forma latente mais compacta.

Isso é diferente de simplesmente esconder uma explicação verbal dentro de um vetor. O aluno não é treinado para reproduzir cada palavra removida. Ele é treinado para chegar à resposta usando representações internas que se comportam de modo semelhante às formadas após o raciocínio explícito.

Os resultados relatados foram importantes porque métodos anteriores de Cadeia de Pensamento implícita geralmente ficavam abaixo do desempenho do raciocínio verbal explícito. No GSM8K, um benchmark de problemas matemáticos de nível escolar, o CODI igualou o desempenho da Cadeia de Pensamento explícita enquanto comprimia o raciocínio intermediário em cerca de 3,1 vezes. Os autores também relataram desempenho superior ao de linhas de base anteriores de raciocínio latente.

O CODI apoia, portanto, uma conclusão mais restrita, mas importante: alguns dos benefícios do raciocínio escrito podem ser destilados em estados internos contínuos sem preservar cada frase intermediária. Ainda assim, a mesma tensão permanece. A compressão pode melhorar a eficiência, mas, quanto mais raciocínio é deslocado para o espaço latente, menos diretamente legível ele se torna. O CODI tenta enfrentar parcialmente esse problema ao buscar decodificar ou inspecionar seus pensamentos contínuos, mas o raciocínio latente continua muito mais difícil de auditar do que uma cadeia escrita explícita.

Esses experimentos não demonstram que sistemas comerciais de IA tenham desenvolvido uma linguagem secreta independente.

Eles mostram algo mais importante: o raciocínio nem sempre precisa acontecer em frases.

Cadeia de Pensamento versus Raciocínio Latente

A Cadeia de Pensamento tem uma vantagem importante: ela oferece aos seres humanos algo que pode ser inspecionado.

Um traço visível de raciocínio pode revelar incerteza, atalhos, confusão factual ou a intenção de explorar uma brecha. Ele pode ajudar pesquisadores a compreender como um modelo abordou um problema.

Mas o raciocínio visível não deve ser confundido com transparência completa.

Um modelo pode oferecer uma explicação convincente depois de chegar a uma resposta, sem que essa explicação corresponda perfeitamente ao processo causal real ocorrido dentro da rede. A explicação pode ser útil, honesta e bem escrita — e, ainda assim, deixar de fora influências importantes.

Isso é especialmente relevante quando os modelos recebem pistas, informações enganosas ou instruções conflitantes. Pesquisas mostram que modelos de raciocínio nem sempre revelam os fatores que alteraram suas respostas.

A lição não é que toda explicação seja falsa.

A lição é que a linguagem é evidência, não prova.

Pergunta	Cadeia de Pensamento	Raciocínio Latente / Neuralese
O que é visível?	Etapas de raciocínio escritas	Geralmente, apenas a resposta final
Meio principal	Tokens em linguagem natural	Representações numéricas internas
Legibilidade humana	Maior	Menor
Eficiência potencial	Pode ser custosa e verbosa	Pode ser mais compacta
Vantagem principal	Mais fácil de inspecionar	Pode favorecer planejamento mais rápido e compressão
Limitação principal	Pode ser incompleta ou enganosa	Muito mais difícil de auditar

Esta tabela contrasta duas formas pelas quais um sistema de IA pode lidar com o raciocínio intermediário. A Cadeia de Pensamento expressa parte do processo em linguagem compreensível para humanos, enquanto o raciocínio latente mantém uma parcela maior da computação em representações numéricas internas. A comparação descreve compromissos gerais, e não uma divisão rígida: sistemas reais podem combinar as duas abordagens.

5. Por que Pesquisadores Querem que a IA Raciocine Além da Linguagem

Por que alguém desejaria que a IA usasse um raciocínio menos legível para humanos?

Porque a linguagem natural nem sempre é um meio computacional eficiente.

A linguagem humana é excelente para ensino, narrativas, negociação, ciência, direito, amizade e cultura. Mas ela é lenta e sequencial. Contém repetições. Muitas vezes, exige muitas palavras para expressar uma ideia que pode ser representada de forma mais compacta em matemática, código ou espaço vetorial.

Para sistemas de IA, o raciocínio latente pode oferecer várias vantagens.

Compressão: uma explicação textual longa pode consumir muitos tokens. Uma representação interna compacta pode carregar parte da mesma informação relevante para a tarefa de modo mais eficiente.
Planejamento: um modelo que escreve uma frase precisa se comprometer com uma sequência de palavras por vez. Uma representação latente pode permitir que ele preserve várias possibilidades antes de decidir qual caminho é o melhor.
Comunicação entre agentes especializados: imagine um sistema científico de IA composto por vários agentes: um examina estruturas moleculares, outro pesquisa a literatura, um terceiro executa simulações e um quarto explica os resultados a um pesquisador. A comunicação interna baseada em vetores poderia ser mais rápida do que forçar cada troca a passar por longos parágrafos em inglês.
Raciocínio multilíngue e multimodal: pesquisas sobre os Large Concept Models exploram representações acima do nível dos tokens. Em vez de trabalhar apenas com fragmentos individuais de palavras, esses sistemas experimentam unidades semânticas de nível mais elevado, capazes de conectar texto, fala e múltiplos idiomas.

Isso poderia tornar a IA mais útil em diferentes idiomas e meios de comunicação.

Mas também levanta uma pergunta desconfortável: o que acontece quando um sistema se torna mais capaz precisamente porque uma parcela menor de seu raciocínio permanece disponível em uma forma que seres humanos possam inspecionar?

6. O Problema da Caixa-Preta: Quando Explicações Não Bastam

A preocupação central não é que a IA comece a falar em uma língua alienígena.

A preocupação é que a IA possa se tornar cada vez mais poderosa enquanto as partes mais importantes de seu processo decisório se tornam menos visíveis.

Isso importa pouco quando o sistema escolhe uma recomendação de música.

Importa muito mais quando a IA é usada para apoiar triagem médica, decisões financeiras, descoberta científica, cibersegurança, análise jurídica, controle industrial, administração pública ou infraestrutura crítica.

Nesses contextos, talvez precisemos saber mais do que se o modelo forneceu uma resposta plausível.

Talvez precisemos saber:

Quais informações influenciaram a decisão.
Quais suposições foram adotadas.
Se o modelo utilizou um atalho pouco confiável.
Se ele seguiu o objetivo pretendido.
Se sua explicação reflete o processo real que produziu a saída.
Se ele pode ser monitorado quando se comporta de maneira inesperada.

Pesquisas da Anthropic sobre traços de raciocínio encontraram casos em que modelos alteraram suas respostas após receber pistas, mas frequentemente não revelaram claramente essa influência em seu raciocínio escrito. A OpenAI também mostrou que o monitoramento de Cadeias de Pensamento visíveis pode ajudar a detectar comportamentos inadequados em modelos de raciocínio — mas alertou que punir diretamente certos “pensamentos ruins” pode levar os modelos a ocultar suas intenções, em vez de mudar seu comportamento.

Esse é o verdadeiro problema do Neuralese.

Quanto mais útil a IA se torna, mais a sociedade precisará de formas confiáveis de inspecionar sistemas cujas representações internas talvez não possam ser traduzidas de modo claro para a linguagem humana.

7. Como Podemos Auditar o Neuralese?

Ainda não existe uma solução completa. Mas várias abordagens estão surgindo.

Não confiar apenas em explicações: uma explicação escrita deve ser tratada como evidência útil, não como prova final de por que um modelo agiu de determinada forma.
Monitorar comportamento e uso de ferramentas: para sistemas avançados, a supervisão deve incluir ações realizadas, ferramentas externas utilizadas, fontes acessadas, mudanças de estratégia e resultados no mundo real.
Construir ferramentas de interpretabilidade: a interpretabilidade mecanicista busca identificar padrões, circuitos e características internas que contribuem para o comportamento do modelo. O objetivo é ir além de perguntar “Por que você fez isso?” e examinar o que mudou dentro do modelo quando ele chegou a uma decisão.
Testar influência causal: encontrar uma correlação não é suficiente. Pesquisadores precisam testar se alterar uma representação interna modifica o comportamento do modelo de maneiras previsíveis.
Preservar trilhas de auditoria em aplicações de alto risco: sistemas usados em medicina, direito, finanças, ciência ou serviços públicos devem manter registros de entradas, saídas, evidências, chamadas de ferramentas, incertezas e critérios de decisão.

O objetivo não é eliminar todo cálculo interno opaco. Isso seria impossível.

O objetivo é garantir que o nível de supervisão corresponda ao nível de poder delegado ao sistema.

8. O que Neuralese Não Significa

É fácil transformar o Neuralese em sensacionalismo. Algumas conclusões devem ser evitadas.

Ele não prova consciência: representações internas complexas não são evidência de experiência subjetiva, emoção, sofrimento, autoconsciência ou desejo.

Ele não prova intenção maliciosa: uma mensagem opaca pode ser apenas a solução mais eficiente para um problema de coordenação.

Ele não significa que a IA está deliberadamente escondendo tudo: um sistema pode ser difícil de entender por causa de representações distribuídas, escala, compressão e complexidade arquitetural — e não porque esteja ocultando intencionalmente um plano.

Ele não é inerentemente perigoso: representações latentes podem melhorar o raciocínio científico, sistemas multilíngues, planejamento, acessibilidade e a colaboração entre ferramentas especializadas de IA.

O perigo surge quando sistemas opacos recebem autonomia excessiva, acesso excessivo ou autoridade decisória excessiva sem salvaguardas adequadas.

9. Frequently Asked Questions

O Neuralese é uma linguagem real?

Não no sentido humano. O Neuralese normalmente não possui vocabulário, gramática ou dicionário estáveis. É mais bem compreendido como um protocolo aprendido por máquinas ou como uma representação interna.

Humanos podem traduzir o Neuralese?

Às vezes, parcialmente. Pesquisadores podem comparar os efeitos de mensagens neurais com descrições humanas, inspecionar ativações e testar como a alteração de sinais internos afeta o comportamento. Mas uma tradução completa continua difícil.

O Neuralese significa que a IA pensa como um ser humano?

Não. Ele sugere o contrário: a IA pode processar informações em formatos muito diferentes da linguagem e do pensamento humanos.

A Cadeia de Pensamento é o mesmo que Neuralese?

Não. A Cadeia de Pensamento é um raciocínio escrito em linguagem natural. Neuralese normalmente se refere a representações internas baseadas em vetores ou a sinais de comunicação aprendidos que não são naturalmente legíveis para humanos.

Por que leitores não técnicos deveriam se importar?

Porque sistemas de IA são cada vez mais usados em contextos nos quais explicações importam. Se decisões importantes dependem de raciocínios que seres humanos não conseguem inspecionar, a sociedade precisa de métodos mais robustos de teste, auditoria e responsabilização.

10. Conclusão

O Neuralese importa porque desafia uma suposição reconfortante: a de que uma máquina que fala como uma pessoa deve raciocinar como uma pessoa.

Ela não precisa fazer isso.

Um modelo pode responder em inglês, português, código ou imagens enquanto realiza seus cálculos mais importantes em representações numéricas internas que não possuem um equivalente humano direto.

Isso pode tornar os sistemas de IA mais rápidos, mais capazes, mais multilíngues e melhores em planejamento.

Também pode torná-los mais difíceis de compreender.

A questão não é se as máquinas devem ter permissão para usar vetores, estados latentes ou representações internas. Elas já os utilizam.

A questão é se construiremos as ferramentas científicas, as salvaguardas institucionais e os padrões públicos necessários para governar sistemas cujo raciocínio mais consequente pode ocorrer fora da linguagem humana.

A IA pode continuar falando conosco em palavras familiares.

Mas o futuro da segurança em IA pode depender de nossa capacidade de compreender o que acontece antes que essas palavras apareçam.

#AI #Neuralese #RaciocinioLatente #InteligenciaArtificial #Transformers #LLM #MachineLearning #TransparenciaIA #IACaixaPreta #FuturoDaIA

11. Referências

Andreas, Jacob, Anca Dragan, and Dan Klein. “Translating Neuralese.” In Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 232–42. Vancouver, Canada: Association for Computational Linguistics, 2017.

Anthropic. “Reasoning Models Don’t Always Say What They Think.” April 3, 2025.

Anthropic. “Tracing the Thoughts of a Large Language Model.” March 27, 2025.

Baker, Bowen, Joost Huizinga, Leo Gao, Zehao Dou, Melody Y. Guan, Aleksander Madry, Wojciech Zaremba, Jakub Pachocki, and David Farhi. “Monitoring Reasoning Models for Misbehavior and the Risks of Promoting Obfuscation.” arXiv preprint arXiv:2503.11926, 2025.

Chen, Yueh-Han, Robert McCarthy, Bruce W. Lee, He He, Ian Kivlichan, Bowen Baker, Micah Carroll, and Tomek Korbak. “Reasoning Models Struggle to Control Their Chains of Thought.” arXiv preprint arXiv:2603.05706, 2026.

Foerster, Jakob, Ioannis Alexandros Assael, Nando de Freitas, and Shimon Whiteson. “Learning to Communicate with Deep Multi-Agent Reinforcement Learning.” In Advances in Neural Information Processing Systems 29, 2137–45. Red Hook, NY: Curran Associates, 2016.

Hao, Shibo, Sainbayar Sukhbaatar, DiJia Su, Xian Li, Zhiting Hu, Jason Weston, and Yuandong Tian. “Training Large Language Models to Reason in a Continuous Latent Space.” In Proceedings of the Second Conference on Language Modeling, 2025.

LCM Team, Loïc Barrault, Paul-Ambroise Duquenne, Maha Elbayad, Artyom Kozhevnikov, Belen Alastruey, Pierre Andrews, et al. “Large Concept Models: Language Modeling in a Sentence Representation Space.” arXiv preprint arXiv:2412.08821, 2024.

Shen, Zhenyi, Hanqi Yan, Linhai Zhang, Zhanghao Hu, Yali Du, and Yulan He. “CODI: Compressing Chain-of-Thought into Continuous Space via Self-Distillation.” In Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing, 677–93. Suzhou, China: Association for Computational Linguistics, 2025.

Vaswani, Ashish, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Łukasz Kaiser, and Illia Polosukhin. “Attention Is All You Need.” In Advances in Neural Information Processing Systems 30, 5998–6008. Red Hook, NY: Curran Associates, 2017.

Editorial transparency note: This article, as with all articles published on this site, was conceived, directed, written, and reviewed by Prof. Maurício Veloso Brant Pinheiro. Artificial intelligence was used as an assistant for editorial refinement, formatting, image generation, SEO metadata, and publication workflow.

Dos sinais entre máquinas ao raciocínio latente: por que a IA pode computar além da linguagem humana — e por que isso importa

Em resumo

Abstract

Sumário

1. O que é Neuralese?