Se a humanidade acabasse hoje numa situação assim, a nossa melhor aposta poderia ser recorrer à investigação que descobrisse como a inteligência artificial (IA) desenvolve as línguas.
Mas o que exatamente define uma linguagem? A maioria de nós usa pelo menos um para se comunicar com as pessoas ao nosso redor, mas como isso aconteceu? Os linguistas têm ponderado esta questão há décadas, mas não há uma maneira fácil de descobrir como a linguagem evoluiu.
A linguagem é efêmera, não deixa vestígios examinados nos registros fósseis. Ao contrário dos ossos, não podemos desenterrar línguas antigas para estudar como se desenvolveram ao longo do tempo.
Embora não possamos estudar a verdadeira evolução da linguagem humana, talvez uma simulação possa fornecer alguns insights. É aí que entra a IA – um campo de investigação fascinante chamado comunicação emergente, que passei os últimos três anos a estudar.
Descubra as histórias de seu interesse
Para simular como a linguagem pode evoluir, atribuímos aos agentes (IAs) tarefas simples que requerem comunicação, como um jogo em que um robô deve guiar outro para um local específico em uma grade sem mostrar-lhe um mapa. Não oferecemos (quase) nenhuma restrição sobre o que eles podem dizer ou como – simplesmente damos-lhes a tarefa e deixamos que a resolvam como quiserem. Como a resolução destas tarefas exige que os agentes comuniquem entre si, podemos estudar como a sua comunicação evolui ao longo do tempo para ter uma ideia de como a linguagem pode evoluir.
Experimentos semelhantes foram feitos com humanos. Imagine que você, um falante de inglês, está emparelhado com alguém que não fala inglês. Sua tarefa é instruir seu parceiro a pegar um cubo verde de uma variedade de objetos sobre uma mesa.
Você pode tentar gesticular em forma de cubo com as mãos e apontar para a grama do lado de fora da janela para indicar a cor verde. Com o tempo, vocês desenvolveriam juntos uma espécie de protolinguagem. Talvez você crie gestos ou símbolos específicos para “cubo” e “verde”. Através de interações repetidas, estes sinais improvisados tornar-se-iam mais refinados e consistentes, formando um sistema básico de comunicação.
Isso funciona de forma semelhante para IA. Por tentativa e erro, eles aprendem a se comunicar sobre os objetos que veem e seus interlocutores aprendem a entendê-los.
Mas como sabemos do que eles estão falando? Se eles só desenvolvem esta linguagem com o seu interlocutor artificial e não connosco, como saberemos o que cada palavra significa? Afinal, uma palavra específica pode significar “verde”, “cubo” ou pior – ambos. Este desafio de interpretação é uma parte fundamental da minha pesquisa.
Quebrando o código
A tarefa de entendendo a linguagem da IA pode parecer quase impossível no início. Se eu tentasse falar polonês (minha língua materna) com um colaborador que só fala inglês, não conseguiríamos nos entender nem saber onde começa e termina cada palavra.
O desafio com as linguagens de IA é ainda maior, pois podem organizar a informação de formas completamente estranhas aos padrões linguísticos humanos.
Felizmente, os linguistas desenvolveram ferramentas sofisticadas utilizando a teoria da informação para interpretar línguas desconhecidas.
Assim como arqueólogos reunimos línguas antigas a partir de fragmentos, usamos padrões em conversas de IA para compreender sua estrutura linguística. Às vezes encontramos semelhanças surpreendentes com as línguas humanas e outras vezes descobrimos formas de comunicação inteiramente novas.
Essas ferramentas nos ajudam a espiar a “caixa preta” do Comunicação de IArevelando como os agentes artificiais desenvolvem suas próprias formas únicas de compartilhar informações.
Meu trabalho recente concentra-se em usar o que os agentes veem e dizem para interpretar sua linguagem. Imagine ter a transcrição de uma conversa em um idioma desconhecido, junto com o que cada interlocutor estava vendo. Podemos combinar padrões na transcrição com objetos no campo de visão do participante, construindo conexões estatísticas entre palavras e objetos.
Por exemplo, talvez a frase “yayo” coincida com um pássaro voando – poderíamos adivinhar que “yayo” é a palavra do locutor para “pássaro”. Através de uma análise cuidadosa desses padrões, podemos começar a decodificar o significado por trás da comunicação.
No último artigo meu e de meus colegas, que aparecerá nos anais da conferência Neural Information Processing Systems (NeurIPS), mostramos que tais métodos podem ser usados para fazer engenharia reversa de pelo menos partes da linguagem e sintaxe das IAs, dando-nos insights sobre como eles podem estruturar a comunicação.
Alienígenas e sistemas autônomos
Como isso se conecta aos alienígenas? Os métodos que estamos desenvolvendo para compreender as linguagens da IA podem nos ajudar a decifrar quaisquer futuras comunicações alienígenas.
Se conseguirmos obter algum texto escrito estranho juntamente com algum contexto (como informação visual relativa ao texto), poderemos aplicar as mesmas ferramentas estatísticas para analisá-los. As abordagens que estamos a desenvolver hoje podem ser ferramentas úteis no estudo futuro de línguas alienígenas, conhecidas como xenolinguística.
Mas não precisamos encontrar extraterrestres para nos beneficiarmos desta pesquisa. Existem inúmeras aplicações, desde a melhoria de modelos de linguagem como ChatGPT ou Claude até a melhoria da comunicação entre veículos autônomos ou drones.
Ao decodificar linguagens emergentes, podemos tornar a tecnologia futura mais fácil de entender. Quer se trate de saber como os carros autónomos coordenam os seus movimentos ou como os sistemas de IA tomam decisões, não estamos apenas a criar sistemas inteligentes – estamos a aprender a compreendê-los.