O MIT dá à IA o poder de ‘raciocinar como humanos’ criando uma arquitetura híbrida
Pesquisadores do MIT desenvolveram um novo método para ajudar inteligência artificial (IA) os sistemas conduzem tarefas complexas de raciocínio em três áreas, incluindo codificação, planejamento estratégico e robótica.
Grandes modelos de linguagem (LLMs), que incluem Bate-papoGPT e Fechar 3 trabalhos, processam e geram texto com base em informações humanas, conhecidas como “prompts”. Estas tecnologias melhoraram muito nos últimos 18 meses, mas são limitadas pela sua incapacidade de compreender o contexto tão bem como os humanos ou de ter um bom desempenho em tarefas de raciocínio, disseram os investigadores.
Mas os cientistas do MIT afirmam agora ter resolvido este problema criando “um tesouro” de “abstrações” de linguagem natural que poderiam levar a modelos de IA mais poderosos. As abstrações transformam assuntos complexos em caracterizações de alto nível e omitem informações não importantes – o que poderia ajudar os chatbots a raciocinar, aprender, perceber e representar o conhecimento como os humanos.
Atualmente, os cientistas argumentam que os LLMs têm dificuldade em abstrair informações de maneira semelhante à humana. No entanto, eles organizaram abstrações de linguagem natural em três bibliotecas na esperança de que ganhem maior consciência contextual e forneçam respostas mais humanas.
Os cientistas detalharam suas descobertas em três artigos publicados no servidor de pré-impressão arXiv em 30 de outubro de 2023, 13 de dezembro de 2023 e 28 de fevereiro.Indução de biblioteca a partir de observações de linguagem” (LILO) sintetiza, compacta e documenta código de computador. O segundo, denominado “Aquisição de domínio de ação“(Ada) cobre a tomada de decisões sequenciais de IA. A estrutura final, apelidada de “Abstração guiada por linguagem” (LGA), ajuda os robôs a entender melhor os ambientes e planejar seus movimentos.
Estes artigos exploram como a linguagem pode fornecer aos sistemas de IA um contexto importante para que possam lidar com tarefas mais complexas. Eles foram apresentados em 11 de maio na Conferência Internacional sobre Representações de Aprendizagem em Viena, Áustria.
“A aprendizagem em biblioteca representa uma das fronteiras mais emocionantes da inteligência artificial, oferecendo um caminho para a descoberta e o raciocínio sobre abstrações composicionais”, disse Robert Hawkinsprofessor assistente de psicologia na Universidade de Wisconsin-Madison, em um declaração. Hawkins, que não esteve envolvido na pesquisa, acrescentou que tentativas semelhantes no passado eram muito caras em termos computacionais para serem usadas em escala.
Os cientistas disseram que três estruturas de biblioteca usam métodos neurosimbólicos – uma arquitetura de IA que combina redes neurais, que são coleções de algoritmos de aprendizado de máquina organizados para imitar a estrutura do cérebro humano, com abordagens lógicas clássicas semelhantes a programas.
Codificação mais inteligente baseada em IA
Os LLMs surgiram como ferramentas poderosas para engenheiros de software humanos, incluindo empresas como GitHub Copilot, mas não podem ser usados para criar bibliotecas de software em grande escala, disseram os cientistas. Para fazer isso, eles devem ser capazes de classificar e integrar o código em programas menores que sejam mais fáceis de ler e reutilizar, e é aí que entra o LILO.
Os cientistas combinaram um algoritmo desenvolvido anteriormente que pode detectar abstrações, conhecido como “Stitch” – com LLMs para formar a estrutura neurossimbólica LILO. Sob este regime, quando um LLM escreve código, ele é então emparelhado com Stich para localizar abstrações dentro da biblioteca.
Como o LILO pode entender a linguagem natural, ele pode detectar e omitir vogais de sequências de código e desenhar flocos de neve – assim como um engenheiro de software humano poderia, aproveitando seu bom senso. Ao compreender melhor as palavras usadas nos prompts, os LLMs poderão um dia desenhar gráficos 2D, responder perguntas relacionadas a recursos visuais, manipular documentos Excel e muito mais.
Usando IA para planejar e criar estratégias
Atualmente, os LLMs não podem usar habilidades de raciocínio para criar planos flexíveis – como as etapas envolvidas na preparação do café da manhã, disseram os pesquisadores. Mas a estrutura Ada, batizada em homenagem à matemática inglesa Ada Lovelace, pode ser uma forma de permitir que eles se adaptem e planejem quando recebem esses tipos de tarefas, por exemplo, em ambientes virtuais.
A estrutura forneceu bibliotecas de planos de culinária e jogos usando um LLM para encontrar abstrações de conjuntos de dados de linguagem natural relacionados a essas tarefas – com os melhores pontuados, filtrados e adicionados a uma biblioteca por um operador humano. Ao combinar o GPT-4 da OpenAI com a estrutura, os cientistas superaram a linha de base de tomada de decisão da IA, 'Código como Políticas', na execução de simulações de cozinha e tarefas de jogos.
Ao encontrar informações ocultas em linguagem natural, o modelo compreendeu tarefas como colocar vinho gelado no armário da cozinha e construir uma cama – com melhorias de precisão de 59% e 89%, respectivamente, em comparação com a realização das mesmas tarefas sem a influência de Ada. Os investigadores esperam encontrar outros usos domésticos para Ada num futuro próximo.
Dando aos robôs uma vantagem assistida por IA
A estrutura LGA também permite que os robôs entendam melhor seus ambientes como os humanos – removendo detalhes desnecessários do ambiente e encontrando melhores abstrações para que possam executar tarefas de maneira mais eficaz.
LGA encontra abstrações de tarefas em instruções de linguagem natural, como “traga-me meu chapéu”, com raízes realizando ações baseadas em imagens de treinamento.
Os pesquisadores demonstraram a eficácia do LGA usando o Spot, o robô quadrúpede semelhante a um canino da Boston Dynamics, para buscar frutas e reciclar bebidas. Os experimentos mostraram que os robôs poderiam examinar o mundo com eficácia e desenvolver planos em ambientes caóticos.
Os pesquisadores acreditam que estruturas neurossimbólicas como LILO, Ada e LGA abrirão caminho para modelos de IA “mais humanos”, dando-lhes habilidades de resolução de problemas e permitindo-lhes navegar melhor em seus ambientes.