Por que Yann LeCun acredita que o LLM é um beco sem saída tecnológico

Yann LeCun, pesquisador de IA premiado com o Turing Award e ex-Meta Chief AI Scientist, está desafiando o domínio de grandes modelos de linguagem (LLMs) com um novo paradigma chamado. Arquitetura Preditiva Geral (JEPA). Com US$ 1 bilhão em financiamento, LeCun diz que os LLMs, como a série GPT da OpenAI, são limitados por sua dependência de modelos de linguagem estatística que não conseguem capturar o mundo real. O JEPA, por outro lado, concentra-se na modelagem do mundo físico através de representações abstratas, inspirando-se na forma como os humanos, especialmente as crianças, aprendem observando e interagindo com o seu ambiente. Parthknows explora como a dependência da JEPA em dados de imagem brutos e arquitetura modular poderia permitir que os sistemas de IA generalizassem tarefas de forma mais eficiente do que o LLM.

Saiba como os seis componentes modulares do JEPA, como o módulo de percepção e o modelo mundial, funcionam juntos para simular, prever e operar em ambientes dinâmicos. Obtenha informações sobre os desafios computacionais da modelagem da dinâmica do mundo real e por que LeCun acredita que representações fundamentadas são essenciais para alcançar a verdadeira inteligência. Esta explicação também examina as implicações mais amplas do desenvolvimento do JEPA, desde o seu potencial para mudar as prioridades de investigação em IA até ao seu papel na abordagem das limitações dos sistemas linguísticos.

Arquitetura Preditiva Geral (JEPA)

Chaves TL;DR:

Yann LeCun está liderando uma iniciativa de US$ 1 bilhão para construir a Joint Predictive Architecture (JEPA), um novo paradigma de IA focado na compreensão do mundo físico em vez de depender do reconhecimento de padrões linguísticos, como Large Language Models (LLM).
O JEPA aborda as principais limitações do LLM, incluindo alucinações, falta de compreensão do mundo real e rendimentos decrescentes de escala, enfatizando a representação fundamentada e a compreensão causal.
A abordagem JEPA envolve o treinamento de grandes quantidades de dados de imagens brutas para prever representações abstratas do mundo físico, para melhor generalização e adaptação com mínimo retreinamento.
A arquitetura JEPA é modular, consistindo em seis componentes (configurador, módulo de percepção, modelo mundial, módulo de custo, ator e memória de curto prazo) para funcionalidade dinâmica e escalável.
JEPA é uma mudança filosófica na inteligência artificial que prioriza a interação e a compreensão do mundo real em vez de sistemas baseados em linguagem, redefinindo potencialmente o futuro da inteligência artificial, apesar de desafios como requisitos computacionais e complexidade.

Por que o LLM está desaparecendo

Grandes modelos de linguagem, como a série GPT da OpenAI, têm sido fundamentais para o avanço das capacidades da IA. Mas LeCun afirma que o alcance e o potencial destes sistemas são fundamentalmente limitados. O LLM funciona prevendo a próxima palavra com base em modelos estatísticos, mas esse processo não tem compreensão do mundo real. O que pode parecer raciocínio ou compreensão é, na verdade, uma forma complexa de correspondência de padrões, sem consciência de causalidade ou dinâmica física.

Várias limitações críticas do LLM foram identificadas:

Alucinações: Os LLMs produzem frequentemente resultados imprecisos ou fantasiosos porque as suas previsões são baseadas em modelos linguísticos e não em conhecimento sólido.
Falta de compreensão do mundo real: Estes modelos não podem planear ou interagir de forma significativa com o mundo físico, o que limita a sua utilidade para tarefas que requerem compreensão do mundo real.
Retornos decrescentes: A ampliação dos LLMs continua a produzir melhorias limitadas, levantando questões sobre a sustentabilidade e a eficácia desta abordagem.

LeCun argumenta que estas deficiências realçam a necessidade de uma abordagem fundamentalmente diferente à IA que transcenda as limitações dos sistemas linguísticos.

O que torna o JEPA diferente?

Joint Embedding Predictive Architecture (JEPA) é um afastamento significativo do foco centrado na linguagem do LLM. Em vez de depender de modelos linguísticos, o JEPA visa prever representações abstratas do mundo físico, permitindo que os sistemas de IA obtenham uma compreensão mais profunda do seu ambiente. Esta abordagem inspira-se na aprendizagem humana, particularmente na forma como as crianças adquirem conhecimento através da observação e da interação.

Uma característica fundamental do JEPA é a sua dependência de dados brutos de imagem. Ao aprender com uma enorme quantidade de vídeos que podem ultrapassar um milhão de horas, o JEPA cria uma compreensão abrangente do mundo físico. Essa abordagem reduz a necessidade de grandes dados rotulados para tarefas específicas, como ensinar um robô a manipular objetos. O resultado é um sistema de IA com excelentes capacidades de generalização que lhe permite adaptar-se a uma ampla variedade de cenários com mínimo retreinamento.

Aprimore suas habilidades de LLM lendo mais de nosso conteúdo aprofundado.

Dentro da arquitetura JEPA

A arquitetura JEPA foi projetada para ser modular, com seis componentes interconectados que funcionam em harmonia para fornecer funcionalidade dinâmica e adaptativa. Cada módulo desempenha uma função separada na operação geral do sistema:

Configurador: Estabelece prioridades específicas de tarefas, garantindo que o sistema se concentre em objetivos relevantes e se adapte às mudanças nos requisitos.
Módulo de percepção: Monitora e interpreta dados ambientais para formar a base para decisões informadas.
Modelo mundial: Simula e prevê eventos futuros usando representações aprendidas do mundo físico.
Módulo de preço: Avalia a validade e eficácia de possíveis ações, otimiza o processo de tomada de decisão.
Ator: Executa o plano mais eficaz, transformando previsões em ações tangíveis no mundo real.
Memória de curto prazo: Rastreia ações passadas e informações contextuais, garantindo assim continuidade e adaptabilidade em um ambiente dinâmico.

Esta estrutura modular permite que o JEPA se adapte a novas tarefas e ambientes com reciclagem mínima, tornando-o uma alternativa versátil e escalável aos LLMs tradicionais.

Uma mudança de paradigma na filosofia da IA

O JEPA incorpora uma mudança filosófica na inteligência artificial. Enquanto o LLM se concentra na otimização de sistemas baseados em linguagem, o JEPA prioriza a compreensão do mundo físico. Ao modelar conceitos como posição, movimento e relações de causa-efeito, o JEPA visa criar sistemas de inteligência artificial que possam interagir de forma significativa no mundo real.

Esta abordagem desafia a suposição predominante de que a expansão do LLM acabará por levar à verdadeira inteligência. LeCun argumenta que representações fundamentadas e compreensão causal são necessárias para que a IA transcenda as limitações dos modelos linguísticos. Ao focar nestes elementos, o JEPA pretende redefinir o que significa para um sistema de IA ser verdadeiramente inteligente.

Impacto no futuro da IA

O desenvolvimento do JEPA tem o potencial de mudar fundamentalmente o panorama da IA. Se for bem-sucedido, o foco da indústria poderá mudar de sistemas baseados em linguagem para modelos que priorizem a compreensão e a interação com o mundo físico. No entanto, esta visão não está isenta de desafios:

Requisitos de cálculo: A modelagem da dinâmica do mundo real requer enormes recursos computacionais e pode ter problemas de escalabilidade.
Complexidade: O desenvolvimento de sistemas que possam simular e prever com precisão as interações físicas é um empreendimento muito complexo e que consome muitos recursos.

O debate entre o LLM e o JEPA destaca uma questão mais ampla: podem os sistemas baseados na linguagem evoluir para uma verdadeira inteligência ou é necessário um novo paradigma? Os resultados do desenvolvimento do JEPA nos próximos anos poderão ter implicações importantes para a investigação e aplicações da inteligência artificial e para o panorama tecnológico mais amplo.

O ambicioso JEPA de Yann LeCun é um passo ousado para redefinir a inteligência artificial. Ao privilegiar uma compreensão física do mundo em detrimento da correspondência linguística de modelos, o JEPA oferece uma visão fundamentalmente diferente da verdadeira inteligência. Embora o sucesso deste paradigma permaneça incerto, ele destaca a necessidade de inovação numa indústria que enfrenta as deficiências das tecnologias existentes. Com a comunidade de IA observando de perto, a trajetória do JEPA pode, em última análise, determinar a direção futura da IA.

Crédito de mídia: Parthknowsai

Arquivado em: IA, principais notícias

Divulgação: Alguns de nossos artigos contêm links afiliados. Se você comprar algo por meio de um desses links, o Geeky Gadgets poderá ganhar uma comissão de afiliado. Conheça nossa política de divulgação.

Fonte da notícia