Pesquisadores defendem que um “jardim de infância” pode melhorar o aprendizado de IAs
Treinar um modelo começando com o básico melhora o desempenho dele quando as tarefas ficam mais complexas – igual a uma criança aprendendo.

Você não aprendeu sobre números complexos e nem leu Saramago no seu primeiro dia de jardim de infância. Essa fase da educação infantil é voltada para ensinar o básico do básico para uma criança – coisas como reconhecer e diferenciar números de letras, nomear os membros da família, partes do corpo, cores e formas.
Nos últimos anos do jardim de infância, as crianças podem ter um contato um pouco maior com leitura e escrita, assim como realizarem as primeiras operações matemáticas de soma e subtração. Mas o foco dos professores nesse período é ensinar o raciocínio lógico básico.
Depois que a criança domina isso, ela pode começar a interpretar frases maiores, aprender a tabuada e divisões e assim seguir sua jornada de aprendizado.
Precisamos reconhecer letras antes de conseguir ler e saber o que são números antes de conhecer a tabuada. Primeiro vem o aprendizado básico, e depois as tarefas mais difíceis. Segundo um grupo de pesquisadores da Universidade de Nova York, esse princípio também se aplica na Inteligência Artificial (IA).
Sua pesquisa, publicada no periódico Nature Machine Intelligence, mostra que modelos de IA treinados primeiro com tarefas simples são mais capazes de resolver questões complexas depois.
A semelhança com o processo de aprendizado de crianças é tão grande que os pesquisadores nomearam essa forma de treino como “aprendizagem de jardim de infância” (no inglês, kindergarten curriculum learning). De fato, a ideia é a mesma: estimular, primeiramente, uma compreensão de tarefas básicas e depois combinar o que foi aprendido para executar tarefas mais desafiadoras.
“Desde muito cedo, desenvolvemos um conjunto de habilidades básicas, como manter o equilíbrio ou brincar com uma bola”, explica Cristina Savin, professora do Centro de Ciências Neurais e do Centro de Ciência de Dados da Universidade de Nova York. “Com a experiência, essas habilidades básicas podem ser combinadas para fortalecer comportamentos complexos — por exemplo, fazer malabarismos com várias bolas enquanto anda de bicicleta.
“Nosso trabalho adota esses mesmos princípios para aprimorar as capacidades das RNNs, que primeiro aprendem uma série de tarefas fáceis, armazenam esse conhecimento e, em seguida, aplicam uma combinação dessas tarefas aprendidas para concluir com sucesso tarefas mais sofisticadas.”
Aprendendo com o jardim de infância
Uma rede neural recorrente (RNN) é um sistema de computação que busca simular a tomada de decisão que acontece nos neurônios de um cérebro humano. A parte do recorrente é o diferencial do modelo. Todas as IAs precisam aprender de um jeito — é o chamado aprendizado de máquina (machine learning). As RNNs têm uma “memória” que elas usam para influenciar o resultado atual. Ou seja, as respostas e informações anteriores servem de experiência para o modelo.
Esse tipo de sistema é bem útil em funções como reconhecimento de fala e tradução de idiomas. No entanto, quando se trata de tarefas cognitivas complexas, treinar RNNs com métodos existentes pode ser difícil e não capturar aspectos cruciais de comportamento que os sistemas de IA buscam replicar.
Foi pensando nessa questão que os autores do estudo resolveram testar uma nova técnica de aprendizado para treinar o modelo de IA.
A pesquisa teve duas partes: primeiro, os cientistas fizeram testes com camundongos para identificar como eles aprendiam a se virar em uma determinada situação. No caso, os bichinhos deveriam ir atrás de uma fonte de água que estava escondida atrás de uma de várias portas compartimentadas. Para saber quando e onde a água estaria disponível, os ratos deveriam aprender que o fornecimento de água estava associado a certos sons e à iluminação das luzes da porta — e que a água não era fornecida imediatamente após esses sinais.
A ideia era que os animais precisariam entender o básico do que estava acontecendo, identificar sinais visuais e sonoros e raciocinar sobre como isso se relaciona com a oferta de água. Depois, eles deveriam combinar todo esse conhecimento para atingir o seu objetivo: se hidratar.
Dentro dos planos do estudo, os testes com camundongos funcionaram como uma situação modelo: uma IA ideal deveria se assemelhar ao processo de aprendizado dos ratinhos.
A partir dessas descobertas, veio a segunda parte do estudo: os cientistas treinaram as redes neurais para realizar uma tarefa similar à dos animais. Alguns dos modelos receberam um “currículo de pré-treino” composto por “tarefas cognitivas mais simples que refletem subcomputações relevantes” para a tarefa. Tudo isso para simular o processo de aprendizado que os camundongos tiveram.
Por fim, os pesquisadores compararam a abordagem do “currículo do jardim de infância” com os métodos de treinamento de RNNs já existentes. No geral, os resultados da equipe mostraram que as IAs treinadas no jardim de infância aprenderam mais rápido do que aquelas treinadas com os métodos atuais.
“Os agentes de IA precisam primeiro passar pelo jardim de infância para, posteriormente, serem capazes de aprender melhor tarefas complexas”, observa Savin. “No geral, esses resultados apontam para maneiras de melhorar o aprendizado em sistemas de IA e exigem o desenvolvimento de uma compreensão mais holística de como experiências passadas influenciam o aprendizado de novas habilidades.”