Como a IA deep-learning pode ajudar a desvendar a cognição

A aprendizagem profunda é uma abordagem de inteligência artificial (IA) inspirada nas redes neurais do córtex analisador visual/auditivo do cérebro. Trata-se de um algoritmo de aprendizagem que vem contribuindo para tecnologias tais como análise automatizada de vídeo, tradução de idiomas, reconhecimento de faces e vozes, condução automática de automóveis etc.

Esse algoritmo aprende a processar inputs para obter uma saída específica – por exemplo, identificar um rosto específico em muitas fotos de pessoas diferentes. As redes são denominadas “profundas” (ou “convolutivas”) devido às suas múltiplas camadas de unidades computacionais repetidas em sequência. Cada unidade recebe entradas de unidades similares da camada anterior e envia saídas para as da próxima. Quando exposta a um determinado objeto, a rede modula os valores de pesos nas saídas de cada camada e estabelece, após tentativas e correções, a melhor distribuição de valores que corresponde ao objeto. Assim, ele passa a identificar o objeto em função do padrão de distribuição de pesos nas camadas de unidades computacionais, que equivalem a neurônios artificiais. Matematicamente, essa rede pode ser vista como uma função de alta dimensão, que modula os valores das saídas de uma camada para a próxima.

Para ser capaz de reconhecer coisas, a rede ajusta seus pesos de conexão durante uma fase de treinamento, que normalmente se baseia em um conjunto de exemplos de entradas e saídas. Essa é a fase de aprendizagem por treinamento. Por exemplo, mostramos a um sistema de aprendizagem profunda uma série de fotos especificando quais são as que contêm a face que ela deve identificar. Seus pesos são automaticamente ajustados pelos algoritmos de otimização até que ela alcance uma configuração de valores que dão a identificação correta com base na distribuição de pixels. A organização profunda da rede (multicamadas) confere a ela uma capacidade prodigiosa de identificar e classificar os detalhes, relações e configurações mais úteis que se repetem nos exemplos e, com isso, distingue os diferentes rostos. A desvantagem desse processo é que a rede treinada comporta-se como uma caixa preta, isto é, na maioria das vezes as soluções computacionais que ela elaborou durante o treinamento não são deduzidas na miríade de pesos distribuídos ao longo das camadas.

Redes de aprendizagem profunda executam com sucesso tarefas perceptivas, talvez até imitando o córtex dos mamíferos, mas há poucos estudos de tarefas comportamentais complexas, tais como a de reconhecer e percorrer (“navegar”) um território. Um aspecto fundamental de navegação na vida real é estimar a posição de uma pessoa após cada etapa, calculando o deslocamento por etapa com base na orientação e distância percorrida. Esse processo é chamado de integração do caminho e é considerado pelos neurocientistas, cientistas cognitivos e roboticistas como crucial para gerar um mapa cognitivo do ambiente.

No post anterior, vimos como a IA deep-learning pode ser uma valiosa colaboradora na investigação dos mecanismos neurais da cognição.

Leave a Reply

Your email address will not be published. Required fields are marked *