Inteligência artificial: novo modelo computacional reconhece objetos

Modelo reconhece e identifica objetos, como o nosso cérebro, além de ser capaz de predizer o desempenho humano na percepção visual.

taniager

09 Junho 2010 | 13h09

Novo modelo computacional imita o cérebro de primatas no reconhecimento de objetos criando um mapa de “interesse” (à direita) para uma imagem visualizada. A previsão de qual parte da imagem irá atrair a atenção de um indivíduo (em verde, à esquerda) confere com dados experimentais (pontos amarelos e vermelhos). Crédito: cortesia de Sharat Chikkerur.

Novo modelo computacional imita o cérebro de primatas no reconhecimento de objetos criando um mapa de “interesse” (à direita) para uma imagem visualizada. A previsão de qual parte da imagem irá atrair a atenção de um indivíduo (em verde, à esquerda) confere com dados experimentais (pontos amarelos e vermelhos). Crédito: cortesia de Sharat Chikkerur.

Um modelo matemático computacional desenvolvido recentemente por pesquisadores do Instituto Tecnológico de Massachusetts (MIT) reconhece objetos, como o nosso cérebro, e ao identificá-los é capaz de predizer com precisão o desempenho humano em determinadas tarefas de percepção visual.

Ele imita o processo de decisão do que é um objeto e sua localização da mesma maneira que ocorre no cérebro de primatas, em duas regiões distintas, além de integrar os dados obtidos para analisar a imagem durante a percepção. O modelo poderá ajudar a melhorar sistemas computacionais no reconhecimento de objetos.

Como o cérebro, o modelo pesquisa e seleciona as imagens de maior interesse entre as várias apresentadas no campo visual e traça um mapa rústico das  regiões que visualmente chamam a sua atenção.  Por essa razão, a atenção é o mecanismo de integração das informações selecionadas.

Sharat Chikkerur, Tomaso Poggio e equipe pertencentes ao Departamento do Cérebro e Ciências Cognitivas e do Laboratório de Informática e Inteligência Artificial, programaram o modelo e, em seguida, testaram suas previsões comparando com os dados obtidos em experiências com seres humanos.

Os indivíduos foram instruídos para primeiramente observarem uma cena de rua representada em uma tela de computador, e em seguida, contar os carros na cena e, finalmente, contar os pedestres, enquanto um sistema de acompanhamento de olho gravava os movimentos dos olhos dos participantes. O software previu, com grande precisão, quais as regiões da imagem os indivíduos iriam assistir durante cada tarefa.

Como o software imita a percepção visual

O software começa analisando uma cena pela identificação das características interessantes – formas rudimentares comuns em uma ampla variedade de imagens. Em seguida, ele cria um mapa que mostra quais características são encontradas em quais partes da cena. Depois, ele processa separadamente as informações sobre a forma e a localização, como faz o cérebro, e elabora uma lista de todas as características interessantes do mapa.

A partir desta lista, outra lista é criada com todos os objetos que contêm essas características, embora ele não registre qualquer informação sobre onde ou como as características ocorrem. Ao mesmo tempo, ele cria um mapa espacial da imagem que indica onde as características interessantes poderão ser encontradas, mas não quais tipos de características elas são.

Ele interpreta, no entanto, o “meio de interesse” das características probabilisticamente. Se uma característica ocorre mais de uma vez, seu meio de interesse é espalhado em todos os locais em que ela ocorre. Se outra característica ocorre em apenas um local, seu meio de interesse é concentrado neste local. A interpretação dos resultados é, portanto, probabilística.

Em função deste tipo de processamento, o modelo acaba prevendo um outro aspecto da percepção humana: o fenômeno do “apagão”. Para exemplificar este fenômeno, um indivíduo visualizará em uma imagem contendo o desenho de um quadrado e de uma estrela ambas as formas igualmente. Mas, este mesmo indivíduo dará ênfase ao quadrado se a imagem representar um quadrado e uma dúzia de estrelas.

O software também pode ajustar seus modelos de objeto e localização durante a busca. Se a ele for solicitado identificar somente os objetos em um determinado local na imagem, ele irá eliminar de sua lista quaisquer objetos possíveis que não contenham as características encontradas nos objetos daquele local.

Da mesma forma, se é pedido a ele para procurar a imagem de um determinado tipo de objeto, o “meio de interesse” das características não encontradas nesse objeto vão a zero, e o “meio de interesse” das características encontradas no objeto aumentará proporcionalmente. Isso é o que permite ao sistema prever os movimentos dos olhos de seres humanos quando visualizam uma imagem digital, mas também é o aspecto do sistema que poderia ajudar no projeto de sistemas de reconhecimento de objeto computacionais.

Resumindo, em um sistema de reconhecimento de um determinado objeto  convencional, a busca vasculha toda a imagem por características específicas de um primeiro objeto, e deste mesmo modo busca um segundo objeto e assim sucessivamente. Mas o sistema de Poggio e Chikkerur limita as buscas pesquisando apenas as regiões da imagen que probabilisticamente poderiam apresentar as características que interessam.

Veja também:

– Geração de circuitos lógicos usará DNA como “tijolinhos” de construção
Computação quântica: circuito é criado a partir de átomos neutros
Pesquisadores avançam na concepção de computação molecular
Sistemas computacionais “úmidos” imitam atuação do cérebro
Transistor orgânico alimenta sonho de computar igual ao cérebro
Neurocomputador que pensa como o cérebro está a caminho
Computador molecular criativo “pensa” e se “cura” como o cérebro