MIT desenvolve sistema para computação gestual a preço acessível

O que você diria se para utilizar um sistema de computador gestual você apenas precisaria de uma webcam normal e uma luva muito barata?

taniager

24 Maio 2010 | 10h38

O hardware para um novo sistema computacional baseado em gesto consiste em nada mais do que uma webcam comum e um par de luvas de lycra colorida. Foto: Jason Dorfman / CSAIL

O hardware para um novo sistema computacional baseado em gesto consiste em nada mais do que uma webcam comum e um par de luvas de lycra colorida. Foto: Jason Dorfman / CSAIL

O que você diria se para utilizar um sistema de computador gestual você apenas precisasse de uma webcam normal e uma luva muito barata? Pode parecer conversa fiada, afinal, dispositivos de última geração são sempre caros. Mas agora pesquisadores do MIT desenvolveram uma interface mais acessível com um hardware de baixo custo – uma luva de lycra multicolorida que pode ser comprada por menos de dois dólares o par.

Desenvolvido por Robert Wang, do Laboratório de Inteligência artificial e Ciência da Computação e Jovan Popović, professor de engenharia elétrica e ciência da computação, o sistema pode traduzir gestos feitos com a mão enluvada em gestos no modelo 3D da mão na tela, com atraso irrelevante.

O sistema, que capta o movimento das mãos e dedos que estão sendo flexionados, poderá ser usado em jogos de vídeo game além de inúmeras outras aplicações. Basta imaginar um mundo virtual onde pessoas reais poderão manusear objetos virtuais simplesmente usando gestos com as mãos.

A luva multicolorida apresenta 20 padrões de formas irregulares que usam cores diferentes. O número de cores é limitado a 10 para aumentar a confiabilidade de reconhecimento pelo sistema, sob uma variedade de condições de iluminação. Os cientistas tiveram o cuidado de escolher e dispor as manchas coloridas para que a frente e as costas da mão pudessem ser distinguidas. Desta forma, confusões que poderiam ocorrer pela sobreposição de manchas de cores semelhantes são evitadas e reduzidas ao mínimo.

Já o software utiliza um sistema de busca rápida em um banco de dados com base em um novo algoritmo.

Como funciona?

Enquanto uma webcam captura uma imagem da luva, o software captura o fundo, de tal forma que somente a imagem da luva é sobreposta sobre um fundo branco. Então, o software reduz drasticamente a resolução da imagem recortada para apenas 40 pixels por 40 pixels. Finalmente, ele procura em um banco de dados contendo uma infinidade de modelos digitais, do mesmo tamanho (40 por 40), de uma mão vestida com a luva numa série de posições diferentes. Uma vez que é encontrada uma correspondência, ele simplesmente foca-se na posição da mão correspondente. Desde que o sistema não tenha de calcular a posição relativa dos dedos, palma e dorso da mão no momento, é capaz de fornecer uma resposta em uma fração de segundo.

Você pode estar se perguntando: este sistema não exigiria uma grande quantidade de memória para armazenar o banco de dados de imagens coloridas? Atualmente os computadores já possuem quatro gigabytes de memória RAM e este número só tende a aumentar.

Embora possa parecer simples, o sistema é bastante complexo, porque exige calibração para os diferentes tamanhos de mãos de usuários. Para calibrar o sistema, o usuário simplesmente coloca um pedaço de 22 por 28 centímetros de papel sobre uma superfície plana na frente da webcam, pressiona sua mão contra ele, e em cerca de três segundos, o sistema é calibrado.

O sistema de Wang havia sido apresentado em uma conferência sobre computação gráfica no ano passado, mas naquela época ele ainda demorava meia hora para ser calibrado e não funcionava adequadamente em ambiente muito iluminado.  

Wang agora está trabalhando para ampliar o sistema para capturar o corpo inteiro. Existem vários sistemas que avaliam a forma dos atletas ou conversões de atuações de atores para animações digitais, mas nenhum deles é tão incrivelmente barato e fácil de ser usado como este novo sistema.

Para assistir ao vídeo (em inglês), clique aqui.

Veja também:
Geração de circuitos lógicos usará DNA como “tijolinhos” de construção
Computador molecular criativo “pensa” e se “cura” como o cérebro
Sem tirar os olhos da estrada: carro pode ser guiado apenas pela visão