MIT desenvolve modelo eficiente de IA de visão computacional para ajudar carros autônomos na tomada de decisões em tempo real

Os veículos autônomos devem ser capazes de identificar com rapidez e precisão os objetos que encontram, como caminhões de entrega estacionados nas esquinas ou ciclistas que se aproximam dos cruzamentos. Para conseguir isso, os carros autônomos podem usar um poderoso modelo de visão computacional para classificar cada pixel em imagens de cena de alta resolução, garantindo que não negligenciem objetos que possam ser obscurecidos em imagens de baixa qualidade. Porém, esta tarefa, conhecida como segmentação semântica, é altamente complexa, exigindo extensa computação, principalmente com imagens de alta resolução.

De acordo com relatos da mídia internacional, pesquisadores do Massachusetts Institute of Technology (MIT), do MIT-IBM Watson AI Lab e de outras instituições colaboraram para desenvolver um modelo de visão computacional mais eficiente, reduzindo significativamente a complexidade computacional da tarefa mencionada. Este modelo pode realizar segmentação semântica precisa e em tempo real em dispositivos com recursos de hardware limitados, como computadores de bordo de veículos, permitindo que carros autônomos tomem decisões instantâneas.

Os atuais modelos de segmentação semântica de última geração podem aprender diretamente as interações entre cada par de pixels em uma imagem, o que significa que sua computação cresce quadraticamente à medida que a resolução da imagem aumenta. Embora esses modelos sejam muito precisos, sua velocidade de processamento é muito lenta para lidar com imagens de alta resolução em tempo real em dispositivos de ponta, como sensores ou smartphones.

Pesquisadores do MIT projetaram um novo componente para o modelo de segmentação semântica, ostentando capacidades equivalentes aos modelos mais avançados do gênero, mas alcançando apenas complexidade computacional linear e facilitando operações eficientes de hardware.

O resultado do trabalho dos pesquisadores é uma nova série de modelos para visão computacional de alta resolução. Quando implantados em dispositivos móveis, esses modelos operam 9 vezes mais rápido que seus antecessores. É importante ressaltar que, em comparação com soluções alternativas, este novo modelo atinge uma precisão semelhante, se não melhor.

Esta tecnologia não só pode ajudar os carros autónomos a tomar decisões em tempo real, mas também pode aumentar a eficiência de outras tarefas de visão computacional de alta resolução, como a segmentação de imagens médicas.

Enviar inquérito