Un software no solo mira, también puede ver

Un nuevo desarrollo de Google Research permite identificar objetos en imágenes digitales según el contexto visual en el que se encuentran

B. R.MADRID
Google ya desarrolló un sistema que aprendió por su cuenta a identificar gatos/
Google ya desarrolló un sistema que aprendió por su cuenta a identificar gatos

Una mancha roja se puede identificar como un juguete si se encuentra rodeado de niños, o como la cresta de un gallo si el contexto es una granja. Cuando no se puede hacer un examen completo y detallado de un objeto, el cerebro humano analiza la escena, y deduce los elementos que con más probabilidad la conforman. Un grupo de investigadores de Google Research ha desarrollado un equivalente informático para la caracterización de imágenes digitales.

«Los humanos pueden distinguir entre unas 10.000 categorías visuales de alto nivel, pero podemos discriminar entre un conjunto de estímulos visuales mucho más amplio al que nos referimos como características», asegura la compañía en un comunicado. «Estas características pueden corresponder a partes de objetos, extremidades animales, detalles arquitectónicos u otros patrones visuales para los que no tenemos nombres». Este gran conjunto es el que permite reconstruir e interpretar el mundo visual, y contextualizar correctamente las escenas ambiguas.

Un artículo publicado por investigadores del buscador describe una manera de «extraer esta información contextual con la riqueza semántica suficiente para identificar objetos cuando estos no son evidentes». Además, su método permite hacerlo con rapidez, mediante una técnica de comparación hashing similar a la que usan los servicios que identifican canciones al escucharlas durante unos segundos.

Google trabaja desde hace tiempo en sistemas de identificación de patrones visuales. Hace un año presentó una tecnología, inspirada en el funcionamiento del cerebro, que generaba sus propios patrones mentales, y aprendió sin ayuda externa a identificar gatos y personas en vídeos, fotos y dibujos.

En algunos ámbitos como el reconocimiento facial los algoritmos disponibles son bastante buenos. Pero generalizar esta tecnología para que reconozca cualquier cosa no es fácil, ni a nivel matemático ni computacional. La técnica desarrollada por estos investigadores permite realizar estas tareas «20.000 veces más rápido», afirman en su artículo. Con un ordenador casi normal con más memoria RAM que uno de casa, pudieron llevar a cabo su identificación visual contextual en unos 20 segundos por imagen.

Contenido Patrocinado

Fotos

Vídeos