Cómo hacer reconocimiento visual de imágenes con Watson en Bluemix

Cómo hacer reconocimiento visual de imágenes con Watson en Bluemix

Análisis, reconocimiento y descripción en tiempo real de personas, animales, objetos, colores y paisajes, entre otros, ahora lo podemos tener al alcance de nuestras manos y con unos pocos clics y líneas de código integrarlo con nuestras apps web y móviles. ¿Cómo podemos usar el componente de Watson Visual Recognition en IBM Bluemix? Este artículo entrega los primeros pasos, los siguientes son tuyos.

Con Watson en Bluemix, componente de inteligencia y conocimiento, puedes integrar a tus aplicaciones web y móviles la capacidad de analizar el contenido visual de imágenes y cuadros de video para entenderlo directamente sin necesidad de descripciones escritas y etiquetas.

Antes de sacar conclusiones apresuradas prefiero experimentar un poco y entender. Empezaré entonces por mostrarles la experiencia que tuve con la demo online a continuación:

¿Cómo funciona la demo de reconocimiento visual de Watson con las imágenes por defecto?

La demo incluye en su catálogo una serie de imágenes por defecto. Creo que es justo iniciar a probar usando esta opción.

En el catálogo por defecto encuentro fotografías que parecen 100% reales (claro está que con Photoshop a la mano ya me es difícil separar lo que es real de lo que no lo es en términos de fotografía) de una carrera de caballos, un automóvil en movimiento, un molino de viento, una multitud en lo que parece un concierto, la cabeza de un tigre y un tierno bebé.

IMAGEN | Catálogo de imágenes por defecto

Catálogo de imágenes por defecto

Para mostrar los resultados del reconocimiento visual de Watson empezaré escogiendo las dos imágenes del catálogo que considero más complicadas de analizar: los caballos en movimiento y la multitud (si yo a veces me pierdo en una multitud, no me imagino lo complicado que puede ser para Watson).

Los resultados de analizar la imagen de competencia de caballos en movimiento para mi son realmente sorprendes. Lo primero que noto es la velocidad con que analizó la imagen pues tardo menos de un segundo, tal vez milésimas. Imagino que esto se debe a que Watson ya debe estar cansado de analizar la misma imagen una y otra vez.

Lo segundo que me llama la atención es la presentación de resultados y los grados de certeza que Watson entrega. Los resultados se presentan en una tabla en la que por orden de prioridad Watson entrega su análisis en forma de términos relacionados con la imagen y un porcentaje de certeza. Por ejemplo, en primer lugar Watson definió con un 73% de certeza que se trata de una fotografía. ¡En segundo lugar definió que se trata de una carrera de caballos con un 73% de certeza!

IMAGEN | Reconocimiento visual de Watson con imagen de carrera de caballos

Test 1. Si Watson, es una fotografía de una carrera de caballos

Continúo entonces con la siguiente imagen en el orden de dificultad que escogí previamente: la multitud. Y nuevamente Watson con prontitud y precisión presenta los resultados.

En menos de un segundo Watson identifica el contexto de la imagen

En cuestión de segundos Watson identifica el contexto de la imagen

Watson descubre algo nuevo

Es fácil intuir que era sencillo para la inteligencia artificial salir bien librada al analizar imágenes predefinidas. Esta demo permite probar las capacidades de reconocimiento con algo más de dificultad incluyendo la posibilidad de utilizar imágenes propias e inéditas para permitir que Watson les eche un ojo.

Como me gustan los juegos de video, escojo una foto en Internet del próximo Uncharted 4, título que hace parte de una de mis series favoritas y el juego que más quiero para este 2015. ¿Qué me dirá Watson de esta imagen?

¿Watson no juega videojuegos?

¿Watson no juega videojuegos?

En esta ocasión el análisis toma un poco más, alrededor de unos 30 segundos. Sin embargo debo considerar que la carga de la imagen, que está en alta definición, se hizo desde mi máquina y esta es una diferencia importante con las galería de imágenes por defecto que ya están alojadas en Internet.

La descomposición lógica que hace Watson de la imagen de Uncharted es interesante. Primero dice con un 71% de certeza que se trata de una fotografía, luego dice que es de una escena al aire libre con un 70% de certeza y de allí en adelante analiza la imagen separando conceptos y entregando certezas. Me llama la atención que no identifica a un humano sino a un animal mamífero vertebrado placentario y vertebrado, esto puede ser posible a que los diseñadores del juego decidieron hacer un modelo 3D de un personaje con medidas que se salen del rango del estándar humano.

Definitivamente, no había forma en este momento de que Watson entre sus conclusiones dijera que se trataba de una foto de Uncharted 4. No creo que Watson juegue con videojuegos ni tampoco que su sistema cognitivo incluya material comercial o histórica de la saga. Si la demo tuviera la opción de retroalimentar el conocimiento de Watson, de corregirlo, tal vez la próxima vez si podría mencionarlo.

Aplicaciones de Watson Visual Recognition

Watson Visual Recognition ya está disponible como uno de los servicios que como desarrollador, emprendedor con tu startup o empresario puedes acceder a través de Bluemix.

Como desarrollador, puedes acceder al API de Watson Visual Recognition y a su documentación y empezar a probar sin costo esta tecnología con tus aplicaciones web, móviles o Internet of Things.

Los casos de uso son múltiples para diferentes contextos, el caso de uso más cercano a la demo que analizamos en este artículo es la utilización de Watson para clasificar en tiempo real álbumes fotográficos de acuerdo a etiquetas que Watson considere relevantes. En la medida en que trabajemos con la tecnología y la entendamos otros usos más creativos encontraremos en diferentes contextos.

¿Quieres saber más?

Puedes contactarme para ayudarte a responder tus preguntas sobre este y otros servicios en Bluemix.

Adicionalmente, estos son los links que vimos en este artículo, los entrego como referencia para que continúes investigando y ¡desarrollando las nuevas apps que marquen el futuro de Internet!:

Especialista de Arquitecturas Cloud y Consultor de negocios en el día, Emprendedor en las tardes y Estudiante en Platzi.com por las noches. Esposo y amigo de tiempo completo. Contacto interactivo en: http://ibm.germanacosta.co

1 Comment
  1. Hola Germán, mucho gusto y felicitaciones por el post esta excelente,pero comento para hacerte algunas preguntas, ya que soy nuevo con bluemix no tendras o sabras donde encontrar un ejemplo de Visual Recognition en Node-Red? un ejemplo como el del post de Chat, aquel estaba excelente, Saludos

TUS COMENTARIOS:

This site uses Akismet to reduce spam. Learn how your comment data is processed.