Multimédia

Ce que Xerox est capable de déduire d'une image

Le site Open Xerox dévoile quelques-unes des dernières avancées en termes de traitement d'images : recherche de documents similaires, analyse automatique du contenu à des fins de classification, évaluation de la qualité esthétique de photographies...

Si les deux premiers axes de recherche font l'objet de travaux depuis de nombreuses années, le dernier est relativement récent. Le laboratoire européen de Xerox, basé à Grenoble, s'en est emparé, il y a 4 ans, avec une approche novatrice. 

Plutôt que d'essayer de traduire les bonnes pratiques édictées par les professionnels (règle des 3 tiers, gestion des contrastes...), il met à profit les quantités d'images qui sont publiées et annotées sur le web pour alimenter un système auto-apprenant qui en déduit des règles de notation en fonction des jugements des internautes.

Les critères de jugement esthétique varient d'une catégorie à l'autre 

La pertinence de l'évaluation esthétique est renforcée si l'image a été préalablement affectée à une catégorie. « Le fait de connaître le contenu d'une image permet à l'algorithme de se focaliser sur des informations particulières, explique Florent Perronnin, Senior Scientist in Computer Vision au XRCE (Xerox Research Centre Europe). Pour des images de fleurs par exemple, les gens apprécient les couleurs vibrantes. »

Open Xerox Aesthetic Quality

Un exemple d'application du service Aeshetic Quality appliqué à des images de plages et de mer.

Cette technologie est couplée avec celle d'analyse du contenu d'une image, qui fonctionne également sur un mécanisme d'apprentissage supervisé. Le système est dans un premier temps alimenté par des images annotées (de quelques-unes à plusieurs dizaines de milliers selon les catégories). À partir de là, l'algorithme détermine les images qui traitent du même concept et peut donc les classer.

Une comparaison avec un modèle de classe propre à chacune des 17 000 catégories

Cette approche diffère du calcul d'images similaires, que propose par ailleurs Xerox. Dans ce dernier cas, le système détermine une distance entre deux signatures d'image, calculées à partir d'informations de forme, colorimétrie, texture...

Cette technique est utilisée depuis de nombreuses années dans des applications de reconnaissance faciale, de traque à la contrefaçon...

Pour la catégorisation, le laboratoire grenoblois se base sur un calcul de distance entre une image et un modèle de classe, propre à chaque concept. « Ce qui revient à déterminer, par exemple, qu'est-ce qui fait qu'un chat est un chat d'un point de vue d'une image », détaille Florent Perronnin. 

A ce jour, Xerox a défini 17 000 catégories couvrant de multiples domaines (plantes, champignons, animaux, véhicules, objets de la vie courante...), dont 700 sont proposées sur le site Open Xerox. La taxonomie utilisée pour organiser les catégories permet au système, en cas de doute, de retourner une information moins précise liée à la catégorie parente. 

Une application originale sur Facebook

Bien entendu, les spécialistes des banques d'images sont les premiers intéressés, de même que les grandes entreprises dont les fonds documentaires comptent de plus en plus d'images. Mais les applications peuvent aller bien au-delà. 

Xerox en fournit un exemple avec le service Catepix qui analyse le contenu des images publiées sur les comptes Facebook. « Il pourrait servir à suggérer des mises en relation ou des événements », indique Craig Saunders, responsable de la recherche européenne en vision par ordinateur de Xerox.

Le moteur de suggestions ne se baserait plus sur l'analyse des informations publiées, mais sur ce que disent les photos mises en ligne.

Promo Newsletter