« Dans les prochains mois, nous allons intégrer des technologies sémantiques dans nos solutions », dévoile Stefane Fermigier, fondateur et président du conseil de surveillance de Nuxeo. Une évolution qui traduit l'intérêt croissant des spécialistes de la gestion de contenu pour les outils d'analyse de textes. Rappelons qu'en début d'année Open Text reprenait Nstein.
Cet enrichissement fonctionnel découle de l'implication de l'éditeur français open source dans deux projets de recherche. Le premier, Scribo (Semi-automatic and Collaborative Retrieval of Information Based on Ontologies), coordonné par XWiki, est purement français. Le second, IKS (Interactive Knowledge Stack), s'inscrit dans une dimension européenne.
Le noyau dur d'IKS est constitué d'une quinzaine d'organisations : des laboratoires de recherche et des « industriels », parmi lesquels les éditeurs Nuxeo et Day Software (repris le mois dernier par Adobe). Des entreprises sont également impliquées pour tester en avant-première les solutions. L'Agence France-Presse, cliente de Nuxeo, fait partie de l'aventure.
Cela n'a rien d'étonnant car les entreprises de média ou les sites avec un fonds documentaire important sont particulièrement intéressées par les technologies sémantiques. Elles constituent un moyen de valoriser leurs actifs et de recommander des contenus de la même veine.
Un des objectifs d'IKS est de fournir des librairies et des outils pour aider les éditeurs de gestion de contenu à passer à l'ère du sémantique. Les travaux du consortium ont d'ores et déjà débouché sur un premier logiciel : Fise (Furtwangen IKS Semantic Engine). Ses enjeux et ses mécanismes de fonctionnement sont détaillés dans un remarquable billet publié sur le blog de Nuxeo.
La particularité de Fise est de combiner une approche open source et de proposer une intégration via des interfaces Rest (Representational State Transfer). Même si le moteur est développé en Java, il s'intègre ainsi facilement avec des plates-formes basées sur Python, PHP...
Le logiciel peut être évalué en ligne, mais ses composants pourront être installés sur les serveurs des entreprises. Ils seront ainsi proposés avec les logiciels de gestion documentaire et de gestion des actifs multimédias de Nuxeo.
L'une des questions qui reste à trancher par l'éditeur est de déterminer le jeu de données qu'il fournira en standard pour évaluer la pertinence de l'analyse sémantique. La détection d'entités nommées, par exemple, interroge des ontologies. A priori, Nuxeo fournira en standard un jeu réduit qu'il sera possible d'étendre dans un second temps.