Spécialiste du traitement des langues cherche « Killer App »

Le champ d'application des technologies du traitement automatique des langues (TAL) est immense. C'est à la fois une opportunité et un défi pour les spécialistes du domaine : il leur faut trouver l'application qui fera mouche. Une demie-douzaine d'entre eux, essentiellement des start up, étaient réunis mercredi 20 octobre au siège de l'Inria à Roquencourt, en région parisienne, dans le cadre des rencontres Iliatech. Le thème de la demie-journée était consacré à l'apport des technologies de la langue pour l'accès à l'information.

Il reste bien des développements à mener pour appliquer une double expertise linguistique profonde et informatique à de gros volumes de textes. C'est d'ailleurs l'objet du projet Alpage que pilote Laurence Danlos. L'équipe compte 20 chercheurs de l'Inira et de l'université Denis Diderot (Paris 7), qui collaborent au développement d'outils et de ressources d'analyses syntaxique et sémantique.

Vera s'est spécialisé dans l'analyse de commentaires des enquêtes internes

De ces travaux est née l'année dernière la société Vera (pour Verbatim Analysis). Il semble bien que cette dernière ait trouvé un filon : l'analyse automatique des réponses à des questions ouvertes dans les commentaires. Un domaine bien délimité que la jeune pousse a restreint en se spécialisant sur les problématiques RH liées aux enquêtes internes.

Vera ne compte pour l'heure qu'un seul client, Tower Watson, un cabinet de conseil employant 14 000 collaborateurs, mais elle est en cours de recrutement de thésards Cifre pour accompagner son développement. « Nous avons traité 20 millions de mots, 600 000 commentaires, produit 12 000 rapports PDF. La base lexicale développée semi-automatiquement couvre 10 langues, avec pour chacune d'elles 6 000 expressions », précise Benoît Sagot, directeur technique et co-fondateur avec Dimitri Tcherniak.

L'outil qu'elle propose détecte des idées concrètes dans les réponses individuelles et fait émerger des points clés qui sont illustrés à travers des verbatim. Ces derniers sont sélectionnés pour venir appuyer les tendances qui se dégagent des réponses aux questions fermées. Ils apportent de la « chair » aux rapports.

L'écriture automatique n'a plus rien de surréaliste

Les technologies de TAL ne servent pas uniquement à l'analyse de texte mais peuvent aussi en générer de manière automatique. Ce que propose la société Watch System Assistance, présente sur l'espace démonstration.

Son logiciel d'écriture automatique de commentaires à partir de tableaux de chiffres sur les investissements publicitaires est en production depuis mars 2010 et génère plusieurs centaines de pages de commentaires chaque mois. Le résultat est bluffant.

Des règles métier définies avec le client permettent d'identifier les faits saillants (variation importante d'indicateurs clés, tendances opposées entre deux séries de données....) qui seront interprétés avec une grammaire embarquant le vocabulaire des analystes. En rejouant le logiciel sur une même série de données, on obtient un texte différent mais tout aussi pertinent. En dépit d'une technologie séduisante, l'éditeur peine à trouver des débouchés et des clients.

Analyse du courriel et e-réputation : deux marchés porteurs

Deux autres éditeurs français, Kwaga et Lingway, ont présenté leurs solutions et travaux. Le premier utilise des grammaires locales pour extraire des informations des courriers électroniques et alerter l'utilisateur sur ceux qui nécessitent un traitement. Kwaga Context est une solution prometteuse, d'ores et déjà déployée dans plusieurs entreprises. Mais son éditeur ne l'a pas encore déclinée pour un usage métier spécifique.

De son côté, Lingway, acteur historique de la sémantique en France, a investi l'e-réputation. Un domaine qu'il aborde avec une solution issue du projet iPinion, mené conjointement avec l'éditeur Pikko et le laboratoire Medialabs de Science Po. Le marché est porteur, mais là aussi immense, et on attend de voir quelles seront les applications vedette qui émergeront.

A noter que Lingway sera présent lors du salon ICC les 8 et 9 novembre prochain, mais pas la société Hotgrinds, fondée par Claude Vogel (autre spécialiste français de la sémantique) qui avait présenté l'année dernière sa solution d'e-réputation en mode Saas. 

Promo Newsletter