Blogoscopie
DESCRIPTION DU PROJET
Les blogs constituent, de nos jours, un moyen de plus en plus utilisé par les internautes pour diffuser de l’information. Qu’il s’agisse de journaux intimes, de blogs politiques, de blogs scientifiques, de romans interactifs, etc., ces blogs constituent une information sur l’état d’esprit, une photo à un instant t de la population. Bien qu’elle soit majoritairement jeune, la population des blogueurs représente assez bien la population globale.
Il s’agit donc d’un nouveau pouvoir informationnel qui, même diffus dans les mains de centaines de milliers de personnes, n’en reste pas moins un pouvoir capable d’influencer les opinions des gens.
Le but de ce projet est de développer des outils d’analyse des blogs permettant d’effectuer, automatiquement, les deux tâches suivantes : l’étude d’image et l’étude de tendance.
Ce projet entre dans un mouvement très porteur. D’une part, les blogs prennent une importance de plus en plus grande. Tous les media en parlent et reprennent même de temps en temps des informations provenant de blogs, que ce soit pour leur caractère provocateur, original, novateur, etc. Les sociologues se penchent sur ce phénomène et beaucoup le prennent comme sujet d’étude.
D’autre part, la quantité de blogs et leur réactivité rendent possible des analyses en quasi temps réel.
Enfin, l’image est quelque chose de fondamental dans notre société. Toutes les personnes et toutes les entreprises pour lesquelles l’opinion du public est importante ont besoin de se tenir au courant de l’évolution de leur image, et des sujets qui intéressent la population qui les intéresse pour s’adapter à leurs attentes. Il s’agit donc d’un enjeu économique majeur.
Concernant les aspects scientifiques et techniques, le projet permettra de lever un certain nombre de verrous importants, ce qui ouvrira des portes à de nombreuses autres applications. Les principaux verrous sont au nombre de deux :
- Afin de pouvoir déterminer une image ou des tendances sur les blogs, il est nécessaire de disposer d’outils capables d’analyser la tonalité du contenu, c’est-à-dire les sentiments mis en jeu. Il s’agit là d’un axe de recherche de premier ordre qui a fait l’objet de relativement peu d’études et qui a pourtant des applications très importantes, dans le domaine de la veille en particulier.
- Un autre élément est essentiel dans l’analyse de l’image : tous les blogs ne sont pas égaux. Les blogs ne sont pas seulement représentatifs de l’opinion de l’auteur, ils sont aussi susceptibles d’influencer les lecteurs. Il convient donc, pour faire l’analyse de l’image, d’évaluer le pouvoir d’influence dont dispose un blog.
L’objectif final de ce projet novateur est donc de tester, en grandeur nature, la possibilité de faire des analyses d’images et de tendance sur les blogs. Pour cela, nous nous limiterons à un certain nombre de modalités sentimentales (nous ne pouvons étudier tous les sentiments possibles dans le contexte de ce projet). Mais le but est de pouvoir produire une analyse d’image et de les comparer avec les analyses produites avec d’autres moyens.
Applications visées
Deux applications sont donc visées dans le cadre de ce projet :
- L’analyse d’image sur les blogs : déterminer en quels termes les blogueurs parlent d’une marque, d’une personne, d’un discours, etc. Évaluer les sentiments autour de ces entités principalement en termes de négatif/positif et pour/contre, mais en qualifiant aussi plus précisément certains sentiments comme la colère, l’envie, la peur, l’attachement, etc. Un tel outil concerne les marques ou personnes désirant évaluer leur image à l’aide de blogs.
- L’analyse de tendances sur les blogs : quels sont les nouveaux thèmes de prédilection, qu’est-ce qui intéresse les gens, de quoi parle-t-on, qu’est-ce qui fait réagir et en quels termes ? Cet outil est intéressant pour des diffuseurs d’information qui peuvent adapter le contenu de leurs journaux, publicités, émissions, etc. en fonction des attentes de la population.
Il s’agit donc, dans les deux cas, d’utiliser les blogs pour faire du sondage automatique. Chacun pouvant voir l’importance qu’ont les sondages, que ce soit pour les marques ou pour les diffuseurs d’information, l’intérêt économique de ce projet est clair.
L’analyse d’humeur et de sentiment est un domaine en pleine expansion, en particulier au travers des notions de positif/négatif. Les applications sont multiples, non seulement pour l’analyse d’image, mais également pour les systèmes de dialogue automatique (accompagnement d’un internaute, jeux avec personnages virtuels, avatars, etc.) ou pour le filtrage (détection de débordements pour modération sur les forums, etc.).
Dès lors, on peut typer des documents par rapport à leur sentiment, selon des axes utiles d’un point de vue marketing (positif, négatif, dubitatif,…), on peut aussi bien utiliser cela pour de l’extraction d’informations (text mining) de l’aide à la navigation (segmentation des réponses par rapport à ce critère, surtout si on peut coupler la proximité d’une marque ou d’une personne), etc.