Présentation de l’Observatoire des discours

Publié le 05 mars 2012 par Rolandlabregere

L' Observatoire des discours est un outil sémantique, fruit de la collaboration entre les entreprises Linkfluence (outil de visualisation) et Jean Véronis Technologies (traitement automatique du langage), pour Le Monde.fr. Il s'appuie sur l'analyse informatisée de plus de 1100 discours politiques pour donner un éclairage sur la campagne présidentielle 2012. Outre le texte intégral des discours, l'observatoire propose trois " radars " :

Les discours composant l'observatoire font partie d'une base de plus de 2000 discours réunie par Jean Véronis au fil des années (et qui ont servi notamment à la rédaction des Mots de Nicolas Sarkozy, publié avec Louis-Jean Calvet aux éditions du Seuil). Ils sont issus principalement de transcriptions mises en ligne sur les sites Web des personnalités politiques et partis. De façon à ne comparer que ce qui est comparable, seul les discours publics ont été retenus, à l'exclusion des interviews, billets de blogs, programmes politiques, etc. La base contient inévitablement des manques, notamment en ce qui concerne les " petits candidats ", qui improvisent souvent leurs discours, et qui n'ont pas toujours les moyens de maintenir des sites en ligne très fournis. Ces manques ne résultent bien évidemment pas d'une quelconque volonté de notre part. Bien au contraire, les équipes de campagne concernée sont invitées à nous communiquer les textes dont elles disposeraient et qui nous auraient échappé (contact : jean [at] veronis [point] fr). On notera bien évidemment que les textes réellement prononcés ont parfois des différences mineures avec la version écrite. Cela fait partie des difficultés méthodologiques inévitables de l'exercice, qui ne remettent néanmoins pas en cause les grandes tendances statistiques.

L'outil est relativement simple d'utilisation, et nous laisserons le lecteur le découvrir par l'expérience. Une aide en ligne (l'icône [i]) permet d'obtenir plus d'explications sur le fonctionnement de chaque module. Chaque radar comprend trois grandes zones d'analyse :

1. Liste des discours par personnalité et leurs pourcentages. C'est cette zone qui permet la navigation vers les discours individuels. A noter : elle se met à jour en fonction des sélections effectuées dans la zone des thématiques abordées (voir ci-dessous). Inversement, on peut y sélectionner une ou plusieurs personnalités et les thématiques sont ajustées en conséquence.

2. Thématiques abordées. Cette fenêtre propose quatre analyses différentes. La visualisation par défaut est un diagramme en radar permettant de représenter de façon synthétique le positionnement sémantique de chaque personnalité selon 12 thématiques (immigration, environnement, etc.). Celles-ci sont définies à partir de listes de mots-clés, en ne retenant pour chaque discours que les 5 thématiques qui sont les plus présentes (ou moins, si peu de thématiques sont présentes).

Le sélecteur en haut à droite de cette fenêtre permet d'obtenir trois autres vues (seuls ont été conservés les mots-clés qui apparaissent dans au moins 10 discours pour chaque radar) :

  • Liste des personnes citées
  • Liste des entités citées (lieux, entreprises, organisations, etc.)
  • Liste des termes utilisés.

3. Analyse stylistique. A nouveau le sélecteur en haut à droite permet d'obtenir quatre vues différentes. Les trois premières donnent des statistiques permettent d'explorer la fréquence d'emploi des pronoms "je", "nous" et "vous" dans les discours :

  • Une valeur faible correspond à une présence de 5 ou moins pour 1000 mots
  • Une valeur moyenne correspond à une présence de 6 à 10 pour 1000 mots
  • Une valeur forte correspond à la présence de plus de 10 pour 1000 mots

La quatrième vue permet de comparer la taille des discours :

  • Une valeur faible correspond à des discours de moins de 2500 mots
  • Une valeur moyenne correspond à des discours de 2500 à 7000 mots
  • Une valeur forte correspond à des discours de plus de 7000 mots

Enfin, chaque observatoire contient en haut à droite une zone de recherche permettant de rechercher librement un mot ou expression dans l'ensemble des discours sélectionnés et tout en bas de l'écran une ligne de temps permet de sélectionner l'empan temporel des discours considérés (toutes les analyses se mettent à jour en conséquence). La liste complète des critères de sélection, ainsi que le nombre de discours qui y correspondent apparaît en haut à gauche de l'interface.

Cette entrée a été publiée dans Actualité, Web/Tech, avec comme mot(s)-clef(s) institut linkfluence, linkfluence, linkfluence.net, radarly. Vous pouvez la mettre en favoris avec ce permalien. |