"L'important est de valoriser le contenu, pas l'emballage". Je reprends ici une formulation de Fred Cavazza dans l'un de ses derniers, nombreux et toujours étayés, articles de blog sur la revanche des interfaces textuelles (30 mai 2014). Il argumentait sur l'importance accru des contenus sur le design afin de diminuer les temps de chargement, notamment en raison de l'avènement des smartphones dans le trafic général du Web.
Je partage d'autant plus son point de vue que je suis avec attention un autre phénomène qui va bouleverser notre vision de la production et de la diffusion des contenus dans un futur proche. Le Web-éditorial se réinvente sans cesse et là, il se construit sans vous tout en veillant à apporter des contenus riches. Comme tous les métiers, celui de collecteur, traiteur et diffuseur de contenus numériques va connaître un vif chamboulement avec l'essor du GAT (Générateur automatique de texte) ou GCC en anglais (Global Content Creator). Tout cela naît de la rencontre du Big Data et du Web-éditorial, du mariage des données et de la connaissance, le tout couplé à de la vulgarisation.
De plus en plus de solutions logicielles puisent dans les données disponibles en ligne pour écrire, enrichir et diffuser des contenus en ligne sans l'intervention d'auteurs, de journalistes ou de contributeurs. Là, j'écris mon article pour le blog, mais bientôt passées les phases de test, un robot le fera à ma place car des algorithmes vont puiser dans des bases de données, chiffrées et textuelles, pour proposer des sujets dans un langage compris par tous. L'écriture automatisée est une réalité, les robots écrivains sont en train de nous piquer nos souris.
Des laboratoires aux entreprises, le chemin est de plus en plus court et déjà on peut examiner des productions de rapports, d'articles, de fiches descriptives produites de manière automatique par regroupement de mots d'une même famille sémantique tout en conservant des productions originales plaisant aux outils de référencement de Google.
Un tour rapide sur le site d'Yseop, une société lyonnaise, permet de l'entrevoir aisément avec quelques démos. Pour comprendre rapidement, le processus est le suivant :
- nécessité de disposer en amont de données (GRC/CRM, feuilles de calcul de tableurs, bases de données diverses...
- puis création de dialogues avec les clients et utilisateurs finaux pour comprendre leurs besoins
- puis analyse des données et production de règles propres à chaque métier pour raisonner et déduire des conclusions
- écriture d'informations factuelles, puis de commentaires proposant une analyse et enfin de recommandations assurant une appropriation personnalisée des contenus, le tout en plusieurs langues.
D'autres opérateurs sont dans la place et les outils ne manquent pas comme Charabia.net qui génère des textes aléatoires, l'une des premières étapes vers la voie du GAT intelligent.
Yves Eudes, journaliste au Monde a publié un excellent article sur le sujet le 2 juillet dernier dans lequel il s'est notamment intéressé à Wordsmith, une plateforme de génération de textes utilisée en phase expérimentale pour rédiger des annonces immobilières, des bilans d'activité, voire des compte-rendus de matches sportifs ! Ou encore à Narrativescience.com, à l'équipe confiante dans le liant qu'elle peut faire entre l'analyse et de l'exploitation de données et leur mise en narration.
On imagine aisément l'utilisation qui pourra être faite de cet "artisan des mots" pour ré-écrire en style dynamique les millions de fiches SIT du tourisme français, les milliers de bilans et rapports d'activités d'offices de tourisme, ainsi que les annonces stylées d'hébergements locatifs !
Derrière ces solutions, des linguistes, des spécialistes de l'intelligence artificielle, des informaticiens et des entrepreneurs émérites.
Mais l'histoire ne s'arrête pas là, des petits génies du MIT Media Lab élaborent un outil de création de contenus narratifs compliqués (noeuds dramatiques, histoires à tiroirs...) pour des journalistes ou storytellers via Fold. Sortie prévue cet été.
Et elle prend un nouvel essor quand on examine Wibbitz. Wibbitz est une application pour iPhone qui transforme tout article écrit de media (en anglais et espagnol pour l'instant) en un résumé audio et vidéo de moins d'une minute, le tout en 5 à 10 secondes ! Le principe repose sur le repackaging de contenus médiatiques à la manière de Flipboard ou Youmag mais va plus loin puisque un contenu textuel est extrait de chaque production des media qui va activer un programme de recherche d'images, vidéos et infographies en ligne pour créer un commentaire audio et une vidéo. Autrement dit, il y a du Storify dans l'air mais bien plus que ça avec de la création spécifique de contenus multimedia.
Imaginez juste le mécanisme suivant :
- un GAT auquel j'ai donné mes mots clefs et le plan de mon article va puiser les données permettant de l'étayer,
- va écrire le tout dans un langage le plus universel possible,
- le publier,
- puis Wibbitz ou une autre solution, en prendra un extrait et le traitera en vidéo !
De mon point de vue, la génération automatique des suggestions du jour en Internet de séjour et leur diffusion en conciergerie numérique dans un office de tourisme, le tout en plusieurs langues, ça va déchirer grave ! Mais comme toute innovation et derrière tout acronyme, il faudra bien des esprits et des doigts pour penser, choisir, activer, mesurer les retours, parler avec les prospects et les visiteurs.