Les deux tendances technologiques se développent en parallèle et indépendamment l'une de l'autre. Pourtant, dans un rapprochement plus sensé qu'il n'y paraît de prime abord, les analystes de Gartner comparent les bénéfices respectifs des initiatives "big data" et "open data". Leur conclusion est claire : l'ouverture des données est bien plus intéressante, en termes de valeur apportée à l'entreprise, que leur analyse à grande échelle.
Mais, tout d'abord, pourquoi établir un tel pont entre 2 concepts a priori étrangers ? La réponse est simple et fait aussi partie de la "démonstration" de Gartner : aujourd'hui, toute entreprise qui possède des gisements importants de données devrait évaluer les opportunités de revenus que ceux-ci peuvent représenter. La première stratégie envisageable, dont les bénéfices sont indiscutables, est d'utiliser l'information disponible pour détecter des corrélations insoupçonnées et mieux connaître son métier, son environnement et ses clients. C'est, dans un sens étendu, le domaine des "big data".
D'un autre côté, pour une entreprise qui distribue ses produits et services sur Internet et qui souhaite renforcer ses relations avec son "écosystème", une stratégie d'ouverture des données ("open data") est considérée comme la plus "rentable". En effet, sa valeur peut être dégagée non seulement par une monétisation directe de l'information mais également par la démultiplication des capacités d'innovation induite (qui génèrera potentiellement des réductions de coûts internes), la transparence (un enjeu important des administrations publiques, notamment) et l'amélioration de l'image de marque.
D'un point de vue technique, les solutions disponibles actuellement, par exemple les outils d'anonymisation et de gestion de la qualité, permettent de publier des données avec une relative facilité, sans risquer de s'attirer les foudres des régulateurs ou du grand public craignant pour la protection de la vie privée. L'ouverture elle-même peut prendre des formes variées, de la mise à disposition sur le web d'APIs ("interfaces de programmation applicative") pour les développeurs à la distribution sur des places de marché spécialisées (telles que le DataMarket de Microsoft).
Les vraies difficultés sont donc peut-être ailleurs que dans la technologie. A commencer par la question cruciale : quelles sont les données les plus appropriées dans une approche d'ouverture ? Il faudra sélectionner celles qui ont le plus de chance de "séduire" leur cible (partenaires, sociétés tierces créant de nouveaux modèles...), tout en restant cohérent avec la stratégie de l'entreprise et en définissant des modalités de diffusion qui garantissent la viabilité à long terme de l'initiative. Le deuxième enjeu clé est celui de la valorisation : quel modèle économique adopter et quel niveau de prix fixer ? Les réponses sont critiques pour garantir le succès et "libérer" la valeur.
Les institutions financières sont naturellement d'excellentes candidates à l'ouverture de leurs gisements de données, particulièrement riches. Or, à ce jour, elles restent extrêmement réticentes à se lancer (un des rares exemples connus est celui de Cardlytics et ses quelques établissements partenaires) alors qu'elles ont peut-être une importante source de revenus à leur portée. Enfin, il ne faudrait pas oublier une autre dimension des "open data" : n'existerait-il pas des opportunités pour les banques d'exploiter les données disponibles publiquement afin d'enrichir leurs propres services ?