Magazine Concerts & Festivals

Les mobiles plus parlants qu’on ne le pense

Publié le 08 octobre 2015 par Wanderer

by futureatlas.com/blog/Parfois, on découvre des choses sidérantes, sans qu’elles soient nécessairement exclusives.
Ainsi du contenu de ce dossier sur l’usage des données mobiles (payant, gratuit pendant une semaine).

En résumé rapide, on y apprend toute la puissance de certaines données d’appels depuis des mobiles.

Au premier abord, on pourrait dire, «ben on le savait déjà», puisque finalement il s’agit de l’utilisation de données personnelles pour en inférer diverses choses. Bref un exemple de plus de Big data, dont on nous rebat les oreilles régulièrement.

Pourtant, c’est assez différent de l’habitude.

Certes nous commençons à savoir que nos traces peuvent être «utiles» (un historique de navigation web, une série d’achats ou de requêtes dans un moteur de recherche…). Mais les informations que les sites en retirent sont assez directement liées à ces données : un marchand recommandera des produits en fonction de nos achats antérieurs ou des intérêts manifestés, un moteur de recherche proposera des publicités en fonction des requêtes précédentes ou de la comparaison avec des profils semblables…

Avec le mobile, c’est beaucoup plus fort : quel rapport entre nos communications et la pauvreté, le chômage, la consommation électrique, la personnalité, le sexe… Et pourtant, ce sont bien des corrélations entre l’usage téléphonique et ces domaines qui sont tirées. Et qui surprennent. Histoire de dissiper un malentendu : toutes ces expériences se passent sans GPS ni données d’applications. Les données d’un mobile d’il y a dix ans aurait donné les mêmes résultats.

L’article de revue, qui reprend bon nombre de résultats scientifiques récents, coécrit par un des pionniers du domaine, est édifiant (et en plus en open access ; et déjà très cité). C’est lui qui m’a donné envie de faire ce dossier d’ailleurs.

Des grincheux, qui n’auront pas tort, feront remarquer (c’est dit dans le dossier), que cela n’est pas nouveau. Bien entendu que les femmes passent plus de temps au téléphone que les hommes et que la durée est donc un bon prédicteur du sexe. Mais les quantités de données recueillies font changer de dimension et peuvent affiner les choses. Compte tenu d’un loi générale liant distance et fréquence des appels, il est ainsi possible d’inférer les villes présentes dans un fichier…où les noms des villes n’apparaissent pas.

Flicage !
A chaque fois que j’ai expliqué ce dossier, les réactions ont été négatives : comment peut-on utiliser ces données personnelles, sans consentement !?!

Rappeler que c’est anonyme, agrégé, contrôlé par la CNIL, et que les données restent chez l’opérateur, et que l’on laisse encore plus d’infos à des sites peu scrupuleux de protection… n’y fait rien. Le soupçon d’intrusion dans la vie privée est là.

Si j’ai l’air rassuré, c’est surtout que ce dont il est question dans ce dossier concerne soit des expériences scientifiques, soit des réponses ponctuelles dans des cas d’urgence humanitaire, soit des petits pas commerciaux…

En revanche, il y aura de quoi s’inquiéter dès lors que tout cela passera à l’échelle et se répandra. Il faudra que les opérateurs télécoms soient convaincants pour présenter les garde-fous (et le cas Volkswagen laisse présager le pire).

En tous cas, saluons la prise de conscience des chercheurs qui alertent avant que les gros problèmes n’arrivent (cf. dossier maths).

Le gros défaut du Big data
Ces exemples soulignent une fois de plus un des problèmes du Big data et du changement de paradigme qu’il impose. La recherche est guidée par les données, pas par des hypothèses et des théories que l’expérience doit valider. Ici on tire des corrélations, des probabilités.. mais on ne sait pas expliquer le pourquoi des choses finalement trouvées…

Données ou infos ?

Une petite disgression pour terminer.
A l’occasion de la rédaction de l’article, je suis tombé incidemment sur un problème sémantico-philosophique. Afin d’éviter les répétitions, je remplaçais parfois «données» par «informations». La substitution est souvent indolore, mais elle m’a fait prendre conscience que dans certains débats, le choix d’un mot peut orienter une discussion.

Ainsi, en santé, le patient voudrait bien avoir plus d’informations sur son état de santé. Ce qui demande un accès à ses données. Et là, soudain tout devient plus compliqué. Qui dit «données» dit «protection», «accès», «sécurité», «partage ou non»… La discussion dérive ; ce qui n’est pas forcément plus mal d’ailleurs !

Dernière disgression. Ces soucis techniques seraient une des raisons de l’échec actuel du fameux dossier médical. On peut faire une autre hypothèse. Le corps médical, dans un premier réflexe, n’y a pas intérêt. Comme beaucoup de métier, il tire son autorité bien sûr d’un savoir-faire mais aussi d’une sorte de monopole de la connaissance (ou veut y croire). Il sent bien que si on commence à fournir plus de données aux patients, certains en sauront plus qu’avant sur leurs cas, tenteront des comparaisons, poseront de nouvelles questions, iront voir ailleurs plus facilement… Ca risque de déstabiliser.
Les freins au dossier personnel médical sont-ils donc seulement technico-juridiques ?


Retour à La Une de Logo Paperblog

A propos de l’auteur


Wanderer 2483 partages Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte l'auteur n'a pas encore renseigné son compte