700 millions de données de LinkedIn en vente : encore du data scrapping !

Régulièrement, des bases de données provenant de LinkedIn font surface sur des forums de hackers. Après 500 millions d’entrées en avril, une nouvelle base a été mise en vente fin juin, avec 700 millions d’entrées cette fois. Mais point de vol de données ici, il s’agit de données publiques « scrappées », soit automatiquement récupérées.

Ça en devient lassant. Il ne se passe plus un mois sans qu’une base données soi-disant dérobées à telle ou telle plateforme ne fasse surface sur un quelconque forum. Ici, ce sont quelque 700 millions d’entrées en provenance de LinkedIn qui ont été mises en vente sur RaidForums, le vendeur mettant en ligne un fichier d’un million d’entrées pour vérification. 

Le site spécialisé PrivacySharks a mené sa petite enquête et a confirmé l’authenticité des données contenues dans l’échantillon. Cette vente survient environ trois mois après qu’une première base de 500 millions de données ait été proposée à la vente. Noms complets, postes et numéros de téléphone y figurent.

Extraction automatisée

Contacté, LinkedIn a indiqué à nos confrères que, si ses investigations sont encore en cours, « l'analyse initiale indique que l'ensemble de données comprend des informations scrappées de LinkedIn ainsi que des informations obtenues à partir d'autres sources ». Aucune information privée n’a été dérobée à l’occasion d’une intrusion dans les systèmes de LinkedIn, il s’agit ici d’informations contenues sur des profils publics qui sont « scrappées », entendre par là récupérées de manière automatisée au moyen de scripts conçus dans ce but. Ce qui contrevient tout de même aux conditions d’utilisation du réseau social professionnel.

Notons que le scrapping n’est pas réservé aux méchants hackers : des géants du numérique s’y livrent allégrement, ce qui a d’ailleurs valu à IBM d’être épinglé pour avoir constitué une base d’un million de visages sans demander l’autorisation à qui que ce soit.

Dans le cas de LinkedIn, la base mise en vente en avril avait, comme celle de juin, été obtenue au moyen du scrapping de millions de profils LinkedIn. D’ailleurs, l’auteur du post sur RaidForum n’en est pas à son coup d’essai : il avait par le passé proposé une base de données de 530 millions d’entrées extraites de Facebook et obtenues, là encore, par scrapping.