X

Privacy : Tensorflow anonymise seul les données

Tout fidèle qu’il est à ses grands principes quant à une IA « responsable », Google a versé en open source la libraire Python TensorFlow Privacy, permettant d’entraîner des modèles de machine learning en supprimant les données identifiantes contenues dans les ensembles.

L’an dernier, sous pression de ses salariés, Google publiait son Responsible AI Practices, une charte relative aux bonnes pratiques dans l’élaboration d’une intelligence artificielle. Y compris une partie concernant la protection des données dont un modèle de machine learning est nourri. Or en interne le géant utilise un outil, Tensorflow Privacy, afin de maintenir l’anonymat des données utilisées. Celui-ci est désormais passé en open source.

Tensorflow Privacy, c’est une bibliothèque Python « comprenant les implémentations des optimiseurs TensorFlow pour la formation de modèles d’apprentissage automatique avec confidentialité différentielle ». Qu’est-ce donc que la confidentialité différentielle ? Cette théorie consiste en des mécanismes mathématiques permettant de maximiser la pertinence d’une requête à une base de données tout en réduisant le risque d’identification desdites données*.

Très schématiquement, plutôt que de considérer la confidentialité d’une information de manière binaire (la donnée est-elle identifiante ou non), la « confidentialité différentielle » estime que la question procède d’un « risque accumulatif ». Plus une donnée personnelle est traitée, plus elle risque d’être identifiante, par exemple par recoupement avec d’autres bases de données.

Fédération et différentiel

« Lors de l’entraînement d’un modèle sur les données des utilisateurs, ces techniques offrent de fortes garanties mathématiques que les modèles n’apprennent ni ne se souviennent des détails d’un utilisateur spécifique » explique ainsi Google sur Medium. Et cela ne requiert que quelques lignes de code supplémentaires : « aucune expertise en confidentialité ou en mathématiques sous-jacentes n’est requise: ceux qui utilisent des mécanismes TensorFlow standard n’ont pas avoir à modifier leurs architectures modèles, leurs procédures d’apprentissage ou leurs processus ».

A cela s’ajoute le lancement au même moment de TensorFlow Federated. Cette déclinaison du framework doit permettre d’entraîner des modèles sans toutefois centraliser les données requises au machine learning, qui restent conservées localement. Google utilise la technologie d’apprentissage fédéré notamment pour les prédictions formées par son clavier virtuel G-Board. « Avec TensorFlow Federated, nous pouvons élaborer une architecture de modèle ML de notre choix, puis la former à travers les données fournies par toutes les sources, tout en maintenant les données de chaque source séparées et locales » souligne le géant.


*Le Privacy Tools Project de l’université d’Harvard fournit quelques explications relativement compréhensibles sur le sujet


Inscription gratuite à la newsletter de L'Informaticien.


Noter cet article (de 1 = Nul à 5 = Excellent) Valider
Autres infos Développement, IA

Offres d'emploi informatique avec  Emploi en France
jooble

Datacenters sur le grill

Datacenters sur le grill

Véritable usine de production de l’économie numérique, le datacenter focalise les critiques des associations environnementales. Ces installations dont les plus grosses peuvent consommer jusqu’à une centaine...

Apps de messagerie

Apps de messagerie

Le succès d’une application de messagerie instantanée débute souvent dans une cour d’école et finit entre les mains… de PDG. De plus en plus de collaborateurs échangent des invitations, des...

Le lourd poids de la dette technique

Le lourd poids de la dette technique

Prévisible et bien souvent inévitable, la dette technique continue cependant de donner des sueurs froides aux développeurs. Le problème ne vient pourtant pas toujours du code, mais plutôt de la prise de...

RSS
Afficher tous les dossiers

IT DU MONDE D'APRÈS, IT DE DEMAIN (1) : automatisation, gestion de l'info, mobilité, sécurité - Health Data Hub - Le VPN meilleure solution pour le télétravail ? - Project Reunion Microsoft : retour des apps universelles - Power Over Ethernet, une avancée discrète - Pourquoi Apple choisit ARM plutôt qu'Intel ? - La Silicon Valley dans tous ses états - Produits high tech de loisirs du moment...

 

GESTIONNAIRE DE MOTS DE PASSE : un outil indispensable ? - Pandémie & Tech : gagnants et perdants - Multicloud : réalité d'aujourd'hui, impacts sur l'infrastructure et l'applicatif - Project Reunion Microsoft - No Code/Low Code en plein essor - Cobol V6 - Cyberattaques Covid-19 - L'emploi au temps du Corona...

 

COMMUNICATIONS UNIFIÉES : une convergence accrue entre communication et collaboration - Réussir StopCovid ! - Énergie : les datacenters sur le grill - Le lourd poids de la dette technique - GitLab comme solution DevSecOps - Les femmes, avenir de la filière IT ? - Apps de messagerie, attention danger ? - Pôle IA Toulouse...

 

Afficher tous les derniers numéros

Actuellement, il existe un gouffre entre les environnements informatiques traditionnels des entreprises et le cloud public. Tout diffère : les modèles de gestion, de consommation, les architectures applicatives, le stockage, les services de données.


Les avantages de l’architecture hyperconvergée étant de plus en plus reconnus, de nombreuses entreprises souhaitent l’utiliser pour des types d’applications variés. Cependant, son manque de souplesse pour une mise à niveau des ressources de calcul indépendantes de celles de stockage ne lui permet pas d’être utilisée plus largement.

Au cours de l’événement HPE Discover qui s’est tenu en juin 2019, HPE a répondu à cette préoccupation en présentant la plateforme HPE Nimble Storage dHCI.

Ce Livre Blanc IDC se penche sur les exigences du marché ayant stimulé le besoin de solutions HCI plus flexibles, puis il examine brièvement la solution HPE Nimble Storage dHCI en expliquant pourquoi elle répond à ce besoin.


Malgré des investissements massifs dans le développement à hauteur de près de 4 milliards de dollars l'année dernière, près de la moitié du temps consacré au DevOps est perdu dans la répétition des tâches et dans la logistique. Ceci fait que 90% des entreprises qui ont adopté ces pratiques sont déçues par les résultats, selon une étude publiée par le Gartner.


Découvrez dans ce livre blanc, les avantages des toutes nouvelles solutions NETGEAR, pour simplifier et rentabiliser vos déploiements, et gérer votre réseau à distance, où que vous soyez, au bureau ou en télé-travail.


OneTrust est une plateforme logicielle innovante de gestion de la confidentialité, de la sécurité des données personnelles et des risques fournisseurs. Plus de 4 000 entreprises ont choisi de faire confiance à cette solution pour se conformer au RGPD, au CCPA, aux normes ISO 27001 et à différentes législations internationales de confidentialité et de sécurité des données personnelles.

OneTrust vous propose de télécharger le texte officiel du Règlement Général sur la Protection des Données (RGPD). Vous aurez également la possibilité de recevoir la version imprimée de ce texte, sous forme de guide pratique au format A5, spiralé, en complétant le formulaire.


Tous les Livres Blancs
Derniers commentaires
L'organisme gouvernemental britannique chargé de la cyber-sécurité a accusé un groupe de hackers de s'en prendre à des organisations travaillant à la mise au point d'un vaccin contre le nouveau coronavirus afin de voler leurs recherchesL'organisme gouvernemental britannique chargé de la cyber-sécurité a accusé jeudi un groupe de hackers de s'en prendre à des organisations travaillant à la mise au point d'un vaccin contre le nouveau coronavirus afin de voler leurs recherches, affirmant qu'il est "presque certain" qu'ils opèrent pour les renseignements russes. [Lire la dépêche...]

Le juriste autrichien Max Schrems, le 24 mai 2018 à VienneLa justice européenne a invalidé jeudi un mécanisme crucial de transfert des données personnelles de l'UE vers les Etats-Unis, en raison de craintes sur les programmes de surveillance américains, dans un arrêt retentissant salué comme une victoire par les défenseurs des libertés individuelles. [Lire la dépêche...]

Des comptes Twitter de personnalités américaines ont été victimes d'un piratage massif aux cryptomonnaies Les comptes Twitter de personnalités américaines, dont Bill Gates, Elon Musk ou encore Joe Biden et Barack Obama, et de grandes entreprises comme Apple et Uber ont été victimes mercredi après-midi d'un piratage massif aux cryptomonnaies. [Lire la dépêche...]

Bil Gates, Joe Biden, Barack Obama, Elon Musk: ces personnalités et de nombreuses autres ont été visées mercredi par un piratage massif aux cryptomonnaies sur TwitterTwitter a ouvert une enquête sur le piratage massif qui a visé mercredi des comptes de personnalités sur son réseau, dont ceux de Joe Biden, Bill Gates, Elon Musk, Barack Obama, remettant sur le devant de la scène la question de la cybersécurité. [Lire la dépêche...]

Bruno Le Maire quitte l'Élysée, le 15 juillet 2020 à Paris"La France continuera à se battre" pour une taxation accrue des géants du numérique, a affirmé mercredi le ministre français des Finances Bruno Le Maire, après l'annulation par les juges européens d'une décision de Bruxelles sommant Apple de rembourser à l'Irlande des avantages fiscaux jugés indus. [Lire la dépêche...]

La Chine estime que Londres a été La Chine s'en est prise mercredi à la décision de la Grande-Bretagne de mettre à l'index les équipements de Huawei, estimant que Londres avait été "berné" par les Etats-Unis. [Lire la dépêche...]

Photo fournie par Amazon de son nouveau chariot d'épicerie intelligent Dash Cart qui permet, grâce à des capteurs, d'éviter les files d'attente aux caisses Amazon a annoncé mardi avoir lancé un chariot d'épicerie, qui permet aux clients d'éviter les queues à la caisse. [Lire la dépêche...]

Les juges européens ont donné raison à Apple contre Bruxelles annulant la décision qui avait sommé le géant américain de rembourser 13 milliards d'euros Les juges européens ont donné raison à Apple contre Bruxelles, annulant mercredi la décision de la Commission européenne qui avait sommé le géant américain de rembourser l'Irlande de 13 milliards d'euros d'avantages fiscaux qu'elle jugeait indus. [Lire la dépêche...]

Toutes les dépêches AFP
AgendaIT

BIG DATA

Conférences et exposition sur le Big Data les 14 et 15 septembre 2020 à Paris, Porte de Versailles. Organisé par Corp Agency.

AI PARIS

Conférence, exposition et rendez-vous d'affaires sur l'intelligence artificielle à Paris, Porte de Versailles les 14 et 15 septembre 2020. Organisé par Corp Agency.

DOCUMATION

Congrès et exposition Documation du 22 au 24 septembre 2020  à Paris Porte de Versailles (Pavillon 4.3). Organisé par Infopromotions.

AP CONNECT

La 3ème édition d'AP Connect qui vise à réunir les innovations, technologies et solutions dédiées à la transition numérique des administrations publiques centrales et des collectivités territoriales a lieu les 22 et 23 septembre 2020 à Espace Grande Arche, Paris La Défense. Organisé par PG Organisation.

RSS
Voir tout l'AgendaIT