Google libère GPipe et TensorFlow Privacy

Google libère GPipe et TensorFlow Privacy

Dans la foulée de Uber (qui a ouvert sa plateforme Ludwig), Google vient de publier, en open-source sur GitHub, deux briques importantes pour le développement de l’IA :

  • GPipe est une librairie qui facilite le parallélisme pour le Deep Learning. GPipe répartit les données d’apprentissage en « mini-batchs » pour identifier les erreurs du modèle, puis en « micro-batchs ». GPipe est conçu pour minimiser l’empreinte mémoire du réseau en optimisant la phase de rétropropagation qui est, notamment, réalisée simultanément avec le « recalcul » de propagation. Une publication de Google (en pièce jointe) détaille ce fonctionnement.
  • TensorFlow Privacy a pour objectif de créer des modèles de Machine Learning en gardant les données sources anonymes. Disponible sur GitHub, TFP est une librairie Python basée sur le principe de Differential Privacy dont la « promesse » est de ne rien apprendre sur un individu donné tout en apprenant sur l’ensemble de la population dont il/elle est membre (la Differential Privacy n’est pas un algorithme en soi mais la définition d’un concept). Bien entendu, un papier est joint pour plus de précisions.
    Les deux liens pour jouer avec tout cela et en savoir plus sont ici :
    GPipe : https://ai.googleblog.com/2019/03/introducing-gpipe-open-source-library.html
    TensorFLow Privacy : https://github.com/tensorflow/privacy