Qu'est-ce que l'intelligence artificielle (jusqu'aux réseaux de neurones) ?
- Le fantasme de l'intelligence artificielle et la réalité d'aujourd'hui.
- Tâche intellectuelle versus algorithmes.
- Types d'actions : classification, régression, regroupement (clustering), estimation de densité, réduction de dimensionnalité.
- Intelligence collective : agréger une connaissance partagée par de nombreux agents virtuels.
- Algorithmes génétiques : faire évoluer une population d'agents virtuels par sélection.
- Machine learning : présentation et principaux algorithmes (XGBoost, Random Forest).
Réseaux de neurones et deep learning
- Qu'est-ce qu'un réseau de neurones ?
- Qu'est-ce que l'apprentissage d'un réseau de neurones ? Deep versus shallow network, overfit, underfit, convergence.
- Appréhender une fonction par un réseau de neurones : présentation et exemples.
- Génération de représentations internes au sein d'un réseau de neurones.
- Généralisation des résultats d'un réseau de neurones.
- Révolution du deep learning : généricité des outils et des problématiques.
Démonstration
Présentation d'un algorithme de classification et de ses limites.
Applications du deep learning
- Classification de données. Les différents scénarios : donnée brute, image, son, texte, etc.
- Les enjeux d'une classification de données et les choix impliqués par un modèle de classification.
- Outils de classification : des réseaux de type Multilayer Perceptron ou Convolutional Neural Network. Machine learning.
- Prédiction d'information et donnée séquentielle/temporelle. Enjeux et limites d'une prédiction d'information.
- Règles structurelles au sein de la donnée pouvant permettre une logique de prédiction. Outils usuels de prédiction.
- Transformation/génération de données. Opération de réinterprétation d'une donnée : débruitage, segmentation d'image…
- Opération de transformation sur un même format : traduction de texte d'une langue à une autre…
- Opération de génération de donnée "originale" : Neural style, génération d'images à partir de présentations textuelles.
- Reinforcement learning : contrôle d'un environnement.
- Experience Replay et apprentissage des jeux vidéo par un réseau de neurones.
Démonstration
Classification d'images médicales. Prévision des images suivant une séquence vidéo. Contrôle de simulations numériques.
Quels problèmes peut-on résoudre avec le machine/deep learning ?
- Condition sur les données : volumétrie, dimensionnement, équilibre entre les classes, description.
- Donnée brute versus features travaillées : que choisir ?
- Machine learning versus deep learning : les algorithmes plus anciens du machine learning ou les réseaux de neurones ?
- Qualifier le problème : Unsupervised Learning versus Supervised Learning.
- Qualifier la solution d'un problème : comprendre la distance entre une affirmation et le résultat d'un algorithme.
Etude de cas
Qualification d'une problématique pouvant être traitée avec l'IA.
Préparation d'un dataset
- Qu'est-ce qu'un jeu de données (dataset) ?
- Stocker/contrôler la donnée : surveiller les biais, nettoyer/convertir sans s'interdire des retours en arrière.
- Comprendre la donnée : représentation des outils statistiques permettant une vision d'une donnée, sa distribution…
- Formater une donnée : décider d'un format d'entrée et de sortie, faire le lien avec la qualification du problème.
- Préparer les données : définition des Train Set, Validation Set et Test Set.
- Mettre en place une structure permettant de garantir que les algorithmes utilisés sont réellement pertinents (ou non).
Echanges
Définition d'un dataset et sa différence avec une base de données (BDD) classique.
Recherche de la solution optimale
- Méthodologie pour avancer dans la recherche d'une meilleure solution à un problème ML/DL.
- Choix d'une direction de recherche, localisation de publications ou de projets similaires existants.
- Itérations successives depuis les algorithmes les plus simples jusqu'aux architectures les plus complexes.
- Conservation d'un banc de comparaison transversal.
- Arriver à une solution optimale.
Etude de cas
Grouper et balancer un ensemble de solutions pour obtenir une solution optimale.
Les outils
- Quels outils existe-t-il aujourd'hui ?
- Quels outils pour la recherche et quels outils pour l'industrie ?
- De Keras/Lasagne à Caffe en passant par Torch, Theano, TensorFlow, Apache Spark ou Hadoop.
- Industrialiser un réseau de neurones par un encadrement strict de son processus et un suivi continu.
- Mise en place de réapprentissages successifs pour conserver un réseau à jour et optimal.
- Former des utilisateurs à la compréhension du réseau.
Démonstration
Mise en place de réapprentissages successifs.