Section outline

    • Le travail de recherche en cristallographie peut être long et pénible. Pour évaluer les conditions de précipitation d'une solution, il est nécessaire de regarder chaque expérimentation à l'œil. De cette analyse, l’on peut réaliser des statistiques et des conclusions sur les conditions de cristallisation.

      Il existe sur le marché de l’intelligence artificielle des solutions qui peuvent assister le praticien et le chercheur dans cette tâche. Nous allons voir dans ce TP les étapes nécessaires à la réalisation d’un tel outil et des précautions à prendre.



    • Le vocabulaire

      Pour commencer, nous nous familiarisons avec le vocabulaire de l’intelligence artificielle. A l’aide de la vidéo suivante, donnez une définition simple avec vos mots et vos exemples des termes suivants : 

       

      • apprentissage automatique, ou machine learning

      • l’apprentissage profond, ou deep learning

      • un neurone et un réseau de neurones.

      • Phase d’apprentissage et de prédiction

      Dans la vidéo précédente, les modèles sur les images sont abordés, mais seulement très simplement. Utilisez les ressources suivantes pour pousser plus loin la compréhension des modèles de machine learning dit convolutifs. A l’aide de ces ressources, donnez une définition simple et son usage avec vos mots et vos exemples des termes suivants : 


      (regardez jusqu’à 4:05)


      Lien CNN explorer : https://poloclub.github.io/cnn-explainer/ 

      • Filtre, ou kernel

      • Couche de “mise en commun”, ou pooling

      • Extraction de caractéristique lors de la phase d’apprentissage


      Focus sur la phase d’apprentissage et l’évaluation

      La phase d’apprentissage d’un réseau de neurones est primordiale. C’est elle qui, associée à l’architecture du réseau de neurones, fera émerger les qualités de ce dernier. A l’aide de la vidéo suivante, répondez aux questions suivantes :

      (jusqu’à 6:10)


      Ressources : https://fr.wikipedia.org/wiki/Surapprentissage 

      • Quels sont les jeux de données d’apprentissage, de validation et de test ? A quoi servent-ils ?

      • Comment détecter à l’aide des données de validation ou de test le sur-apprentissage ?


    • Teachable machine est un site internet qui permet de créer des réseaux neuronaux simples de façon ludique. Nous allons l’utiliser pour créer un réseau de neurones capable de classifier vos échantillons de façon automatique.

      Suivez les étapes suivantes : 

      1. Rendez vous sur le site suivant : https://teachablemachine.withgoogle.com/ 

      2. Cliquez sur le bouton commencer :

      3. Sélectionnez “Projet Images”

      4. Sélectionnez Modèle d’image standard puis réalisez le protocole suivant : 

        1. Définissez autant de classes / catégories que vous avez besoin. Une fois entraîné, le modèle va prédire à quelle catégorie l’image que vous lui donnez appartient. Choisissez donc vos catégories en fonction des résultats que vous souhaitez mais aussi de vos données, ici des images que vous allez acquérir.

        2. Une fois vos classes / catégories créées, réalisez votre banque d’image pour chaque catégorie.

        3. Une fois vos banques d’image réalisées, pour chaque catégorie créée un dossier pour les données d'entraînement et un dossier de test. Associez environ 8 images à l'entraînement pour 2 images dans le test (ratio 80%/20%).

        4. Exécutez l'entraînement du modèle. Cliquez sur “Entrainer le modèle”.

      5. Une fois le premier entrainement terminé : 

        1. cliquez sur “Avancé” pour ouvrir le menu de l'entraînement.

        2. Utilisez le bouton pour obtenir les définitions.

        3. Puis cliquez sur “Options avancées” pour obtenir les mesures de performance de l'entraînement.

      1. Réalisez quelques entraînements en modifiant les paramètres, et observez les résultats à l’aide des “options avancées”.

        1. Quelles sont vos hypothèses ou conclusions sur l’impact des paramètres sur vos résultats ?

        2. Est-ce que votre modèle est en sur-apprentissage ? Si oui, que proposez-vous pour l’éviter ?

      2. Modifiez les paramètres et / ou les catégories jusqu’à ce que vous soyez satisfait, puis prenez les résultats de la matrice de confusion.

      3. Évaluez les résultats du modèle avec les images de tests. Comparez les résultats avec la matrice de confusion. Quelles sont vos conclusions ?

      4. Selon vous quelles sont les raisons des performances du modèle, succès ou échec, et quels sont les moyens d’améliorer ce dernier ? Comment l'utilisez-vous ?