Défi botanique : entraîner une IA à reconnaître les plantes du collège !

Constat
L'intelligence artificielle est souvent perçue par les élèves de collège comme un simple outil qui fournit des réponses toutes faites, les dispensant ainsi de l'effort de réflexion. De même, les outils numériques tels que les applications de reconnaissance (que ce soit des sons, des images ou des textes) ou les calculatrices sont fréquemment considérés par les élèves comme des sources infaillibles de vérité.& Cependant, amener les élèves à concevoir eux-mêmes un programme de reconnaissance d'image leur permet non seulement de saisir le fonctionnement de ce type de technologie, mais aussi d’identifier les biais inhérents à ces systèmes. Ce processus incite les élèves à remettre en question les réponses fournies par ces outils, particulièrement lorsque celles-ci ne correspondent pas aux résultats attendus.
Niveau
Séance réalisée en 2024-2025 avec des 6e mais séance possible pour tout le cycle 4.
Compétences (BO)
- Communiquer et argumenter dans un langage scientifique : Les élèves argumentent leurs choix et leurs découvertes en utilisant un vocabulaire scientifique approprié.
- S’exprimer à l’oral et à l’écrit : Les élèves doivent décrire le fonctionnement de l’intelligence artificielle utilisée, décrire les étapes de l’entrainement de l’IA.
- Travailler en groupe et coopérer : L’entrainement de la machine nécessite une collaboration entre les élèves, qui doivent écouter les points de vue des autres et travailler ensemble pour construire la machine la plus fiable possible.
- Développer l’esprit critique : Les élèves analysent les résultats donnés par la machine, identifient les biais, corrigent l’entrainement de la machine en fonction des erreurs trouvées.
Compétences du CRCN (cadre de référence des compétences numériques)
- Traiter des données (Compétence 1.3) : Appliquer des traitements à des données pour les analyser et les interpréter (avec un tableur, un programme, un logiciel de traitement d'enquête, une requête de calcul dans une base de données…).
- Mener une recherche et une veille d’information (Compétence 1.1) : Les élèves doivent rechercher des informations pertinentes sur l’IA pour étayer leurs arguments et se tenir au courant des dernières avancées dans ce domaine.
- Connaissances et capacités associées :
Classification du vivant : Réaliser une classification en groupes emboîtés pour mettre en évidence des liens de parenté à partir d'un petit nombre d’espèces possédant des attributs identifiés.
Objectifs de l’activité et sa place dans la démarche
Objectifs pédagogiques :
- Explorer et observer la biodiversité locale : Permettre aux élèves d'acquérir des compétences d'observation en milieu naturel en identifiant et en répertoriant des plantes de l'écosystème local.
- Apprendre la classification biologique des plantes : Comprendre le concept de classification scientifique, en particulier la classification emboîtée en leur montrant comment classer les plantes selon des critères morphologiques et biologiques précis.
Objectifs techniques et scientifiques :
Comprendre les bases du machine learning appliqué à l'image avec « VITTASCIENCE » :
- Initier les élèves aux concepts de base du machine learning (apprentissage supervisé) en leur faisant expérimenter l'entraînement d'une machine pour reconnaître des plantes.
- Découvrir le processus d'entraînement d'un modèle de reconnaissance d'images, en sélectionnant des caractéristiques spécifiques et en affinant le modèle au fur et à mesure des observations.
- Prendre conscience des biais et des limites des systèmes numériques : Inciter les élèves à réfléchir aux erreurs possibles du système de reconnaissance d'images et à comprendre les limitations liées à l’entraînement du modèle (par exemple, la diversité des images ou les conditions environnementales).
Description de l’activité (sur 2h):
Séance 1 :
•Compétence :
Créer un système de reconnaissance des végétaux à l’aide d’une IA.
•Conditions :
La séance se déroule dans la cour. Les élèves sont en demi-groupe de 15 élèves maximum.
J’ai demandé l’assistance d’un deuxième adulte : AED, AESH, parents d’élèves.
•Déroulé :
Prérequis : Les élèves ont déjà fait une première séance sur la diversité des êtres vivants et l’utilisation d’attributs pour classer. Les élèves ont déjà fait une séance de classe dehors pour classer les animaux en utilisant des pancartes.
Après avoir distribué la fiche de consignes (voir annexe), on discute ensemble du fonctionnement d’un système de reconnaissance d’images et des critères à respecter pour les photos prises. Je choisis de ne pas les aider sur les critères et ne pas trop développer pour les laisser faire leurs propres erreurs et corrections. (10min)
•Exemple d’échanges avec les élèves :
Professeure : A quoi faut-il faire attention en prenant les photos pour la machine ?
Elève 1 : Prendre une photo nette et pas floue. Elève 2 : Prendre plusieurs photos. Elève 3 : Prendre plusieurs photos sous différents angles, luminosité… Elève 4 : Faut faire attention au fond aussi.
Les élèves se mettent en groupes de 3 et ont une tablette établissement par groupe.
Ils partent chercher les végétaux dans la cour et font l’entrainement de la machine. (30min)
Mise en commun avant la fin du cours pour tester ensemble et discuter des biais. (10min)
Séance 2 :
•Compétence :
Reconnaître et classer les végétaux à l’aide de votre système de reconnaissance d’images.
•Conditions :
La séance se déroule dans la salle de classe ou dehors. Les élèves sont en classe entière.
Je n’ai pas demandé l’assistance d’un deuxième adulte : AED, AESH, parents d’élèves.
•Déroulé :
Rappel sur la séance d’avant et consignes pour cette séance. (10min)
•Consignes : Les élèves sont par groupe de 3-4 avec une tablette. Ils ont 6 végétaux sans nom notés végétal 1, végétal 2… Ils doivent utiliser leur système de reconnaissance d’images pour reconnaître les végétaux. Ensuite, ils utilisent la classification emboitée donnée pour retrouver les attributs des végétaux trouvés. Et pour finir, ils ont des questions sur la fiabilité du système de reconnaissance.
Les élèves sont en activité pendant 30 min et on fait le bilan ensemble pendant 10 min.
Résultats d’élèves :
Séance 1 :
Exemple 1 :
A gauche les données d’entrainement de l’élève. A droite l’image proposée à la reconnaissance et le résultat donné : 57% du Lierre et 21% du Laurier Rose …
J’ai demandé à l’élève : « Pourquoi la machine reconnait que c’est du lierre seulement à 57% ? »
Réponse de l’élève : « Mes photos de lierre ne doivent pas être bien. » Il est ensuite de lui-même aller voir ses photos de lierre pour faire une meilleure banque de données. Voici ce qu’il a trouvé dans sa première banque de données de lierre :
Les photos de Lierre prises par l’élève : l’élève a conclu qu’il n’y avait que 5 photos, des photos floues ou mal cadrées.
Exemple 2 :
A gauche les données d’entrainement de l’élève. A droite l’image proposée à la reconnaissance et le résultat donné : 72% du Laurier Rose …
J’ai demandé à l’élève : « Pourquoi la machine reconnait que c’est du laurier rose et pas du romarin ? »
Réponse de l’élève : « Je me suis peut être trompée dans l’entrainement » Elle est ensuite aller voir les photos de sa banque de données. Voici ce qu’il a trouvé dans sa première banque de données :
Les photos du Laurier rose prises par l’élève : l’élève a conclu qu’il n’y avait pas assez de photos de laurier rose à des échelles différentes et avec des fonds différents. Elle a aussi vu qu’elle avait mis des photos de végétaux qui n’étaient pas du laurier rose (tronc du pin et de la mousse).
Les photos du romarin prises par l’élève : L’élève a conclu qu’il n’y avait pas assez de photos et que la branche de romarin était trop « moche » (dégarnie, abimée).
Résultats d’élèves :
Séance 2 :
Les élèves écrivent sur les tables le pourcentage de reconnaissance pour chaque végétal. Le résultat n’est pas du tout celui qu’ils auraient aimé obtenir. La mousse est bien reconnue mais le reste non.
Les élèves répondent aux 4 questions suivantes :
Question 1 : Qu’est-ce qui pourrait expliquer que parfois l’application ne reconnait pas le bon végétal ?
Question 2 : Sur quels critères se base l’application pour reconnaitre le végétal ?
Question 3 : Comment améliorer/corriger la reconnaissance des végétaux ?
Question 4 : Pourquoi le pourcentage de reconnaissance des végétaux sur l’application est important ?
Analyse de la séance 1 (classe dehors + entrainement de la machine) :
Difficultés rencontrées :
- Avoir une borne wifi assez puissante pour les tablettes dans la cour du collège. Alternative : Prendre des branches des végétaux et faire la reconnaissance à partir des branches en classe.
- Pas plus de 4 connexions sur le même compte de vittascience / Alternative : Créer plusieurs comptes vittascience
Après 2 tentatives de connexions échouées, vittascience bloque l’authentification pendant 1min. Il faut donc prévenir en avance les élèves. - Vittascience demande l’accès caméra et parfois le moteur de recherche bloque l’accès à la caméra. Il faut que les adultes sachent débloquer l’accès.
- La prise de photo en direct dans la machine learning est un peu en décalée et donc difficile / Alternatives : Prendre les photos avec l’appareil photo de la tablette en dehors de l’application vittascience puis téléverser ensuite la photo dans vittascience.
Points positifs :
- Les élèves ont apprécié être dehors
- Les élèves ont apprécié être dehors ET avec une tablette
- Les élèves ont apprécié être dehors ET avec une tablette ET en autonomie, en ayant la confiance des adultes encadrants.
- Beaucoup d’échanges entre élèves et adultes sur « pourquoi ça ne marche pas » permettant de faire travailler l’esprit critique et la remise en question des outils informatiques.
- Les élèves ont pu reconnaître des plantes de leur environnement proche : le déplacement dans la cour + la prise de photo + l’objectif de reconnaître la plante a permis d’ancrer davantage l’apprentissage naturaliste sur la reconnaissance des plantes en elle-même.
- Beaucoup de dialogue au sein du groupe d’élèves « prends la photo comme ça », « une plante chacun » …
Analyse de la séance 2 (test de la machine en classe et classification) :
Difficultés rencontrées :
- Les élèves testaient tous la même machine. Mais avoir 4 groupes sur la même machine ralentissait énormément la machine / Alternative : Si trop de connexion en même temps sur la même machine ça ne marche plus : Prévoir plusieurs machines à tester. Pour que chaque groupe ait une machine différente.
- Les élèves devaient prendre en photo en direct les plantes à tester mais comme la caméra fonctionne en continu sur vittascience cela ralentit énormément la machine. De plus, souvent c’est la caméra avant qui s’allume d’office et les élèves ont des difficultés à changer pour la caméra de derrière / Alternatives : Prendre les photos avec l’appareil photo de la tablette en dehors de l’application vittascience puis téléverser ensuite la photo dans vittascience.
- Les élèves obtiennent un résultat sous forme de pourcentage mais les sixièmes n’ont pas vu ce que représente un pourcentage. Ils comprennent que plus la valeur du pourcentage est élevée, plus la plante est reconnue.
- Vittascience donne toujours une réponse. Même si le résultat affiche seulement 10% il ne va pas dire qu’il ne reconnait pas la plante / Alternatives : Insérer la machine dans le programme Adacraft de vittascience et programmer un seuil de reconnaissance. Si le seuil donné est 70% alors le programme adacraft ne donnera pas de résultat si le pourcentage de reconnaissance est inférieur à 70% (voir annexe).
Points positifs :
- Les élèves ont apprécié tester la machine.
- L’esprit critique des élèves était constamment en fonctionnement car la machine que j’ai fait tester indiquait toujours « thym » et les élèves étaient en colère contre la machine. L’association de leur esprit critique + une émotion forte a davantage marqué leur esprit et cela leur a donné envie de comprendre pourquoi elle faisait faux.
- On a pu tester une machine mieux entrainée et les résultats étaient meilleurs.
- Retour sur le réel : il faut prendre les bonnes parties de la plante pour que l’IA reconnaisse la plante. Exemple : une branche de laurier de 5 jours (un peu fanée et qui a perdu de la couleur) obtient des scores de reconnaissance beaucoup plus faible avec IA alors qu’un élève reconnait facilement du laurier même fané.
Bilan sur l’utilisation de l’IA pour la reconnaissance des plantes :
-Pour reconnaître, il faut d’abord connaître :
Sans une connaissance précise des plantes, il est impossible d’évaluer si l’IA reconnaît correctement ce qu’elle voit. Dans l’exemple de la séance, si un élève ne sait pas distinguer un romarin d’un laurier rose, il ne pourra pas juger si l’IA s’est trompée ou non. De plus, il lui sera difficile de corriger les erreurs d’entraînement, car il ne saura pas identifier les mauvaises photos (plantes mélangées, floues, mal cadrées). Ainsi, le savoir scientifique sur les végétaux (formes des feuilles etc…) est indispensable pour pouvoir vérifier la fiabilité de l’intelligence artificielle, et pour améliorer son apprentissage. Connaître les plantes, c’est donc la condition pour pouvoir reconnaître un bon ou un mauvais résultat.
-On n’entraîne bien que ce qu’on comprend bien :
Une IA ne devient performante que si les humains qui la nourrissent ont eux-mêmes une connaissance rigoureuse des données qu’ils lui fournissent. Lorsque les élèves créent leur propre système de reconnaissance des plantes, ils découvrent que la qualité de l’IA dépend directement de la qualité des photos et de la justesse de leur classification. Une photo mal prise, une plante mal identifiée ou confondue avec une autre, et l’IA sera biaisée. Cela montre qu’entraîner une IA, ce n’est pas simplement lui donner des images, c’est faire des choix éclairés, fondés sur des connaissances botaniques précises. Sans cela, même la technologie la plus avancée reste inefficace.
Lien vers les travaux d’élèves :
Groupe 1 : Avec données d'entrainement et des erreurs
Groupe 2 : Avec données d'entrainement et petite base de données
Groupe 3 : Avec données d'entrainement et grande base de données. Photos ok
Prolongement
Possibilité pluridisciplinaire : La machine learning peut être associée directement sur vittascience avec un programme scratch appelé « adacraft » ou un programme python. Le programme comprend un petit avatar qui donne le nom de la plante quand il la voit.
Séance réalisée par Margaux BERTHIER
- Tutoriel elèves vittascience
235.78 Ko