ChatGPT, Copilot, Grok, Mistral, NotebookLM : les outils d’intelligence artificielle se généralisent dans les écoles, les universités et les entreprises. Or, jusqu’ici rien ne permettait aux usagers de connaitre la fiabilité de ces chatbots éducatifs. L’AI score, le nouvel outil développé par des chercheurs de l’UNamur, comble ce manque en mesurant la fiabilité pédagogique des chatbots éducatifs. « L’AI Score, c’est au chatbot ce que le compteur de vitesse fut à l’automobile », compare le Professeur Michaël Lobet, un des auteurs de la recherche. « L’arrivée de l’automobile au début du XXᵉ siècle a bouleversé les usages… mais c’est l’invention du compteur de vitesse qui a permis d’en faire un outil maîtrisé et fiable. Aujourd’hui, les chatbots pédagogiques ou autres chatbots présents dans des entreprises en général, sont à un stade similaire : puissants, enthousiasmants, mais sans instruments fiables de contrôle. L’AI Score propose d’être ce compteur », explique -t-il.
De la même manière que le NutriScore, l’ÉcoScore ou le certificat PEB aident les citoyens à faire des choix éclairés, l’AI Score offre une lecture simple et immédiate du niveau de confiance que l’on peut accorder à un chatbot. « À l’heure où la confiance dans les IA génératives devient un enjeu sociétal, l’AI Score guide les enseignants et les sociétés dans leurs choix d’outil à mettre dans les mains de leurs étudiants ou clients », souligne le Dr. Miguël Dhyne, collaborateur scientifique à l’UNamur, pédagogue et chercheur en physique « Il peut aussi aider les institutions à évaluer les solutions IA avant déploiement ou encore de vérifier leur fiabilité au cours du temps», ajoute-t-il.