Plus de cinq ans après la débâcle de Taye de Microsoft, l’incident reste un rappel brutal de la rapidité avec laquelle l’intelligence artificielle peut être corrompue après une exposition à la toxicité du Web. C’était aussi une mise en garde sur la difficulté de concevoir des chatbots suffisamment puissants. L’équipe de recherche sur l’IA de Meta a publié une démo publique de son chatbot le plus avancé à ce jour, BlenderBot 3. Le principal obstacle à cette technologie est l’apprentissage du robot lui-même. Les chatbots sont entraînés dans des environnements très riches, mais cela limite les sujets dont ils peuvent discuter. Et si vous lui donnez la possibilité de rechercher des informations sur Internet, vous l’exposez à des dérives. « Les chercheurs ne peuvent pas prédire ou simuler tous les scénarios de conversation dans les paramètres. L’intelligence artificielle est aujourd’hui loin d’offrir des systèmes vraiment intelligents capables de nous comprendre, de s’engager et de converser avec nous comme les autres humains. Pour concevoir des modèles plus adaptables à nos environnements du monde réel, les chatbots doivent apprendre à partir d’une grande variété de perspectives, avec des humains du “monde réel”. Voici ce que nous pouvons lire dans le billet de blog de Meta annonçant la disponibilité de BlenderBot 3.
Une intelligence artificielle capable d’évaluer la pertinence des informations trouvées et les réponses qu’elle reçoit des utilisateurs
Meta travaille sur le sujet depuis BlenderBot 1, sorti en 2020. L’année suivante, BlenderBot 2 a acquis une certaine mémoire contextuelle et a su rechercher sur le Web des informations supplémentaires sur un sujet spécifique. BlenderBot 3 va encore plus loin en étant capable non seulement d’évaluer la pertinence des données récupérées, mais aussi les personnes auxquelles il s’adresse. Lorsqu’un utilisateur reçoit une réponse insatisfaisante du système, l’utilisateur utilise les commentaires de l’utilisateur pour apprendre et empêcher que l’erreur ne se reproduise. Le système utilise également l’algorithme Director, qui génère d’abord une réponse à l’aide des données apprises, puis traite la réponse avec un classificateur pour vérifier qu’il s’agit d’une réponse suffisamment satisfaisante.
Pour des conversations de plus en plus naturelles
“La démonstration publique et interactive permet à BlenderBot 3 d’apprendre de ses interactions organiques avec toutes sortes de personnes”, écrit l’équipe. “Nous encourageons les adultes à travers les États-Unis à essayer cette démo, à avoir des conversations naturelles sur des sujets qui les intéressent et à partager leurs réponses pour aider la recherche.” BB3 devrait également parler plus naturellement que son prédécesseur, grâce notamment au modèle de langue OPT-175B, 60 fois plus grand que celui de BB2. “BlenderBot 3 offre une amélioration globale de 31 % des tâches de chat jugées par l’homme. […] Il est également deux fois plus fiable, tout en se trompant 47 % moins souvent. Par rapport à GPT3, sur les sujets brûlants, il est plus à jour 82 % du temps et plus précis 76 % du temps. »