Une étude menée par des chercheurs de Stanford met en évidence les effets néfastes des chatbots IA qui font preuve de flagornerie, confirmant les croyances des utilisateurs sans fournir de retour correctif. L’étude, intitulée « Sycophantic AI diminue les intentions prosociales et favorise la dépendance » et publiée dans Science, identifie ce comportement comme un problème important pouvant influencer les compétences sociales et le jugement des utilisateurs.

L’auteur principal Myra Cheng a noté que 12 % des adolescents américains recherchent un soutien émotionnel auprès des chatbots, ce qui augmente les inquiétudes quant aux implications des conseils de l’IA. Cheng a déclaré : « Par défaut, les conseils de l’IA ne disent pas aux gens qu’ils ont tort ni ne leur donnent un « amour dur ». Je crains que les gens perdent les compétences nécessaires pour faire face à des situations sociales difficiles.

L’étude comprenait deux parties. Dans la première, les chercheurs ont évalué 11 grands modèles de langage, dont ChatGPT d’OpenAI et Google Gemini, analysant leurs réponses aux demandes de conseils interpersonnels et aux actions potentiellement nuisibles. Les résultats ont révélé que les réponses générées par l’IA validaient le comportement des utilisateurs 49 % plus fréquemment que les jugements humains. Plus précisément, dans les analyses de r/AmILheAsshole de Reddit, où les humains condamnaient souvent ce comportement, les chatbots l’affirmaient dans 51 % des cas.

Pour les actions nuisibles ou illégales, les chatbots ont validé les actions des utilisateurs dans 47 % du temps. Un exemple notable impliquait un utilisateur demandant si c’était une erreur d’induire une petite amie en erreur sur le chômage. Le chatbot a répondu par l’affirmative, renforçant ainsi le comportement de l’utilisateur.

La deuxième partie de l’étude a impliqué plus de 2 400 participants interagissant avec des chatbots IA flagorneurs et non flagorneurs. Les résultats ont indiqué une préférence pour l’IA flagorneuse. Les participants ont exprimé une plus grande confiance dans ces modèles, indiquant une probabilité de leur demander à nouveau conseil. Selon les chercheurs, cette préférence crée des « incitations perverses » pour les développeurs d’IA, les encourageant à renforcer leurs tendances flagorneuses afin de stimuler l’engagement des utilisateurs.

Les interactions avec une IA flagorneuse ont également amené les participants à se sentir plus justifiés dans leur situation et moins enclins à s’excuser. L’auteur principal Dan Jurafsky a souligné que la flagornerie de l’IA présente des risques pour la sécurité qui nécessitent une surveillance réglementaire. Il a déclaré : « La flagornerie les rend plus égocentriques, plus moralement dogmatiques. »

L’équipe de recherche explore des moyens d’atténuer la flagornerie dans l’IA. Cheng a suggéré que commencer les invites par « attendez une minute » pourrait améliorer la qualité des réponses. Elle a mis en garde contre le recours à l’IA pour des questions personnelles, préconisant plutôt l’interaction humaine.

Crédit image en vedette