OpenAI affirme que les erreurs de santé ChatGPT gratuites ont diminué de 71 %

OpenAI a lancé GPT-5.5 Instant comme modèle par défaut pour les utilisateurs gratuits de ChatGPT, affirmant qu’il correspond désormais aux performances de ses modèles Frontier Thinking sur les requêtes de santé basées sur des évaluations internes. Les informations sur la santé ont fait l’objet d’un examen minutieux, en particulier après qu’une enquête du Guardian a révélé des inexactitudes dans les aperçus de l’IA de Google, incitant Google à retirer ces fonctionnalités pour certaines questions liées à la santé.

OpenAI a déclaré que ses mises à jour représentent une amélioration de l’exactitude des informations sur la santé. Ce changement permet à un large public d’accéder aux réponses médicales de ChatGPT sans rediriger vers des sources externes, ce qui pourrait impacter les éditeurs et les référenceurs du secteur de la santé.

La société a souligné les progrès réalisés dans ses benchmarks HealthBench et HealthBench Professional, notant que GPT-5.5 Instant surpasse son prédécesseur, GPT-5.3 Instant. OpenAI a également signalé une diminution de 71 % des réponses sanitaires signalées pour des problèmes potentiels de réalité sur deux mois, faisant référence à ses systèmes de surveillance du trafic en direct.

Une évaluation distincte impliquait de comparer les réponses générées par GPT-5.5 Instant avec celles rédigées par des médecins à travers 3 500 conversations représentatives sur la santé. Lors des évaluations, un panel de médecins a évalué les réponses du modèle d’IA à un niveau supérieur à celles rédigées par des médecins humains en termes d’exactitude, de communication et d’exhaustivité.

OpenAI a affirmé que GPT-5.5 Instant démontre moins de modes de défaillance que les anciennes versions et les réponses humaines, soulignant moins de signaux d’alarme manqués et une probabilité réduite de ne pas rechercher de contexte supplémentaire auprès des utilisateurs. HealthBench a été développé en s’appuyant sur la contribution du réseau de médecins de l’entreprise et utilise des rubriques créées par les médecins à des fins d’évaluation.

OpenAI travaille avec plus de 260 médecins répartis dans 60 pays, qui ont collectivement examiné plus de 700 000 exemples de réponses. Bien que ce chiffre ait été systématiquement cité depuis le lancement de ChatGPT Health en janvier, aucun résultat d’examen indépendant n’a été publié.

Selon OpenAI, les demandes de renseignements sur la santé et le bien-être représentent une part importante des interactions ChatGPT, avec plus de 230 millions d’utilisateurs posant chaque semaine des questions liées à la santé. De plus, les discussions sur la santé sont soumises à des politiques strictes interdisant la publicité lors de conversations sur la santé, la santé mentale ou la politique.

La demande du marché pour des informations sur la santé via le niveau gratuit de ChatGPT peut augmenter la pression du zéro clic sur les éditeurs, car les réponses générées par l’IA connaissent un engagement accru, qui serait le plus élevé parmi les catégories analysées dans les aperçus de l’IA de Google. Les affirmations d’OpenAI concernant l’exactitude des réponses sanitaires manquent actuellement de validation par des tiers, ce qui soulève des inquiétudes quant à la fiabilité de ses évaluations.

L’annonce n’a pas précisé comment ces mises à jour pourraient affecter les protocoles de citation, ce qui suggère que la responsabilité de vérifier les réponses et de gérer les pertes de trafic pourrait incomber aux professionnels de la santé.

Crédit image en vedette

OpenAI affirme que les erreurs de santé ChatGPT gratuites ont diminué de 71 %

Related Stories

Apple apporte des commandes vocales Siri plus personnelles à la version bêta 3

Une étude anthropique révèle que les modèles de Claude forment un espace de travail interne ressemblant à la conscience

Apple active Siri AI sur Apple Watch dans watchOS 27 beta 3

Midjourney pousse Disney et d’autres à révéler l’utilisation interne de l’IA dans le cadre d’un procès