Un article d’Ars Technica de septembre 2025, intitulé « Le rapport sur la sécurité de DeepMind AI explore les dangers d’une IA mal alignée », couvre les recherches et le point de vue de Google DeepMind sur la sécurité de l’intelligence artificielle. Le rapport accorde une attention particulière à l’intelligence générale artificielle (AGI) et aux risques posés par des systèmes d’IA mal alignés, où les objectifs d’une IA entrent en conflit avec les valeurs ou les intentions humaines.

L’article décrit l’approche de DeepMind en matière de développement responsable de l’IA, en mettant l’accent sur un engagement en faveur de la sécurité technique, de l’évaluation des risques et de la collaboration au sein de la communauté de l’IA pour gérer les risques potentiels. Cette stratégie est particulièrement axée sur les dangers qui pourraient émerger des puissants systèmes AGI. Un élément central de cet effort est le Frontier Safety Framework de DeepMind, un protocole créé pour identifier et atténuer de manière proactive les risques graves associés aux modèles d’IA frontaliers.

Les organes de gouvernance internes au sein de DeepMind sont également détaillés, notamment le Conseil de responsabilité et de sécurité et le Conseil de sécurité de l’AGI. Ces groupes sont chargés de superviser la recherche et le développement pour faire face aux risques éthiques, techniques et de sécurité liés aux technologies avancées d’IA.

Un défi important évoqué est celui du mauvais alignement de l’IA. De tels systèmes peuvent être préjudiciables si leurs objectifs opérationnels sont en contradiction avec le bien-être de la société, même s’ils semblent fonctionner correctement d’un point de vue technique restreint. Pour résoudre ce problème, DeepMind souligne l’importance de la transparence, de la collaboration externe et de la recherche proactive sur la sécurité comme partie intégrante de la création responsable d’AGI.