Google a détaillé son approche de sécurité pour les fonctionnalités agents de Chrome, qui permettent des actions automatisées telles que la réservation de billets ou les achats, traitant ainsi des données potentielles et des risques financiers. Google utilise plusieurs modèles pour gérer les actions agentiques. Un User Alignment Critic, construit avec Gemini, examine les éléments d’action générés par le modèle de planificateur. Si le modèle critique détermine que les tâches planifiées ne correspondent pas aux objectifs de l’utilisateur, il invite le planificateur à réévaluer la stratégie. Le modèle critique accède uniquement aux métadonnées des actions proposées, et non au contenu Web réel. Pour restreindre l’accès des agents aux sites non autorisés ou non fiables, Google utilise les ensembles d’origines d’agent. Ces ensembles limitent le modèle à des origines spécifiques en lecture seule et en lecture-écriture. Les origines en lecture seule définissent le contenu que les Gémeaux peuvent consommer ; par exemple, les listes de produits sur un site commercial sont pertinentes, mais les bannières publicitaires ne le sont pas. L’agent ne peut interagir qu’avec les iframes désignées sur une page. Dans un article de blog, la société a déclaré : « Cette délimitation impose que seules les données provenant d’un ensemble limité d’origines soient disponibles pour l’agent, et ces données ne peuvent être transmises qu’aux origines inscriptibles. Cela limite le vecteur de menace des fuites de données d’origines croisées. Google surveille la navigation dans les pages via un autre modèle d’observateur pour empêcher l’accès aux URL nuisibles générées par le modèle. Pour les tâches sensibles, Google requiert le consentement de l’utilisateur. Si un agent tente d’accéder à des sites sensibles, tels que des plateformes bancaires ou médicales, il demande l’autorisation de l’utilisateur. Si un site nécessite une connexion, Chrome demandera à l’utilisateur l’autorisation d’utiliser le gestionnaire de mots de passe ; le modèle de l’agent n’accède pas aux données de mot de passe. Les utilisateurs seront interrogés avant que l’agent n’initie des actions telles que réaliser un achat ou envoyer un message. Google utilise également un classificateur à injection rapide pour empêcher les actions indésirables et évalue les capacités agents contre les attaques développées par les chercheurs. Plus tôt ce mois-ci, Perplexité a publié un modèle de détection de contenu open source pour contrer les attaques par injection rapide contre les agents.
Source: Google utilise Gémeaux "critique" modèle pour surveiller les agents Chrome




