L’équipe Facebook a annoncé des améliorations significatives de l’IA qu’elle utilise pour décrire les photos publiées sur la plateforme, une technologie conçue pour les utilisateurs malvoyants.
Ce système, conçu par Facebook en 2016, a été amélioré pour fournir une dynamique plus rapide et plus précise. Mais sa dernière mise à jour va encore plus loin, car elle peut offrir des descriptions plus détaillées des photos.
Facebook améliore son IA pour aider les utilisateurs malvoyants
Pour chaque image publiée sur Facebook, l’intelligence artificielle génère automatiquement un sous-titre qui tente de décrire la scène. Facebook ne veut pas que ce projet décrive uniquement des éléments individuels de l’image, mais qu’il transmette la scène entière afin que les utilisateurs puissent comprendre le contexte et profiter de la publication.
Un objectif qui est présent dans cette nouvelle version de l’IA, permet déjà de reconnaître beaucoup plus d’éléments et d’offrir une description plus détaillée de la scène. Non seulement il peut distinguer s’il y a des personnes ou des animaux, mais il peut également reconnaître différents types d’activités, de lieux et même la position des éléments.
Par exemple, dans l’image ci-dessus, l’intelligence artificielle a pu reconnaître qu’il y a 5 personnes portant des chapeaux et jouant de la batterie. Mais pas seulement cela, il peut également décrire comment la scène est mise en place et quels éléments sont importants. Comme vous pouvez le voir sur la photo, toutes les informations sont classées de manière à ce que tout le contexte de la scène puisse être compris.
Toutes ces informations aideront les personnes malvoyantes à comprendre ce que leurs amis partagent sur leurs photos. Bien sûr, ils peuvent ne pas vouloir obtenir ces informations pour chaque photo qui apparaît dans leur flux, alors Facebook leur permettra de choisir quand ils souhaitent recevoir une description plus détaillée.