Une nouvelle norme de licence, Really Simple Licensing (RSL), a été introduite pour permettre aux éditeurs Web de définir les conditions dans lesquelles les développeurs de systèmes d’IA peuvent utiliser leur contenu. L’initiative vise à établir un cadre permettant aux entreprises d’IA de rémunérer les éditeurs qui utilisent leurs données pour former des modèles d’IA.

Mercredi, d’éminentes organisations, notamment Reddit, Yahoo, Medium, Quora et People Inc., ont annoncé leur soutien au RSL Standard, un protocole ouvert de licence de contenu. Cette norme permet aux éditeurs de spécifier comment les robots doivent payer pour récupérer leurs sites pour les données de formation en IA, dans le but d’influencer collectivement les entreprises d’IA à adopter le cadre.

La norme RSL développe le protocole robots.txt existant, qui permettait historiquement aux éditeurs d’indiquer aux robots d’exploration Web à quelles parties de leur site ils peuvent et ne peuvent pas accéder. RSL améliore cela en permettant aux sites Web d’inclure les conditions de licence et de redevances dans leur fichier robots.txt. Ces termes peuvent également être intégrés dans des livres, des vidéos et des ensembles de données de formation en ligne, permettant aux éditeurs de demander une compensation pour leur utilisation.

Le RSL Collective, une organisation de défense des droits nouvellement créée, est à l’origine du standard RSL. Il est dirigé par Eckart Walther, co-créateur de la norme Really Simple Syndication (RSS) et ancien PDG de CardSpring, et Doug Leeds, ancien PDG d’IAC Publishing et Ask.com. Walther a déclaré : « L’objectif est de créer un nouveau modèle commercial évolutif pour le Web. RSL reprend certaines de ces premières idées RSS et crée une nouvelle couche pour l’ensemble de l’Internet où les droits de licence et les droits de compensation sont définis.

La norme RSL prend en charge divers modèles de licence, y compris des options gratuites. Les propriétaires de sites peuvent demander aux sociétés d’IA de payer des frais d’abonnement ou des frais de paiement par exploration via la norme RSL, qui seraient facturés chaque fois qu’un robot IA explore le site Web. De plus, des frais de paiement par inférence peuvent être mis en place, permettant aux sites de recevoir une compensation lorsqu’un modèle d’IA fait référence à leur travail pour générer une réponse. Les robots qui explorent les sites à d’autres fins, telles que l’archivage ou l’inclusion dans les moteurs de recherche, peuvent continuer comme d’habitude.

Plusieurs sociétés de médias, dont Vox Media (société mère de The Verge), News Corp (propriétaire du Wall Street Journal) et le New York Times, ont déjà conclu des accords de licence avec des sociétés d’IA individuelles comme OpenAI et Amazon. Le RSL Collective vise à rationaliser ce processus, permettant à tout propriétaire ou créateur de site Web de recevoir un paiement pour son travail sans négocier d’accords séparés.

Le succès de RSL dépend de son adoption par les principaux acteurs du secteur, en particulier les sociétés d’IA. Les créateurs de modèles d’IA ont été accusés de ne pas tenir compte des fichiers robots.txt des sites, et il n’existe actuellement aucune méthode simple pour suivre les frais d’inférence sans leur coopération. Le RSL Collective mise sur l’influence collective des grands éditeurs du web pour rendre l’adoption de la norme plus attractive. Leeds a déclaré: “Notre travail consiste à sortir et à amener un grand groupe de personnes à dire que c’est dans votre intérêt, à la fois efficacement, car vous pouvez négocier avec tout le monde en même temps, et légalement, car si vous ne le faites pas, vous violez tout le monde en même temps.”

Contrairement à des systèmes tels que le « paiement par exploration » de Cloudflare, la norme RSL ne peut à elle seule empêcher les robots de visiter un site Web. Le RSL Collective collabore avec Fastly, un réseau de diffusion de contenu, pour contrôler l’accès des robots IA aux sites Web selon qu’ils ont accepté ou non une licence de contenu. Leeds a décrit Fastly comme « le videur à la porte du club, et ils ne laisseront entrer les gens que s’ils ont la bonne pièce d’identité.

Leeds estime que le RSL Collective peut légalement faire respecter les licences, affirmant que « tous les participants à l’organisation de défense des droits collectifs participent à l’application de toute infraction », répartissant ainsi les frais de justice. Il a comparé ce système aux organisations de droits numériques existantes, telles que le groupe de droits musicaux ASCAP, qui collecte et distribue les droits de licence à ses membres. Alors que les licences musicales conventionnelles bénéficient d’un solide précédent juridique en matière de protection des droits d’auteur, le scraping non autorisé et l’utilisation de médias pour la formation des systèmes d’IA restent dans une zone grise juridique. Les principaux acteurs de l’IA font actuellement face à des poursuites judiciaires de la part d’entités telles que Reddit, Getty Images et divers éditeurs en ligne.

Leeds et Walther ont déclaré : « Il y a toujours eu la question de savoir si les robots ont accepté des conditions qu’ils ne voient pas. RSL change cela fondamentalement, en informant les robots d’exploration des conditions avant d’accéder à un site.

Leeds espère que le système créera un moyen intuitif de naviguer dans les licencesSing fonctionne pour la formation en IA, déclarant : « Ce que nous faisons n’est pas de réinventer des roues ou d’inventer des roues – nous les amenons simplement dans un endroit où elles n’existaient pas auparavant. La raison pour laquelle elles n’existaient pas ici auparavant est parce qu’elles n’avaient pas de norme sur laquelle nous pourrions nous appuyer. C’est pourquoi la norme RSL est si importante : elle donne l’infrastructure nécessaire pour ensuite créer les choses qui ont fonctionné dans toutes les autres industries médiatiques et qui n’ont pas encore eu lieu.

Le RSL Collective est gratuit pour les éditeurs et les créateurs. D’autres grandes marques comme O’Reilly, wikiHow et Ziff Davis (propriétaire d’IGN) ont également rejoint l’organisation.