Reddit fait pression pour un partenariat renforcé avec Google, visant à sécuriser davantage d’utilisateurs et à augmenter ses revenus en échange d’un accès encore plus large à ses précieuses données pour la formation en IA. Cette évolution, rapportée par Bloomberg, met en évidence les tensions persistantes entre les plateformes de contenu et les géants de la technologie à l’ère de l’IA, où les accords de licence de données doivent équilibrer la monétisation avec la préservation du trafic et de l’engagement du site.
Il y a environ 18 mois, Reddit a signé son premier accord de partage de données avec Google, évalué à environ 60 millions de dollars par an. Aujourd’hui, la plateforme de médias sociaux revient aux négociations, cherchant une position plus importante au sein de l’infrastructure d’IA de Google. Selon des dirigeants anonymes cités par Bloomberg, Reddit souhaite que Google mette en œuvre des mécanismes qui redirigent les utilisateurs (qui obtiennent souvent des réponses dérivées du contenu de Reddit via des outils d’IA) vers la plateforme. L’objectif est d’encourager ces utilisateurs à publier du nouveau contenu, générant ainsi de nouvelles données pour alimenter les modèles d’IA tout en stimulant l’activité de la communauté Reddit.
Outre la redirection des utilisateurs, Reddit plaide pour une rémunération plus élevée pour ses données. La société explore un modèle de tarification dynamique pour les futurs accords de licence, non seulement avec Google mais également avec des entités comme OpenAI. Dans le cadre de ce système proposé, les paiements varieraient en fonction de l’utilité du contenu et de sa pertinence par rapport aux réponses générées par l’IA, garantissant ainsi une valorisation plus juste des contributions de Reddit.
Les dirigeants soutiennent que les termes des accords existants sous-évaluent l’ensemble de données de Reddit, qui se distingue par son authenticité et sa structure dans un paysage en ligne souvent critiqué pour son contenu « slop » de mauvaise qualité. Les publications de Reddit présentent des discussions authentiques et franches d’utilisateurs réels, organisées thématiquement en forums et classées via un système de vote communautaire plutôt que des algorithmes opaques. Cette qualité organisée par l’homme la rend exceptionnellement attrayante pour les développeurs d’IA à la recherche de données de formation fiables.
Les données soulignent l’importance de Reddit dans le domaine de l’IA : il s’agit de la source la plus fréquemment citée pour des outils tels que Perplexity et les aperçus de l’IA de Google. Une stratégie de recherche populaire parmi les utilisateurs consiste à ajouter « reddit » aux requêtes Google pour produire des résultats plus précis et plus perspicaces, démontrant ainsi l’influence de la plateforme.
Cette négociation illustre un paradoxe plus large dans les licences d’IA : des fournisseurs de contenu comme Reddit fournissent les données essentielles à la formation de modèles avancés, mais ces mêmes modèles risquent de détourner le trafic des sources d’origine. En exigeant des termes qui incluent des stratégies de fidélisation des utilisateurs ainsi que des gains financiers, Reddit vise à maintenir la vitalité de son écosystème dans un contexte de montée en puissance des outils de recherche et de synthèse basés sur l’IA.
Les discussions reflètent un marché en pleine maturité pour les transactions relatives aux données d’IA, dans lequel les plateformes s’affirment de plus en plus quant à la protection de leur viabilité à long terme. À mesure que l’IA continue d’évoluer, de tels arrangements pourraient créer des précédents quant à la manière dont les entreprises technologiques rémunèrent et collaborent avec les créateurs de contenu.







