OpenAI a accidentellement supprimé des données cruciales liées à son procès en matière de droits d’auteur avec le New York Times au cours d’une procédure judiciaire en cours concernant des réclamations pour violation du droit d’auteur. L’incident impliquait des données provenant de machines virtuelles dédiées fournies aux plaignants, ce qu’OpenAI a reconnu au tribunal dans un récent dossier. En conséquence, les avocats du Times ont déclaré avoir perdu une semaine de travail lié à l’affaire.
OpenAI fait face à un revers en matière de perte de données dans le cadre d’un procès avec le New York Times
Selon un lettre du Times‘, cette perte de données a impliqué « une semaine entière de travail de ses experts et avocats » et a été « irrémédiablement perdue ». Les plaignants enquêtaient sur des allégations selon lesquelles les modèles d’OpenAI avaient été formés sur du contenu non autorisé. Dans le cadre de ce processus, ils ont accumulé des données sur 150 heures de recherche intensive sur les ensembles de données de formation d’OpenAI, recherchant spécifiquement des cas de violation du droit d’auteur. Un rapport de TechCrunch a indiqué que la suppression a eu lieu le 14 novembre, lorsque « les programmes et les données des résultats de recherche stockés sur l’une des machines virtuelles dédiées ont été effacés par les ingénieurs d’OpenAI ».
Le le cœur du procès affirme qu’OpenAI, avec Microsoft – son partenaire utilisant la technologie OpenAI pour son chatbot Bing AI – a violé les droits d’auteur du New York Times en utilisant du contenu payant sans autorisation. Le Times affirme que les modèles d’OpenAI ont produit des répliques « quasi mot pour mot » de ses articles, constituant ainsi son argument en faveur de dommages-intérêts. OpenAI a toujours réfuté ces allégations, affirmant que sa formation était basée sur des données accessibles au public, ce qui constitue une utilisation équitable en vertu des lois sur le droit d’auteur.
Un porte-parole d’OpenAI a déclaré que l’incident était un « problème ». Dans le même temps, ils ont réussi à récupérer la plupart des données supprimées, et les éléments critiques, notamment « la structure des dossiers et les noms de fichiers », restent perdus et par conséquent inutilisables. En conséquence, les avocats du Times sont désormais confrontés au défi de recommencer leur collecte de preuves à partir de zéro. Malgré les circonstances, ils ont déclaré n’avoir « aucune raison de croire [the erasure] était intentionnel », soulignant qu’OpenAI est le mieux placé pour rechercher ses ensembles de données. Cependant, ils ont également noté la réticence de l’entreprise à divulguer des détails sur ses données de formation.
Pour compliquer encore les choses, des réclamations similaires en matière de droits d’auteur ont émergé contre OpenAI. Un récent procès contre la société par Raw Story et AlterNet a été rejeté parce que les plaignants n’étaient pas en mesure de fournir des preuves suffisantes du préjudice lié à leurs allégations. En revanche, Le New York Times aurait investi plus d’un million de dollars en frais juridiques pour poursuivre son procès contre OpenAI. Cet engagement financier illustre le défi particulier auquel sont confrontés les petits éditeurs lorsqu’ils rivalisent avec des entreprises technologiques de grande envergure.
OpenAI, en revanche, a récemment conclu des accords de licence avec plusieurs grandes sociétés de médias, autorisant l’utilisation de leur contenu pour entraîner ses modèles d’IA, offrant ainsi une compensation et un crédit. Des rapports indiquent qu’OpenAI paie au géant de l’édition Dotdash Meredith au moins 16 millions de dollars par an pour les droits de licence, reflétant sa stratégie consistant à rechercher des partenariats formels plutôt que des litiges en cours.
Crédit image: Furkan Demirkaya/Idéogramme
Le message Le problème juridique du New York Times s’aggrave alors qu’OpenAI supprime accidentellement des données importantes apparaît en premier sur TechBriefly.