Passer au contenu

OpenAI et Microsoft accusés d’avoir volé des données de millions d’internautes pour former ChatGPT

Deux ingénieurs estiment que OpenAI, la société qui a développé ChatGPT, et Microsoft, qui a investi des milliards dans cette IA générative, ont recueilli illégalement des milliards de données provenant des réseaux sociaux et d’autres plateformes du Web pour entraîner leur système. Les deux scientifiques sont à l’origine d’une nouvelle procédure collective aux États-Unis. Ils pourraient être rejoints par des millions d’internautes.

Des centaines de millions d’internautes pillés ? C’est ce que laisse entendre cette nouvelle action en justice visant OpenAI et Microsoft. Comme en juin dernier, la start-up à l’origine de ChatGPT et le géant des logiciels — qui a investi des milliards dans la société — sont tous les deux visés par un recours collectif aux États-Unis. Ils sont accusés, selon la plainte déposée le 5 septembre dernier devant le tribunal fédéral de San Francisco, d’avoir volé et utilisé des données personnelles de centaines de millions d’internautes pour entraîner ChatGPT. 

À l’origine de ce recours collectif, on trouve deux ingénieurs, qui ont souhaité garder l’anonymat. Ce type de procédure permet d’attaquer, au nom de milliers de personnes et en une seule fois, une société – avec à la clef des dommages et intérêts demandés dont le montant n’est, ici, pas précisé. Les deux scientifiques estiment que les deux sociétés ont violé plusieurs lois américaines sur la protection de la vie privée en développant ChatGPT, l’agent conversationnel le plus populaire du moment, capable de générer du texte et du code.

Des données récupérées « en grande partie en secret »

Ce type de système d’IA générative nécessite d’immenses quantités de données pour être performant. Or ces data auraient été, selon la plainte, récupérées « en grande partie en secret », sans autorisation, et en violation des conditions d’utilisation de nombreux sites Web et des droits des individus à refuser une telle collecte. Parmi ces données sont listées dans la plainte « des informations et des conversations privées » issues de messageries entre particuliers ou professionnelles, ainsi que de nombreuses « informations interceptées comme les localisations des utilisateurs, les goûts musicaux, des données financières ou médicales ». 

Autre grief : les ingénieurs craignent aussi que les entreprises aient incorporé leurs « compétences et leur expertise » dans des produits qui pourraient « un jour entraîner [leur] obsolescence professionnelle ». 

Or « sans ce vol sans précédent d’informations privées et protégées par le droit d’auteur appartenant à des personnes réelles », est-il écrit dans la plainte, OpenAI « ne serait pas l’entreprise de plusieurs milliards de dollars d’aujourd’hui ». 

À lire aussi : « Arrêtez de voler nos livres, et payez-nous » – aux États-Unis, la bronca des écrivains face aux industriels de l’IA

Objectif : « rendre les “Big AI” responsables de leur vol massif d’informations personnelles »

C’est la deuxième fois qu’une action collective est menée contre l’outil d’IA générative d’OpenAI pour vol de données provenant d’internautes. En juin déjà, une procédure similaire visait le développeur de ChatGPT.  Ryan Clarkson, un des avocats du cabinet Clarkson en charge de cette première action en justice, s’est réjoui de cette nouvelle. L’avocat a expliqué dans un communiqué mercredi 5 septembre que l’objectif était de « rendre les “Big AI” responsables de leur vol massif d’informations personnelles et de leurs violations des droits à la vie privée, à la propriété et au droit de la consommation », rapporte Reuters.

À lire aussi : OpenAI attaqué en justice pour avoir utilisé vos commentaires et vos articles de blog

D’autres actions, formées cette fois pour vol de données protégées par le droit d’auteur, sont aussi en cours. Elles visent Stabile Diffusion, Midjourney et DeviantArt, à qui on reproche d’avoir collecté des milliards d’images en vue de « l’apprentissage » de ces IA, dont des créations protégées par le droit d’auteur.

À lire aussi : Un grand « pillage numérique » : quand l’IA générative défie le droit d’auteur

Les ingénieurs ont demandé au tribunal un montant non précisé de dommages-intérêts à reverser à tout membre de cette procédure — ce qui pourrait inclure toute personne dont les informations auraient été récupérées. Ils exigent également que les entreprises mettent en œuvre des mesures de protection contre l’utilisation abusive de données privées. Interrogés par nos confrères, ni OpenAI ni Microsoft n’ont souhaité commenter cette affaire. 

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Source : Plainte déposée le 5 septembre 2023