Une patate chaude : Le premier recours collectif contre un algorithme d’apprentissage automatique a été déposé devant le tribunal fédéral de San Francisco. Les partisans appellent des millions d’utilisateurs de GitHub à réaffirmer leurs droits contre Copilot, une IA qui suggère un nouveau code en violant les licences open source et plusieurs autres lois sur la violation du droit d’auteur.

Les avocats ont déposé un recours collectif contre le système d’IA derrière Copilote GitHub, une fonctionnalité conçue par Microsoft et OpenAI pour aider les programmeurs à écrire un meilleur code plus rapidement. Selon les avocats, Copilot piétine les droits de “probablement des millions” d’abonnés GitHub, (ab)utilisant d’innombrables lignes de codes sans autorisation appropriée et contre les règles de nombreuses licences open source.

Copilot est un algorithme d’apprentissage automatique développé par OpenAI – la même société derrière le système de génération d’images connu sous le nom de DALL-E – pour suggérer du code et même des fonctions entières en temps réel, directement depuis l’éditeur de code ou l’IDE préféré de l’utilisateur. GitHub Copilot a été formé “sur des milliards de lignes de code” et est apparemment capable de transformer des invites en langage naturel en suggestions de codage dans des dizaines de langues différentes.

L’algorithme Copilot a été un succès jusqu’à présent, avec près de 30 % du nouveau code hébergé sur GitHub écrit avec l’assistance de l’IA. Derrière l’approbation publique de Copilot se cache ce que les avocats décrivent comme la violation systématique des “droits légaux d’un grand nombre de créateurs qui ont publié du code ou d’autres travaux sous certaines licences open source sur GitHub”.

2022 11 08 image 10

La recours collectif dit qu’un ensemble de 11 licences open source populaires (MIT, GPL, Apache, etc.) nécessitent l’attribution du nom de l’auteur et du droit d’auteur, et Copilot n’a jamais rien fait de tout cela. Au-delà de l’attribution appropriée de la paternité, la poursuite indique que l’IA de GitHub a violé les propres conditions d’utilisation et politiques de confidentialité du service, DMCA § 1202 (qui interdit la suppression des informations de gestion des droits d’auteur), le California Consumer Privacy Act et “d’autres lois donnant lieu à des réclamations légales connexes”.

Les partisans du recours collectif introduisent leur action en justice comme la première étape d’un long voyage, dans ce qui devrait être la première tentative de contester légalement la formation et la sortie des systèmes d’IA aux États-Unis. Et ce ne sera pas la dernière, affirment les avocats, car “les systèmes d’IA ne sont pas exemptés de la loi” et les créateurs de ces technologies doivent en rester responsables.

“Si des entreprises comme Microsoft, GitHub et OpenAI choisissent de ne pas respecter la loi”, poursuit le recours collectif, “elles ne devraient pas s’attendre à ce que nous, le public, restions immobiles”. L’IA doit être juste et éthique pour tout le monde, sinon elle deviendra simplement “un autre moyen pour quelques privilégiés de profiter du travail du plus grand nombre”.