Fouilles de données sur le web, les artistes concernés
Un article détaillé sur le sujet a été initialement publié par Bongota le 02 Juillet 2025 sur le site de l'agence web Alsacreations : Fouilles de données sur le web, comment s'en protéger. Dans sa version de base, sa mise en place ne nécessite pas de codage. Elle peut être réalisée par toute personne connaissant l'emplacement des fichiers sur un site web. À défaut, des plugins sont disponibles sur les CMS tels que Wordpress, Wix, et même Cloudflare. Une version PDF de l'article est aussi disponible Fouilles de données sur le web, comment s'en protéger
L'ensemble des producteurs de données entrant dans le cadre de la propriété littéraire et artistique ne peut plus ignorer l'impact de l'intelligence artificielle sur leur métier. Des pans entiers de ces métiers vont devoir s'adapter ou disparaître. L'article cité en référence couvre ce problème et donne des pistes ; il est conseillé de s'y référer afin de mettre en place des protections. Cependant, certaines confusions se sont installées dans ce nouveau domaine qui cristallise les peurs des uns et des autres.
La propriété littéraire et artistique
Quand on parle des effets néfastes de la fouille de données sur le web, il faut comprendre que seuls sont concernés les créateurs de contenus, quels qu'ils soient, au sens où l'entend la loi sur le droit d'auteur. Que des logiciels guidés par l'IA puissent manipuler, compter et trier des millions des données en une fraction de temps, tout en répondant à une question précise de l'utilisateur, n'entre pas dans un processus de création. On pourrait dans l'absolu prétendre à un super tableur intelligent. Les données que manipule l'IA dans ces cas précis proviennent bien du web, où elles ont été aspirées. Cependant, ni les textes de lois, ni les théorèmes mathématiques, ni les idées politiques appartiennent à quiconque. De ce fait, beaucoup de professions, qui font pourtant appel à l'intellect humain - avocats, notaires, juristes, ne peuvent revendiquer des droits sur des données publiques, quand bien même ces données ont été aspirées sur le web. L'IA ne fait qu'une chose, en utilisant ses énormes bases de données et ses algorithmes, elle répond précisément aux questions posées par des personnes possédant peu de compétences dans le domaine concerné. Sans l'aide de l'IA, trouver ces réponses sur Légifrance est une tâche lourde et décourageante. Dans ces cas précis, l'IA ne remplace pas un hêtre humain, un hêtre capable d'analyse émotionnelle, d'appréciation d'une situation familiale complexe et parfois, l'obligation légale de faire appel à un professionnel du droit. Elle permet par contre à toutes les personnes tétanisées par la complexité du droit administratif de préparer leurs dossiers dans des conditions optimales. Et dans certaines situations de se passer de services onéreux, prétendus obligatoires, mais qui ne le sont finalement pas. Les exemples abondent dans le domaine du droit administratif et du droit des successions.
Les applications dans la production musicale
Ici aussi, on rencontre certaines confusions. Il est évident que des compositions artistiques réalisées sous IA le sont grâce à l'accumulation de données provenant des fouilles engagées sur le web. Des données qui sont soustraites à des œuvres du commerce protégées par le droit. Que ces productions engagées par l'IA viennent en concurrence des œuvres qu'elles ont pillées ne passe pas chez les artistes. Il s'agit bien d'un coup de poignard dans le dos.
Maintenant, comme pour les avocats et notaires cités plus haut, certaines professions liées à la production musicale ne sont pas parties prenantes au droit d'auteur. On pense aux copistes de partitions, techniciens du son qui participent à l'enregistrement et au mixage. En ce qui concerne mixage et le mastering, un certain flou juridique est pourtant présent. Il est évident que derrière les logiciels de mixage ou de mastering pilotés par IA, il y a un travail conséquent de programmation pure dans la conception des algorithmes de l'IA. Cependant, tous ces modules se basent sur des modèles du commerce - modèles de mixages, modèles de mastering, auxquels ils se comparent, afin de s'en approcher au plus près. On a plus affaire à une captation de données, mais à une captation de compétences de la part de l'IA. Si ces modules ne peuvent pas égaler un humain pour des musiques complexes ou sortants du cadre habituel, ils sont suffisamment performants pour la majorité de la production commerciale. Les producteurs travaillant en "home studio" font appel à l'IA pour masteriser leurs productions. Voilà un métier qui, lui aussi, va subir de plein fouet l'arrivée de l'IA. Pour le moment, on se console en parlant d'un assistant à l'humain, mais demain ou après-demain, l'humain aura disparu. Parfois lentement, mais toujours sûrement.
Il en va de même pour la création des instruments virtuels, particulièrement pour l'imitation des instruments acoustiques. Ces enregistrements sont réalisés à grands frais dans des studios professionnels. Par contre, ce sont bien des musiciens humains qui jouent sur ces enregistrements. Qu'en est-il des droits voisins, dans ce cas ?
Comme on peut le constater, nous sommes à l'aube d'un conflit entre l'IA et les créateurs. L'IA est une aventure on ne peut plus capitaliste. L'univers de la production musicale ultra-commerciale ayant depuis longtemps épousé les travers de ce mode de production, il va demain en subir la dure loi. Tu ne sers plus, tu peux disparaître.
Le logicile libre à l'épreuve de l'IA
Les tentatives "d'enfermer" du logiciel libre dans des licences propriétaires ne datent pas d'aujourd'hui, mais les contrevenants étaient assez facile à débusquer. Qu'en est-il des fouilles de code libre réutilisé par l'IA afin de créer des logiciels dont certains vont devenir propriétaires ? La dillution du code dans d'énormes bases de données brouille les provenances ; codes propriétaires et codes libres se retrouvent mélangés dans des projets générés par l'IA, effaçant l'origine et les licences des uns et des autres. Alors que paradoxalement, toute l'infrascructure de l'IA repose sur du logiciel libre. N'oublions pas que le logiciel, libre ou pas, est partie intégrante de la propriété littéraire et artistique. Face à l'IA et la loi, les programmeurs sont logés à la même enseigne que les artistes. Cependant, ils n'ont pas les mêmes préocupations. Les uns codent à leur temps perdu, parfois au sein même de l'entreprise ou de l'université où ils travaillent ; coder n'étant pas leur gagne pain, ils redistribuent gratuitement leur travail. Les autres attendent la répartition de la SACEM, c'est le seul moyen pour eux de ne pas atterrir dans la rue. Pour le logiciel libre, introduire l'opt-out dans la licence briserait la sacro sainte clause de redistribution de la GPL.
Quelques procès en cours
Thomson-ReutersDisney / Midjourney
New York Times