Afin de réaliser des activités de fouilles de données destinées à alimenter leurs bases d'entraînement, les fournisseurs d'intelligence artificielle utilisent des images et du contenu disponibles sur le net, dont la majorité sont des œuvres protégées par le droit d'auteur. Il est évident qu'il y a là un véritable pillage de données qui ne leur appartiennent pas. Se pose aussi la question de l'autorisation donnée par les auteurs de ces œuvres pour leur utilisation, ou de leur rémunération éventuelle. Le développement technologique étant plus rapide que l'élaboration du droit, le flou juridique s'est installé. Cependant, des lois sont déjà en place. La captation massive sans rémunération ne pourra perdurer. Les auteurs de données, qu'elles soient des textes, des images, de la musique ou des vidéos, devront pouvoir donner leur accord, et éventuellement obtenir une rémunération. Si aucune loi satisfaisante n'est mise en place, on assistera à une révolte des auteurs, qui se saisiront d'outils de blocage, comme on l'a vu avec les publicités sur les sites web.
Il est strictement interdit, sans l'accord préalable et écrit du webmaster, de crawler le Site ecrisdroit et/ou les ses Applications et/ou d'en collecter de manière massive le contenu, par quelque moyen et dans quelque but que ce soit, et en particulier afin de développer ou d'entraîner tout programme logiciel, y compris, sans s'y limiter, les programmes basés sur l'intelligence artificielle.
L’utilisation de systèmes automatisés ou de logiciels pour extraire des données du site ecrisdroit à des fins de réutilisation (capture de données d’écran, web scraping, fouilles de données) est interdite par l'auteur et constitue une contrefaçon. décret AMALOU Sous-Section 2 Art.R. 122-28 / web scraping
Le site ecrisdroit souscrit à la normeTDMRep et à une politique de licence d'utilisation des données du site. La mise en place de ce protocole TDMRep est également lisible par les machines, à partir d'un fichier JSON.