Automne numérique : Création et éducation au numérique
L'exception TDM dans la loi numérique : mérites, limites et perspectives
1. L’exception TDM dans la
loi numérique
Mérites, limites et perspectives…
Par Lionel Maurel
Université Paris Lumières
Colloque «La loi numérique, et après ? »
Meudon, 09/11/2016r
3. Mais un « syndrome de Frankenstein »…
- Proposition initiale du Consortium
Couperin ;
- Amendements NKM, I. Attard, C. Paul ;
- Version adoptée par l’Assemblée ;
- Version adoptée au Sénat ;
- Version issue de la CMP.
Un texte qui porte les marques des
controverses au sujet du TDM…
4. Attention à ne pas céder au mythe
de la « bataille décisive »…
Le législateur français est un
grand spécialiste du vote
d’exceptions au droit d’auteur
« en trompe-l’œil »
Le texte de l’exception comporte de
nombreuses failles et beaucoup de ce
qui a été gagné peut être perdu via
les décrets d’application.
5. Article 38 de la loi
Le code de la propriété intellectuelle est ainsi modifié :
1° Après le second alinéa du 9° de l'article L. 122-5, il est inséré un 10° ainsi rédigé :
« 10° Les copies ou reproductions numériques réalisées à partir d'une source licite, en vue de l'exploration de
textes et de données incluses ou associées aux écrits scientifiques pour les besoins de la recherche publique, à
l'exclusion de toute finalité commerciale. Un décret fixe les conditions dans lesquelles l'exploration des textes
et des données est mise en œuvre, ainsi que les modalités de conservation et de communication des fichiers
produits au terme des activités de recherche pour lesquelles elles ont été produites ; ces fichiers constituent
des données de la recherche ; »
2° Après le 4° de l'article L. 342-3, il est inséré un 5° ainsi rédigé :
« 5° Les copies ou reproductions numériques de la base réalisées par une personne qui y a licitement accès, en
vue de fouilles de textes et de données incluses ou associées aux écrits scientifiques dans un cadre de
recherche, à l'exclusion de toute finalité commerciale. La conservation et la communication des copies
techniques issues des traitements, au terme des activités de recherche pour lesquelles elles ont été produites,
sont assurées par des organismes désignés par décret. Les autres copies ou reproductions sont détruites. »
Deux exceptions aux droits de propriété intellectuelle :
- Une exception au droit d’auteur ;
- Une exception au droit sui generis de producteur de bases de données.
6. Qui peut faire du TDM ?
Exception DA : « pour les besoins de la recherche publique »
VS
Exception BDD : «dans un cadre de recherche »
Une exception (DA) n’est ouverte qu’aux institutions
publiques de recherche.
L’autre (BDD) est ouverte plus largement…
(recherche privée, science citoyenne ?)
7. Qui peut faire du TDM ?
« à l’exclusion de toute finalité commerciale »
Avec toutes les difficultés d’interprétation sur la distinction
entre le commercial et le non-commercial…
- Même chose dans l’exception anglaise (« dans le seul but de conduire une
recherche non-commerciale »)
- Mais pas aux Etats-Unis où le TDM est couvert par le fair use, invocable par
les entreprises (cf. Affaire Google Books), ni en Chine ou au Japon.
8. En quoi consiste l’activité de TDM couverte
par l’exception ?
Exception DA : « Lorsque l'oeuvre a été divulguée, l'auteur ne peut interdire […] Les copies ou
reproductions numériques réalisées à partir d'une source licite »
Exception BDD : « Lorsqu'une base de données est mise à la disposition du public par le titulaire
des droits, celui-ci ne peut interdire […] Les copies ou reproductions numériques de la base
réalisées par une personne qui y a licitement accès »
Le critère de la source licite n’a pas tout à
fait la même signification dans les deux cas.
9. En quoi consiste l’activité de TDM couverte
par l’exception ?
Exception BDD : « Lorsqu'une base de données est mise à la
disposition du public par le titulaire des droits, celui-ci ne peut
interdire […] Les copies ou reproductions numériques de la base
réalisées par une personne qui y a licitement accès »
Etrange formulation, car les exceptions au droit de producteur des bases de données
portent normalement sur les extractions et réutilisations de la base.
10. En quoi consiste l’activité de TDM couverte
par l’exception ?
Exception DA : « en vue de l'exploration de textes et de données
incluses ou associées aux écrits scientifiques »
Exception BDD : « en vue de fouilles de textes et de données incluses
ou associées aux écrits scientifiques »
Exploration ? Fouilles ?
Une définition explicite de l’activité de
TDM à préciser par décret ?
11. Définitions du TDM données à l’étranger et au
niveau communautaire
• UK : « copie d’une œuvre réalisée dans le but de conduire une
analyse computationelle »
• USA : TDM couvert par la notion « d’usages transformatifs » du fair
use.
Proposition de directive européenne :
Article 2 : “‘text and data mining’ means any automated analytical technique aiming to
analyse text and data in digital form in order to generate information such as patterns,
trends and correlations;
Article 3 : “reproductions and extractions made by research organisations in order to
carry out text and data mining of works or other subject matter to which they have
lawful access for the purposes of scientific research”.
12. Sur quoi peut porter l’activité de TDM ?
l'exploration ou la fouille de « textes et de données incluses ou
associées aux écrits scientifiques »
Restriction aux seuls « textes », donc va
interdire le TDM conduit sur des œuvres
graphiques, audiovisuelles, musicales, etc.
- Restriction absente en GB et aux USA.
- Dans le projet de directive européenne : « New technologies enable the
automated computational analysis of information in digital form, such as
text, sounds, images or data, generally known as text and data mining.”
13. Sur quoi peut porter l’activité de TDM ?
l'exploration ou la fouille de « textes et de données incluses ou
associées aux écrits scientifiques »
Données incluses aux écrits
scientifiques ?
- Aucune raison que les « données » figurent dans l’exception DA, car soit les données incluses ou associées
constituent une base de données protégées et cela relève de l’autre exception ; soit ce n’est pas le cas et les
données ne sont pas protégeables par le droit d’auteur.
- Couvre les données incluses par exemple sous forme de tableaux dans le texte ?
- Couvre le fait d’utiliser le texte d’un écrit comme une donnée (opération d’indexation) ?
- Couvre le fait de collecter des séquences d’information incluses dans du texte (exemple projet Text To Genom) ?
14. Sur quoi peut porter l’activité de TDM ?
Données incluses dans les
écrits scientifiques ???
Projet Text2Genome : extraction de chaînes
de caractères correspondant à des séquences
génétiques en vue d’opérer une cartographie
cherchable du génome d’un grand nombre
d’espèces.
15. Sur quoi peut porter l’activité de TDM ?
l'exploration ou la fouille de « textes et de données incluses ou
associées aux écrits scientifiques »
Données associées aux écrits
scientifiques ?
- Soit des données fournies en annexe à une publication scientifique
(supplementary material) ? => lien avec article 30 sur Open Access.
- Soit les données « sous-jacentes » à une recherche ayant donné lieu à
publication ?
- Soit des métadonnées associées à des écrits scientifiques ?
16. Sur quoi peut porter l’activité de TDM ?
Grand hiatus entre le périmètre des
textes et des données concernées…
- Les textes concernés peuvent être de toute nature : scientifiques,
littéraires, d’information (presse), pages web, etc.
- Les données par contre ne peuvent être « qu’incluses ou associées à
des écrits scientifiques ».
- Donc seulement des données de recherche, mais pas toutes les
données de recherche.
- Laisse de côté un grand nombre de données qui pourraient faire
l’objet de pratiques de Data Mining (statistiques, relevés, etc.)
17. Dans quelles conditions pourront s’exercer les
activités de Text et Data Mining ?
Exception DA : Un décret fixe les conditions dans lesquelles
l'exploration des textes et des données est mise en œuvre.
En réalité, c’est surtout pour
l’exception BDD qu’on aurait eu
besoin des précisions d’un décret…
- En effet, une chose est de pouvoir accéder légalement à une base de données, une autre de
pouvoir effectuer des extractions en vue d’une opération de TDM.
- Nécessite que la possibilité technique soit ouverte (API, formats interopérables, etc.)
- Quelle articulation avec les Mesures Techniques de Protection (DRM) ?
- Quelle articulation avec les licences et les conditions générales d’utilisation (CGU) ?
18. Dans quelles conditions pourront s’exercer les
activités de Text et Data Mining ?
Dans la proposition de directive européenne
Any contractual provision contrary to the exception provided for in paragraph 1 shall
be unenforceable.
Rightholders shall be allowed to apply measures to ensure the security and integrity
of the networks and databases where the works or other subject-matter are hosted.
Such measures shall not go beyond what is necessary to achieve that objective.
Member States shall encourage rightholders and research organisations to define
commonly-agreed best practices concerning the application of the measures
referred to in paragraph 3.
19. Un grand absent dans le texte :
le caractère d’ordre public des dispositions
Pourtant présent à l’article 30 sur le libre accès aux
publications scientifiques :
« Les dispositions du présent article sont d'ordre public et toute
clause contraire à celles-ci est réputée non écrite. »
Une telle précision garantit que le jeu de la disposition ne sera pas entravée par
des restrictions contractuelles, par exemple les clauses d’une licence ou des CGU.
20. Dans la première version adoptée par le Sénat
Portée limitée aux contenus sous abonnement, mais caractère
d’ordre public garanti + neutralisation des restrictions techniques.
Des dispositions similaires devraient être reprises dans le décret.
21. Quelle articulation avec les limitations
contractuelles (licences, CGU) ?
Pour l’exception BDD : L’exception TDM pas opposable aux clauses contraires ?
22. Le précédent de l’affaire « Mullholland Drive »
Quelle articulation avec les limitations
techniques (MTP) ?
La Cour de Cassation estime que le
bénéfice d’une exception ne constitue
pas un véritable « droit » opposable
en justice.
Les titulaires de droits peuvent
utiliser des Mesures Techniques de
Protection pour supprimer
complètement le bénéfice d’une
exception.
Quel impact sur l’exception TDM, via
les limitations techniques imposées
par les fournisseurs de bases de
données ?
23. L’exception TDM en dehors du champ de la
compétence régulatrice de la Hadopi
D’où l’intérêt de créer une
Agence Nationale pour la
Science Ouverte.
24. Le danger (mortel) de la
jurisprudence Ryanair (CJUE)
Même lorsqu’une base de
données n’est pas
protégeable par le droit sui
generis ou un droit d’auteur,
la CJUE considère qu’il est
possible d’en restreindre la
réutilisation simplement par
le biais de conditions
d’utilisation.
Et les exceptions ne peuvent
pas alors jouer…
25. Mais une protection contre les exclusivités sur
les données de recherche dans l’article 30
Dès lors que les données issues d'une activité de recherche financée au moins pour moitié
par des dotations de l'Etat, des collectivités territoriales, des établissements publics, des
subventions d'agences de financement nationales ou par des fonds de l'Union européenne
ne sont pas protégées par un droit spécifique ou une réglementation particulière et qu'elles
ont été rendues publiques par le chercheur, l'établissement ou l'organisme de recherche,
leur réutilisation est libre.
L'éditeur d'un écrit scientifique mentionné au I ne peut limiter la réutilisation des
données de la recherche rendues publiques dans le cadre de sa publication.
Les dispositions du présent article sont d'ordre public et toute clause contraire à celles-ci
est réputée non écrite.
- Possède un caractère d’ordre public.
- Semble opposable aux limitations techniques.
- Peut sans doute aussi neutraliser la jurisprudence Ryanair.
- Donc même incluse dans la base d’un fournisseur des données de
recherche devraient pouvoir librement être réutilisées.
26. Quelle communication et quelle conservation
pour les « archives du Text et Data Mining » ?
Au Royaume-Uni :
Lorsque qu’une copie de l’oeuvre a été effectuée
en vertu de cette section, le droit d’auteur est
enfreint si :
(a) La copie est transférée à une autre personne,
à moins que ce transfert soit autorisé par le
titulaire de droits
Aux Etats-Unis,
le fair use permet de :
- Conserver ces corpus sans limite dans le
temps et sans obligation de les détruire une
fois utilisés ;
- Les transmettre à des tiers, comme l’a fait
Google avec ses bibliothèques partenaires, les
mutualiser au sein d’entrepôts partagés
comme le fait Hathi Trust ;
- Afficher de courts extraits des contenus pour
illustrer une recherche.
27. Exception DA : « Un décret fixe les conditions dans lesquelles l'exploration des
textes et des données est mise en œuvre, ainsi que les modalités de conservation
et de communication des fichiers produits au terme des activités de recherche pour
lesquelles elles ont été produites ; ces fichiers constituent des données de la
recherche »
Exception BDD : « La conservation et la communication des copies techniques
issues des traitements, au terme des activités de recherche pour lesquelles elles
ont été produites, sont assurées par des organismes désignés par décret. Les autres
copies ou reproductions sont détruites. »
Quelle communication et quelle conservation
pour les « archives du Text et Data Mining » ?
Aucune mention d’une possibilité de « représentation », donc impossible
d’afficher des extraits des contenus reproduits (sauf dans le cadre de
l’exception de courte citation ?)
Enorme faute de grammaire… il faut lire « ils » et
pas « elles », sinon la phrase n’a pas de sens…
28. Ces fichiers constitue des données
de la recherche (cf. article 30) ???
Dès lors que les données issues d'une activité de recherche financée au moins pour moitié
par des dotations de l'Etat, des collectivités territoriales, des établissements publics, des
subventions d'agences de financement nationales ou par des fonds de l'Union européenne ne
sont pas protégées par un droit spécifique ou une réglementation particulière et qu'elles ont
été rendues publiques par le chercheur, l'établissement ou l'organisme de recherche, leur
réutilisation est libre.
L'éditeur d'un écrit scientifique mentionné au I ne peut limiter la réutilisation des données de
la recherche rendues publiques dans le cadre de sa publication.
Les dispositions du présent article sont d'ordre public et toute clause contraire à celles-ci est
réputée non écrite.
Par contre, les fichiers produits dans le cadre de l’exception BDD ne
seraient pas des « données de la recherche » ???
29. Les autres copies ou reproductions
sont détruites ???
Comprendre les copies qui n’auraient pas été transmises à des
organismes de conservation désignés par décret.
Donc les chercheurs ont l’obligation de détruire leurs propres archives…
Réponse du gouvernement sur la plateforme de consultation :
« La voie législative, qui introduirait une nouvelle exception au droit d’auteur, supposerait pour sa
part de mettre en place des garanties permettant de répondre aux inquiétudes des éditeurs, en
particulier face au risque de dissémination des copies numériques. Cette garantie pourrait être
offerte par l’intermédiation d’un tiers de confiance. A cet égard, il est à noter que la Bibliothèque
nationale de France (BnF) s’est d’ores et déjà portée candidate pour jouer un tel rôle. »
Mais ces archives devraient pouvoir être communiquées (seulement sur place dans les
emprises des organismes de conservation désignés ?)
Ressemblerait beaucoup aux conditions de consultations des archives du web à la BnF
30. Quatre cas pratiques de mise en œuvre de
l’exception TDM
Numériser des contenus protégés pour effectuer des
opérations de TDM ?
Exploiter le contenu d’une base de données fournie par un
opérateur commercial pour effectuer des opérations de
TDM ?
Exploiter des données de recherche publiées pour
effectuer des opérations de TDM ?
Exploiter des contenus librement accessibles sur Internet ?
31. Numériser des contenus protégés pour effectuer
des opérations de TDM ?
Possible, mais à condition :
- Que les contenus numérisés soient uniquement des textes ;
- Pour tous les autres type de contenus, des licences devront être signées ;
- Articulable avec l’exception « conservation » dont bénéficient les bibliothèques,
archives et musées ?
A noter :
Pour les œuvres numérisées à des fins de TDM, le décret peut ne pas
imposer le passage obligé par un organisme désigné par décret pour la
conservation.
32. Exploiter le contenu d’une base de données
fournie par un opérateur commercial pour
effectuer des opérations de TDM ?
Possible, mais à condition :
Que la base contienne seulement des textes ;
Ou des données incluses ou associées à des écrits scientifiques
Donc pas des statistiques, des relevés, etc.
Les fichiers doivent être transmis à des organismes de conservation
et les autres copies détruites.
- Mais incertitudes notables sur l’articulation avec les limitations techniques et
contractuelles imposées par le fournisseur de la base.
- Beaucoup plus simple à gérer si acquisition « en dur » des fichiers et pas seulement
d’un accès à la base (ex : licences nationales ISTEX)
33. Exploiter des données de recherche publiées pour
effectuer des opérations de TDM ?
Possible, sur la base de l’article 30 de la loi (notamment à partir des
entrepôts de données de recherche)
Dès que des données de recherche sont publiées, leur réutilisation
est libre (sous réserve de respecter les droits des tiers)
Plus besoin de se référer aux licences de réutilisation, la permission
est donnée par la loi
Valable pour les données publiées dans Huma-Num, Zenodo,
FigShare, Dryad, etc.
Autres sources mobilisables : les très nombreux jeux de données publiques qui vont
être publiés par l’effet du principe « d’Open Data par défaut » instauré par la loi.
34. Exploiter des contenus librement
accessibles sur Internet ?
Possible, mais uniquement :
- Sur des textes (de toute nature)
- Ou des données incluses ou accompagnant des écrits scientifiques.
Va laisser de côté de très nombreux jeux de données accessibles en
ligne.
L’accès libre constitue bien une « source licite », si la mise
en ligne a été effectuée avec l’accord des ayants droit.
35. Exemples : faire du TDM à partir de HAL, de
Persée, de Revues.org ?
Ou de Gallica intra muros ? Ou des archives du web ?
L’exception TDM sera bien
applicable aux contenus
figurant sur ces sites, car il
s’agit bien de « sources
licites »