6. Licences Ouvertes et Formats de Fichiers
De quoi parle t-on ?
Une licence est un document juridique qui confère à un utilisateur des droits spécifiques pour réutiliser et redistribuer un contenu sous certaines conditions. Quand un droit n'est pas accordé par défaut par le concédant via la licence, il peut être demandé. Une licence peut s'appliquer à tout type de contenu (par exemple : son, texte, image, multimédia, logiciel) pour lequel des droits d'exploitation ou d'utilisation existent.
Les licences d'œuvre libres sont des licences autorisant l'accès, la réutilisation et la redistribution d'une œuvre avec peu ou pas de restrictions. Ces licences varient de très ouvertes à très restrictives. Plus les restrictions sont nombreuses, plus il devient difficile de combiner des contenus publiés sous des licences différentes. Cela peut par conséquent faire obstacle à l'interopérabilité.
Un format de fichier est un moyen standard par lequel des informations sont codées pour être stockées dans un fichier informatique ; cependant, les formats ne disposent pas tous de documents de spécification en libre accès, en partie parce que certains développeurs considèrent que cette documentation relève du secret commercial.
Fondement
Attribuer une licence ouverte à un travail scientifique (qu'il s'agisse d'un article, d'un jeu de données ou d'un autre type de production scientifique) permet au titulaire du droit d'auteur d'établir les conditions dans lesquelles son travail peut être consulté, réutilisé et modifié.
Il est important de savoir qu'une licence s'appuie sur la législation existante en matière de droit d'auteur. En d'autres termes : il n'est possible d'attribuer une licence à un contenu que si l'on est le titulaire des droits de celui-ci, et il n'est pas possible de conditionner par une licence toute forme de réutilisation qui ne s'inscrirait pas dans les règlementations existantes sur le droit d'auteur.
Pour partager un contenu ouvert, il ne suffit pas d'y joindre une licence, il faut également prendre en compte son format. Le choix d'un format de fichier non ouvert peut rendre impossible la réutilisation du contenu. C'est pourquoi il est important de connaître les options disponibles au moment de décider dans quel format on souhaite partager son contenu.
Objectifs de la formation
Faire découvrir aux participants les différences entre les licences et de quelle manière elles peuvent s'adapter à certaines définitions et aux exigences de la science ouverte, ou encore de quelle manière elles s'intègrent à différents résultats de la recherche.
Découvrir les différents éléments qui constituent les licences, comme l'attribution, l'utilisation (non-)commerciale, la modification, etc.
Apprendre l'importance de définir qui détient le droit d'auteur ou les droits liés aux résultats de la recherche.
Apprendre les différences entre formats de fichier propriétaires et ouverts, et comment ceux-ci peuvent empêcher ou au contraire faciliter la réutilisation et l'interopérabilité
Éléments clés
Connaissances & Compétences
Les concepts de base du droit d'auteur sont nécessaires pour comprendre le fonctionnement des licences. Les lois sur le droit d'auteur n'étant pas harmonisées au niveau international, il convient de se référer aux lois en vigueur dans son contexte.
Parmi les différentes licences d'œuvre libre, on trouve les licences de partage à l'identique (copyleft), issues de la communauté du logiciel libre, qui permettent une large réutilisation des œuvres, à condition que toute nouvelle œuvre créée à partir d'une œuvre existante soit soumise à la même licence. Cela a entraîné des problèmes d'interopérabilité que les nouvelles versions ont résolu en stipulant que les contenus dérivés devaient être licenciés sous les mêmes conditions que la licence originale.
Les licences les plus utilisées pour les productions scientifiques sont les licences Creative Commons. En général, une licence CC BY (ne nécessitant que l'attribution) est une bonne option pour les œuvres telles que les articles, les livres, les documents de travail et les rapports, tandis qu'une utilisation du domaine public en utilisant CC Zero (CC0) est recommandée pour les jeux de données et les bases de données (Note : aux États-Unis et dans l'Union européenne, les faits individuels ne sont pas protégés par le droit d'auteur, bien que les compilations de faits ayant été l'objet d'une sélection ou d'une organisation créative, peuvent l'être. En outre, dans l'Union européenne, il existe un droit sui generis accordé au producteur d'une base de données en raison de l'investissement réalisé pour sa conception, même lorsque cette dernière n'a impliqué aucune créativité). Les licences Creative Commons ne devraient pas être utilisées pour les logiciels parce qu'elles n'ont pas été conçues à cette fin, comme le déclare l'organisation. Les développeurs de logiciels devraient plutôt utiliser des licences appropriées comme celles rassemblées par l'Open Source Initiative ou la Free Software Foundation. Vous pouvez vérifier les options possibles sur choosealicense.
CC0 a été créé à l'origine comme un outil juridique permettant de diffuser sans aucune restriction des bases de données scientifiques, et surtout de surmonter les différents traitements de la protection juridique lors de la publication d'une base de données. CC0 a été considéré comme un outil permettant de faire entrer des œuvres dans le domaine public mais il est plus qu'une simple renonciation. CC0 est un instrument en trois étapes, conçu pour permettre son utilisation dans les juridictions où une pleine affectation au domaine public n'est pas possible (par exemple dans de nombreux pays d'Europe continentale). Premièrement, en utilisant CC0, le titulaire du droit d'auteur renonce à tous ses droits dans la limite autorisée par la loi en vigueur. Deuxièmement, s'il reste le moindre droit auquel il est impossible de renoncer, CC0 agit comme une licence pour accorder l'un de ces droits restants sans aucune restriction ou obligation. Enfin, le titulaire du droit d'auteur affirme ne faire valoir aucun des droits auxquels il lui est impossible de renoncer ou qu'il ne peut accorder en vertu de la loi en vigueur. L'idée derrière CC0 est de convaincre les chercheurs de suivre les normes de la communauté au lieu d'utiliser des licences pour des productions comme une base de données dont le contenu, dans de nombreux cas, se situe hors du champ du droit d'auteur.
En tant que formateur, vous pouvez montrer les différences entre les licences et de quelle manière celles-ci peuvent s'adapter à certaines définitions et aux exigences de la science ouverte, ou encore de quelle manière elles s'intègrent à différents résultats de la recherche. En fonction des connaissances préalables de votre public, vous pouvez donner un aperçu des différents éléments constitutifs (attribution, utilisation (non-)commerciale, modification, etc.) des licences en général ou fournir une analyse détaillée de chaque élément et de ses effets sur la réutilisation et l'interopérabilité. Comme les règles en matière de droits d'auteur varient considérablement d'une juridiction à l'autre (pays de Common Law ou de droit civil, mais aussi au sein de l'Union européenne), la facilité d'utilisation des licences peut varier considérablement. Cela peut faire l'objet d'une discussion détaillée si l'auditoire a des connaissances préalables sur les licences, mais pas s'il est relativement novice sur le sujet.
Voici les éléments de base propres aux licences à prendre en compte (tirés du Data Packaging Guide).
Choisir une licence ouverte.
Indiquer la licence choisie de manière claire et visible, de préférence dans un format lisible par une machine.
Expliquer les autorisations/limitations de la licence choisie, et les barrières ou restrictions qui peuvent s'appliquer.
Permettre aux utilisateurs de savoir où ils peuvent trouver plus d'information sur cette licence.
Expliquer que la licence s'applique aux données et non au contenu que les données représentent. En effet, une licence ouverte sur les métadonnées n'implique pas que le contenu lui-même soit ouvert, en dehors du champ du droit d'auteur, ou utilisable librement.
Expliquer pourquoi cette licence a été choisie.
La formation devrait donner un aperçu des politiques en matière de propriété intellectuelle dans les universités et les instituts de recherche publics. Il est important de souligner la nécessité de définir qui détient les droits d'auteur ou tous autres droits liés aux résultats de la recherche. Le détenteur des droits d'auteur est celui qui peut décider de lever les restrictions si elles ne sont pas levées par défaut par les licences. En ce qui concerne les résultats de la recherche, le détenteur des droits d'auteur peut être un chercheur, un éditeur, une société scientifique, un institut de recherche, un bailleur de fonds, etc.
Dans le contexte de la science ouverte, et pour un archivage optimal à long terme, les fichiers ne doivent être ni compressés ni produits dans des formats propriétaires ou protégés par des brevets. Il est nécessaire de favoriser les formats ouverts s'appuyant sur des normes documentées. Cela permet de garantir l'accès et la réutilisation du contenu. Seuls les fichiers non cryptés doivent être publiés et archivés. Voici des exemples de formats de fichiers ouverts :
Texte : TXT, ODT, PDF/A, XML ;
Données tabulaires : CSV, TSV ;
image: TIFF, PNG, JPG 2000, SVG, WebP ;
Audio : WAV, FLAC, OPUS ;
Vidéo : MPEG2, Theora, VP8, VP9, AV1, Motion JPG 2000 (MJ2),
Données binaires dans un format de données hiérarchique (HDF - Hierarchical Data Format) : HDF5
Bien que ne pouvant pas être convertis en formats ouverts, certains formats de fichiers sont néanmoins archivés. Ils sont souvent spécifiques à un appareil, mais ont une large communauté d'utilisateurs. Vérifiez si l'entrepôt dans lequel vous voulez déposer une publication possède une liste de formats préférés.
Questions, obstacles et idées fausses reçues
Q : "Pourquoi devrais-je utiliser la licence CC-BY pour mon contenu écrit/de création ?
R : La licence CC-BY est la licence la plus permissive qui préserve également certains droits pour les créateurs - la seule exigence est que la personne qui utilise, modifie ou distribue le contenu, l'attribue au créateur original. Les autres attributs des licences Creative Commons sont les suivants : pas de dérivés (ND), non commercial (NC) et partage à l'identique (SA), qui ajoutent des restrictions supplémentaires susceptibles de limiter l'utilisation et l'impact potentiels de votre travail. Empêcher les productions dérivées avec l'attribut ND limite fortement l'impact et l'utilisation de votre travail, puisque personne d'autre ne pourra construire sur ce que vous avez fait. De même, alors que de nombreux chercheurs peuvent préférer la limitation de l'attribut NC pour empêcher les entreprises de commercialiser ou de faire des profits avec leur travail, définir strictement l'utilisation commerciale est un défi. En outre, l'intention d'une grande partie de la recherche financée par des fonds publics est de conduire au développement économique par une utilisation commerciale (finale), ce qui serait empêché par cette licence. L'utilisation d'une licence SA permet la réutilisation et la distribution, mais exige que les travaux dérivés appliquent la même licence, ce qui limite l'utilisation et la combinaison avec d'autres travaux.
Une crainte fréquente lors de l'utilisation de la CC0 est que l'exigence d'attribution soit abandonnée ; cependant, les partisans de cette licence affirment que l'attribution est un élément clé de la bonne pratique scientifique, indépendamment du statut de droit d'auteur stipulé par la licence de l'œuvre citée. Certains entrepôts qui appliquent la CC0 mentionnent explicitement l'attribution, comme par exemple Dataverse : "Les normes de notre communauté ainsi que les bonnes pratiques scientifiques attendent que l'attribution soit dûment mentionnée par le biais de la citation. Veuillez utiliser la citation de données ci-dessus, générée par le Dataverse".
Obstacle : les différents pays ont des législations différentes en matière de droit d'auteur, ce qui peut limiter la possibilité de choisir une licence ou de verser un travail dans le domaine public. Par exemple, en Allemagne et dans d'autres pays européens, il n'est pas possible de renoncer totalement au droit d'auteur. En conséquence, verser totalement un travail dans le domaine public n'est alors pas légalement possible. Au lieu de cela, la licence CC0 peut être utilisée comme une licence "effective" du domaine public permettant une utilisation sans restriction.
Interopérabilité des licences : soyez conscient de ce que parfois, lorsque vous mélangez des contenus sous licences différentes, il peut s'avérer impossible de diffuser l'œuvre dérivée. Par exemple, le contenu distribué avec une licence SA ne peut être combiné qu'avec d'autres contenus sous licence SA.
Adéquation des licences : les licences CC ne doivent par exemple pas être utilisées pour les logiciels. Il existe également des licences spécifiques pour les bases de données (Open Data Commons), et les licences CC n'étaient pas adaptées aux bases de données avant la version 4.0.
Acquis de la formation
Etre capable d'utiliser les ressources existantes pour choisir une licence appropriée pour les travaux de recherche écrits, en fonction de la liberté/limitation d'utilisation/de réutilisation que l'on souhaite accorder à d'autres utilisateurs.
Etre capable d'utiliser les ressources existantes pour choisir une licence appropriée pour les données, en fonction de la liberté/limitation d'utilisation/de réutilisation que l'on souhaite accorder à d'autres utilisateurs.
Lectures complémentaires
Creative Commons License Picker. creativecommons.org
How to License Research Data. dcc.ac.uk
Klimpe (2012). Free knowledge thanks to Creative Commons Licenses - Why a non-commercial clause often won't serve your needs. Original PDF in German, English translation PDF
Kreutzer (n.y.). Validity of the Creative Commons Zero 1.0 Universal Public Domain Dedication and its usability for bibliographic metadata from the perspective of German Copyright Law. PDF
List of open formats. Wikipedia
Open Content - A Practical Guide to Using Creative Commons Licences/The Creative Commons licencing scheme. meta.wikimedia.org
Open Definition. Licenses. opendefinition.org
Open Source Licensing. opensource.org/licenses
Redhead (2012). Why CC-BY?. Open Access Scholarly Publishers Association. oaspa.org/why-cc-by
World Intellectual Property Organization. Universitites and Intellectual Property. wipo.int
+ 2023
CoopIST - Connaître et utiliser les licences Creative Commons https://coop-ist.cirad.fr/etre-auteur/utiliser-les-licences-creative-commons/1-droits-d-auteurs-et-droit-des-bases-de-donnees
Guide des licences ouvertes, DoRANum https://view.genial.ly/6273836ed008880011a06050/guide-prodvg-guide-licences
- Format ouvert ou fermé ? DoRANum https://doranum.fr/stockage-archivage/quiz-format-ouvert-ou-ferme_10_13143_mcwq-qs64/
- Licences de réutilisation : data.gouv.fr https://www.data.gouv.fr/fr/pages/legal/licences/