Open DataOutilsProjetsCommunauté

Licences Open Data : ODbL, CC0, Etalab et Choisir la Bonne Licence

Ce que recouvre réellement une licence open data

Une licence open data n'est pas qu'un document juridique annexe. C'est le contrat qui définit précisément ce que vous pouvez faire avec un jeu de données : le redistribuer, le modifier, l'intégrer dans un produit commercial, le croiser avec d'autres sources.

Sans licence explicite, toute donnée publiée reste protégée par défaut par le droit d'auteur ou le droit sui generis des bases de données. L'absence de licence ne signifie pas liberté d'usage. C'est souvent l'inverse.

Trois licences dominent aujourd'hui l'écosystème francophone et international : la CC0, l'ODbL et la Licence Ouverte Etalab. Chacune repose sur une philosophie différente et entraîne des obligations distinctes pour les réutilisateurs.


La CC0 : la liberté maximale, sans conditions

Principe et portée juridique

La CC0 (Creative Commons Zero) est techniquement un acte de renonciation au droit d'auteur, pas une licence à proprement parler. Le producteur de données renonce à l'ensemble de ses droits patrimoniaux dans toutes les juridictions où la loi le permet.

Résultat concret : l'utilisateur peut copier, modifier, commercialiser et redistribuer les données sans attribution, sans condition, sans réciprocité. C'est l'équivalent légal du domaine public appliqué aux données.

Qui l'utilise et pourquoi

La CC0 est massivement adoptée par les institutions scientifiques : GBIF (données de biodiversité), Wikidata, la plupart des portails de données gouvernementaux américains. Elle supprime toute friction juridique et maximise la réutilisation.

Son inconvénient est précisément son avantage : aucun retour n'est exigé des réutilisateurs. Une entreprise peut s'approprier les données, les enrichir et les revendre sans aucune obligation de partage. Pour les producteurs qui souhaitent un effet de réciprocité, la CC0 ne convient pas.


L'ODbL : la réciprocité au centre du modèle

Structure et obligations concrètes

L'Open Database License (ODbL), développée par l'Open Knowledge Foundation, impose trois obligations cumulatives :

  • Attribution : toute utilisation doit mentionner la source originale
  • Partage à l'identique (ShareAlike) : toute base de données dérivée doit être publiée sous ODbL
  • Conservation : si vous diffusez une version fermée, une version ouverte de la base doit rester accessible

Le ShareAlike est le pilier de l'ODbL. Il crée un « copyleft des données » : toute valeur ajoutée sur la base revient dans le commun.

Distinction base de données / contenu produit

L'ODbL opère une distinction technique notable : elle s'applique à la base de données comme structure, pas nécessairement aux contenus produits à partir de celle-ci.

Une application cartographique qui exploite des données ODbL peut conserver son code source propriétaire. En revanche, si elle exporte une base de données dérivée, cette base doit être publiée sous ODbL. Cette nuance ménage un équilibre entre usage commercial et protection des communs.

OpenStreetMap en est l'exemple le plus visible : ses données géographiques sont sous ODbL depuis 2012, ce qui autorise les usages commerciaux tout en obligeant les dérivés cartographiques à rester ouverts.

Limites et complexités

L'ODbL génère des frictions dans les projets multi-sources. Combiner des données ODbL avec des données sous licence incompatible, certaines Creative Commons par exemple, crée des conflits juridiques difficiles à trancher.

La notion de « base dérivée » reste floue dans certains cas d'usage : à partir de quand une analyse statistique agrégée devient-elle un dérivé soumis au ShareAlike ? Les juristes ne s'accordent pas. C'est un angle mort réel de la licence.


La Licence Ouverte Etalab : le standard français

Contexte et adoption

La Licence Ouverte (LO) Etalab a été créée en 2011 par la mission Etalab, opérateur du portail data.gouv.fr. Sa version 2.0, publiée en 2017, est alignée sur le standard international IODL et compatible avec plusieurs licences Creative Commons.

Elle est devenue la référence pour les données publiques françaises après la loi pour une République Numérique (2016), qui oblige les administrations à publier leurs données réutilisables sous licence ouverte. La LO Etalab y est explicitement citée comme licence de référence.

Ce qu'elle permet et ce qu'elle exige

La Licence Ouverte est très permissive. Elle autorise la reproduction, la distribution, l'adaptation, la transformation et l'exploitation commerciale sans restriction.

En échange, une seule obligation : mentionner la paternité des données (source, date de mise à disposition, lien vers la licence). Pas de ShareAlike, pas d'obligation de republier les dérivés.

Positionnement par rapport à la CC0 et à l'ODbL

La LO Etalab occupe une position intermédiaire claire. Elle est plus contraignante que la CC0 (attribution obligatoire) mais bien moins exigeante que l'ODbL (pas de réciprocité). Elle favorise l'adoption large tout en maintenant une traçabilité minimale des données publiques.

Sa compatibilité déclarée avec Creative Commons BY 4.0 facilite les usages dans des contextes internationaux, avantage concret pour les projets qui agrègent des données de sources multiples.


Comparer les trois licences : tableau de décision

| Critère | CC0 | LO Etalab | ODbL | |---|---|---|---| | Attribution requise | Non | Oui | Oui | | Usage commercial | Libre | Libre | Libre | | Partage à l'identique | Non | Non | Oui (base) | | Compatibilité multi-sources | Maximale | Élevée | Complexe | | Adoption institutionnelle FR | Partielle | Dominante | Spécifique |


Comment choisir la bonne licence

Trois questions à se poser avant de décider

Souhaitez-vous contrôler les dérivés ? Si l'objectif est de garantir que tout enrichissement de vos données reste dans le commun, l'ODbL est la seule option parmi les trois. C'est le choix cohérent pour des projets collaboratifs comme OpenStreetMap ou des infrastructures de données citoyennes.

Vos données sont-elles issues du secteur public français ? Dans ce cas, la Licence Ouverte Etalab répond aux exigences légales issues de la loi pour une République Numérique, simplifie la conformité et ne crée pas de barrières pour les réutilisateurs publics ou privés.

Visez-vous une adoption internationale ou des usages scientifiques ? La CC0 élimine toute incertitude juridique et supprime les frictions de compatibilité. Pour des données de recherche, des jeux de données de référence ou tout contenu destiné à être massivement réutilisé dans des contextes variés, c'est l'option la plus simple.

Les pièges à éviter

Mélanger des licences incompatibles est l'erreur la plus fréquente. Des données ODbL croisées avec des données CC BY-NC (non commerciale) produisent un jeu de données hybride dont le statut juridique est indéfini. Avant tout projet d'agrégation, cartographier les licences des sources n'est pas optionnel.

Choisir une licence non reconnue est un risque réel. Des licences maison ou des formulations vagues du type « données librement utilisables » ne créent aucune sécurité juridique. Seules les licences standardisées et éprouvées offrent une base solide.

Ignorer le droit sui generis des bases de données est une erreur propre au droit européen. Une base de données peut être protégée indépendamment du droit d'auteur sur son contenu, même si ce contenu est factuel. La CC0 et l'ODbL traitent explicitement ce point dans leur texte juridique.

La dimension pratique : documenter et signaler

Choisir une licence ne suffit pas. Elle doit figurer dans les métadonnées de chaque jeu de données, rester accessible via un lien stable pointant vers le texte complet, et rester cohérente entre la déclaration du portail et les fichiers téléchargeables.

Sur data.gouv.fr, ce signalement est intégré au formulaire de dépôt. Sur des portails tiers ou des dépôts GitHub, c'est au producteur de vérifier que l'information est non ambiguë. Un jeu de données sans licence clairement identifiable sera écarté par des équipes data prudentes sur le plan juridique.


L'évolution du paysage des licences open data

Le mouvement open data n'est pas figé. Plusieurs tendances se dessinent : la pression pour standardiser autour d'un nombre réduit de licences reconnues, les questions liées à l'IA (les modèles entraînés sur des données ODbL sont-ils des « dérivés » ?), et l'émergence de licences propres à certains secteurs comme la santé ou la mobilité.

La question des licences pour les données d'entraînement des modèles de langage reste particulièrement ouverte. Aucune des trois licences présentées n'a été rédigée en anticipant cet usage, et les interprétations divergent selon les organisations.

Suivre les évolutions jurisprudentielles et les mises à jour des textes de licence fait partie de la rigueur attendue de tout producteur ou réutilisateur de données ouvertes sérieux. La LO Etalab en est déjà à sa version 2.0.