Lignes directrices OGD

Lignes directrices pour la publication de données en libre accès (lignes directrices OGD)

La stratégie Open Government Data 2019-2023 (stratégie OGD), approuvée fin 2018 par le Conseil fédéral, introduit le principe de la publication en libre accès par défaut (open data by default): à partir de 2020, tous les services fédéraux publient leurs données en libre accès (données publiques ouvertes ou OGD). Les présentes lignes directrices aident les unités de l’administration fédérale à appliquer ce principe.

Au-delà de l’administration fédérale, elles contiennent aussi des informations utiles pour les cantons, les communes, les entreprises parapubliques et d’autres organismes qui souhaitent publier des données d’intérêt général.

Chaque année, le secrétariat OGD examine la pertinence de ces lignes directrices et, au besoin, il les actualise. Les utilisateurs et les fournisseurs de données sont invités à soumettre leurs suggestions au secrétariat Open Government Data.

1. En libre accès par défaut

Dans le cadre des tâches que leur confère la loi, les unités administratives collectent, produisent et gèrent des données, qui sont enregistrées sous forme électronique et regroupées en jeux de données. Ces données, elles les publient en libre accès sur Internet. Les présentes lignes directrices OGD leur indiquent comment s’y prendre.

Les entreprises parapubliques ou des tiers (y compris les acteurs privés assumant des tâches publiques) sont également invités à publier leurs données en libre accès conformément aux présentes lignes directrices.

2. Dispositions relatives à la protection des données

Ne sont pas mises à disposition au titre de données publiques ouvertes, les données ci-après:Ne sont pas mises à disposition au titre de données publiques ouvertes, les données ci-après:

  • Les données dont la publication est restreinte, voire interdite, par d’autres actes législatifs, en particulier celles qui sont protégées par des dispositions de lois spéciales, telles les législations régissant la protection des données, les droits d’auteur, le secret statistique, le secret fiscal, la protection de l’information, les émoluments et les registres officiels;

  • Les données dont la mise à disposition en libre accès passe par un traitement qui mobiliserait des ressources supplémentaires considérables tant matérielles, qu’humaines et techniques.

Schema Arbeitshilfe-Publikation

Impossible de répondre clairement à une des questions? Notre guide Arbeitshilfe vous sera très utile. Actuellement, ce document est uniquement disponible en allemand. Et si vous n’y trouvez pas de réponse, n’hésitez pas à nous écrire.

3. Vue d’ensemble des données existantes

Chaque unité administrative possède un catalogue qui contient des informations de base sur les données qu’elle gère et qui en donne ainsi une vue d’ensemble (inventaire des données). Il convient, dans la mesure du possible, d’inclure ces informations dans les catalogues existants et de mentionner leur existence («Recueil des jeux de géodonnées de base de droit fédéral», p. ex.).

Ce catalogue sera mis à jour au moins une fois par année. L’inventaire des données contiendra obligatoirement les indications suivantes:

  • Titre: titre du jeu de données

  • Description: brève description du contenu du jeu de données

  • Propriétaire des données: nom de l’unité administrative ou de l’organisme fédéral responsable de la mise à disposition des données, de leur qualité, de leur accessibilité et de leur protection conformément aux bases légales et aux prescriptions de l’instance administrative compétente.

  • Catégorie: catégorie à laquelle appartient le jeu de données selon les catégories définies sur opendata.swiss, cf.

    SKOS-RDF

  • Indications concernant le degré d’ouverture des données (valeurs possibles):

    • Données ouvertes (open data): données qui peuvent être réutilisées sans restriction

    • Données à accès restreint (restricted access data): données qui ne peuvent être réutilisées qu’à des conditions particulières (selon les termes de contrats sur la protection des données, p. ex.)

    • Données fermées (closed data): données qui ne peuvent pas être réutilisées

Pour garantir l’interopérabilité des métadonnées, les recueils d’informations doivent se fonder sur la norme eCH-0200 profil d’application DCAT pour les portails de données suisses.

4. Référencer les données sur opendata.swiss

Il incombe aux propriétaires de données définis par les unités administratives de référencer les jeux de données considérés comme «ouverts» dans le catalogue central des données publiques ouvertes suisses (opendata.swiss). Les propriétaires peuvent déléguer cette tâche à d’autres unités ou organismes (intendants des données, p. ex.)

Les métadonnées provenant de portails existants (géoinformation, environnement, portails cantonaux, etc.) seront dans la mesure du possible reprises automatiquement (par «moissonnage»).

Leur référencement sur d’autres sites ou portails Internet est autorisé.

5. Personnes ou services à contacter

À chaque jeu de données correspond une personne ou un service qui a pour tâche d’informer les utilisateurs. Cette instance figurera dans les métadonnées (attributs: nom ou désignation du service et adresse courriel).

6. Conditions d’utilisation uniformes et ouvertes

Les données doivent être régies par les conditions d’utilisations standards d’opendata.swiss (https://opendata.swiss/fr/terms-of-use/).

Les seules restrictions possibles sont les suivantes:

7. Données et modèles de données lisibles par machine

L’un des principaux objectifs de la publication en libre accès de données (publiques) est de permettre à des machines de les traiter aisément et d’éviter notamment les erreurs d’affectation et de formatage qui peuvent se produire lors de la lecture de textes ou d’informations proposées au format PDF. Cette mise à disposition évite ainsi un travail disproportionné aux utilisateurs des données.

À cet effet, les fournisseurs veillent à mettre les données à disposition dans un format ouvert, lisible par machine et normalisé, comme csv ou XML, ou dans des formats répandus, courants et acceptés par la communauté des utilisateurs. Il convient de se référer ici au niveau trois étoiles du «programme de déploiement en cinq étoiles pour les données ouvertes» (https://5stardata.info/fr).

Les fournisseurs de données garantissent par ailleurs que la structure des données soit lisible par machine et qu’une explication des variables (modèle de données) existe sous forme lisible par machine.

Les données doivent dans la mesure du possible être mises à disposition via des interfaces lisibles par machine (cf. https://api3.geo.admin.ch et https://lindas.admin.ch, p. ex.), qui offrent une flexibilité maximale pour la gestion et l’utilisation des données.

8. Données brutes

Dans la mesure où le mandat légal ne prévoit pas autre chose (agrégation des données pour assurer leur protection, p. ex.) ou que les utilisateurs n’exigent pas explicitement des données agrégées (des cartes, p. ex.), les données doivent si possible être publiées sous forme brute. Cette règle vise à assurer un maximum de liberté et d’efficacité dans leur traitement et leur réutilisation.

9. Données complètes

On ne publiera si possible que des jeux de données complets. Dans la mesure du possible, il faut éviter de fragmenter les données (extraits, bribes ou aperçus, etc.) lors de la publication.

Lorsqu’un fournisseur de données publie, pour des raisons techniques ou légales, des données incomplètes ou non approuvées, il doit le signaler soit dans les métadonnées soit dans une autre description.

Les jeux de données publiés doivent dans la mesure du possible s’accompagner d’un contrôle de version approprié (date ou numéro de la version dans le titre de la ressource).

10. Données actuelles

Les données mises à la disposition du public doivent être aussi récentes que possible, c’est-à-dire publiées dès qu’elles ont été collectées et compilées.

11. Données contextualisées

Les données publiées doivent être suffisamment «contextualisées», c’est-à-dire décrites assez clairement pour permettre leur réutilisation, notamment par des utilisateurs extérieurs à l’administration. À cet effet, la publication des données comprendra également les métadonnées de base (voir en particulier la norme DCAT-AP CH), ainsi que les formules et les explications relatives au calcul des données, autant que possible dans un format lisible par machine. Des références à d’autres objets de données devraient se retrouver dans les jeux de données des fournisseurs correspondants.

12. Autres types de publications

Afin d’illustrer le contexte de leur utilisation, d’autres types de publications peuvent accompagner les données mises à disposition dans un format lisible par machine. Il peut s’agir d’images, de graphiques ou de rapports établis sur la base des données brutes, voire de données agrégées.

13. Accès illimité

L’accès aux données publiées doit être aisé et sans obstacles. Il convient d’éviter que des obstacles physiques (nécessité de se rendre personnellement dans un bureau donné ou obligation de procéder à certaines démarches, p. ex.) ou techniques (accès via des masques à remplir ou des systèmes exigeant le recours à certaines technologies de navigation comme Flash, JavaScript, Cookies ou Applets Java, p. ex.) entravent l’accès aux données. Pour favoriser la diffusion des données, il est possible de prévoir plusieurs moyens d’accéder à un jeu de données (deux formats, p. ex., accès par téléchargement et via une API).

Seule exception: l’obtention d’une autorisation pour une utilisation à des fins commerciales (cf. conditions d’utilisation opendata.swiss avec la restriction «ASK»), conformément à la directive 6.

14. Accès non discriminatoire

Les données publiées doivent être accessibles de façon non discriminatoire: quiconque doit pouvoir accéder aux données en tout temps, sans devoir s’identifier ou justifier ses actes.

Seule exception: l’obtention d’une autorisation pour une utilisation à des fins commerciales (cf. conditions d’utilisation opendata.swiss avec la restriction «ASK»), conformément à la directive 6.

Si l’inscription de l’utilisateur devait s’avérer nécessaire pour des raisons techniques (accès via une API, p. ex.), elle devrait être réalisable en l’espace de 10 minutes au moyen d’une solution self-service.

15. Données faciles à trouver

Les données publiées sont mises à disposition de telle sorte qu’il soit facile de les trouver sur Internet. Les moteurs de recherche doivent en particulier pouvoir les indexer facilement. Les mots-clés doivent pouvoir être saisis dans deux langues nationales au moins.

16. Données accessibles d’un seul clic

Les données ou des parties d’entre elles sont référencées de sorte que le lien mène directement à ces données (one click to data). Dans la mesure du possible, il faudrait créer un permalien vers les données actuelles.

17. Téléchargement de masse

Le jeu de données doit pouvoir être téléchargé en une fois dans sa totalité (bulk download), sauf si ce procédé n’est techniquement pas utilisable ou qu’il exige trop de ressources (trop grand volume de données ou durée de traitement trop longue, p. ex.).

18. Données ouvertes liées (linked open data)

Dans le cas de registres centraux ou de vocabulaires contrôlés (recueils de désignations [vocabulaires] auxquelles sont affectés des termes uniques, sans homonymes possibles), il convient d’étudier et, si possible, d’appliquer la possibilité de publier les données sous la forme de données ouvertes liées.