Vérifier les exigences techniques
Sous quel format mon jeu de données doit-il être mis à disposition?
Le format des ressources, à savoir les données physiques, joue un rôle primordial pour la publication de données publiques ouvertes. Est-il approprié? Lisez nos recommandations.
Contexte
opendata.swiss a notamment pour objectif de fournir les données dans des formats ouverts et lisibles par machine. À cet effet, nous avons adopté les 5 étoiles du modèle de Tim Berners-Lee et visons une publication dans la catégorie 3 étoiles. La catégorie 2 étoiles répond aux exigences de base. Concrètement, pour les données fournies sous forme de tableaux p. ex., cela signifie qu’elles seront mises à disposition au format CSV, un format plus pratique pour les programmeurs que les fichiers Excel. S’il n’est pas possible de publier les données au format CSV, utiliser le format XLS, à condition toutefois de garantir la lisibilité machine.
Formats
Au final, c’est au fournisseur des données de décider du format. Nous l’invitons à prendre en compte les spécifications et recommandations suivantes:
Nous incitons les fournisseurs de données à choisir des formats ouverts et non propriétaires. –> Voir le niveau 3 étoiles du «Programme de déploiement en 5 étoiles pour l’Open Data»
Exigence minimale: publication de données dans un format structuré et lisible par machine. –> Voir le niveau 2 étoiles du «Programme de déploiement en 5 étoiles pour l’Open Data»
Nous recommandons de publier les données via une API, ce qui en simplifie la gestion.
La publication de données ouvertes liées (Linked Open Data) doit être tout particulièrement envisagée pour les données des registres de base ou centraux. Pour ce type de publication, on utilise des modèles de données partagées (ou ontologies) pour relier les données au-delà des frontières de l’organisation. Tant les fournisseurs que les utilisateurs des données bénéficient alors d’effets de réseau majeurs.
Vous trouverez ici une liste des formats recommandés par opendata.swiss. Si votre format de fichier n’y figure pas, n’hésitez pas à prendre contact avec nous. Nous vous aidons volontiers à choisir le format approprié. Vous pouvez également compter sur notre soutien si vous offrez un service de données, p. ex. une interface API, et que vous ne savez pas comment associer votre service à des jeux de données. Prenez contact avec nous.
Autres exigences techniques
Données aussi brutes que possible. Si nécessaire, anonymiser les données publiées et les compléter des métadonnées fondamentales. Éviter de publier des données agrégées, analysées et traitées, à moins que cette solution s’impose pour des raisons de protection des données p. ex.
Données complètes. Ne publier que des données complètes, la publication d’extraits («snippets» ou «previews») n’est pas conforme aux consignes en matière d’OGD.
Données actuelles. Les jeux de données mis à la disposition du public durant un temps donné doivent être aussi à jour que possible. Ces données sont publiées dès qu’elles ont été collectées et compilées. Les données disponibles en temps réel sont, dans la mesure du possible, mises à disposition via une interface de programmation d’application (API).
Données contextualisées. Les données sont publiées de manière suffisamment «contextualisée», autrement dit elles sont suffisamment décrites pour permettre leur réutilisation, notamment par des utilisateurs extérieurs à l’administration. À cet effet, veiller à publier en même temps que les données, les métadonnées fondamentales (voir en particulier la norme DCAT-AP CH, ainsi que les formules et les explications relatives au calcul des données, autant que possible dans un format lisible par machine.
Accès illimité. Rendre les données accessibles facilement et sans obstacles, en évitant tout obstacle physique ou technique. Seule exception: la demande d’une autorisation pour utilisation à des fins commerciales (voir conditions d’utilisation avec la restriction «Ask»).
Accès non discriminatoire. Les données publiées doivent être accessibles facilement et de façon non discriminatoire: chacun doit pouvoir accéder aux données en tout temps, sans devoir s’identifier ou justifier ses actes. Seule exception: la demande d’une autorisation pour utilisation à des fins commerciales (voir conditions d’utilisation avec la restriction «Ask»).
Données faciles à trouver. Les données sont référencées et publiées sur opendata.swiss de manière à pouvoir être indexées de façon optimale par d’autres moteurs de recherche.
Données accessibles d’un seul clic. Les données sont référencées de sorte que le lien mène directement à elles («one-click to data»).
Téléchargements de masse. Les données doivent être compatibles avec les téléchargements de masse («bulk download»).
Données clairement identifiables. Une symbolique uniforme doit permettre de clairement identifier les différentes versions.
Bonnes pratiques
Les liens suivants renvoient vers les bonnes pratiques en matière de publication d’OGD.
Support
Avez-vous des questions sur les formats et les exigences techniques? Écrivez-nous.
Informations complémentaires
Linked Open Data – Eine Einführung in das Thema Linked Open Data
Formats standards pour les ressources documentent tous les formats pour les ressources et contient des liens vers leurs définitions
En plus de répondre aux exigences légales et techniques, vous devez aussi veiller au respect des exigences organisationnelles ou liées aux procédures. Cette approche est indispensable pour garantir en tout temps une publication durable et efficace des données.