Metadaten mit Harvester hochladen

Wie lade ich meine Metadaten mittels Harvester hoch?

Mit einem Harvester lassen sich grössere Datenmengen einfach und schnell publizieren. Es bedeutet, dass Ihre Datasets automatisch durch opendata.swiss angezogen und aktualisiert werden können, der Aufwand für die Datenpflege reduziert sich für Sie. Voraussetzung dafür ist, dass Ihre Organisation mitsamt Benutzerinnen und Benutzern registriert ist. Dies erfolgt in Absprache mit der Geschäftsstelle OGD. Wir erklären Ihnen hier, wie das sogenannte Harvesting funktioniert.

Die Schritte auf einen Blick

Gut zu wissen

Sollten Sie zum ersten Mal Daten publizieren, führen wir Sie durch den Prozess und unterstützen Sie dabei, die korrekte Übermittlung und Darstellung Ihrer Daten sicherzustellen, unabhängig von der Publikationsvariante.

Alle Schritte im Detail

Harvester einrichten

Wenn Sie Ihre Daten im Standard DCAT-AP-CH bereitstellen können, übernehmen wir das Einrichten des Harvesters für Sie. Sie müssen nichts weiter tun, als uns die URL mit dem Katalog-Endpunkt zu übermitteln. In speziellen Fällen, zum Beispiel wenn ein Datenkatalog nicht im DCAT-AP-CH Standard geliefert werden kann, kann ein spezifisches Mapping definiert werden. Bitte kontaktieren Sie uns hierfür.

Gut zu wissen

Pro Organisation wird jeweils ein Endpunkt für das Harvesten benötigt. Falls Sie also Daten von mehreren Organisationen verwalten, benötigen wir auch mehrere Endpunkte. Beachten Sie beim Vorbereiten Ihres Datenkatalogs die besondere Struktur des Dataset-Identifiers, die im Standard DCAT-AP-CH (Link, englisch) beschrieben ist und für jede Organisation individuell ist.

Katalog-Endpunkt übergeben

Senden Sie uns hierfür eine E-Mail mit der URL, unter der wir Ihren Datenkatalog herunterladen können. Diese URL ist gleichzeitig ein RDF-Endpunkt.

Wichtig: Der Datenkatalog muss im Format DCAT-AP-CH vorliegen.

Katalog-Endpunkt mit Paginierung übergeben

<hydra:PagedCollection rdf:about="http://opendata.swiss/catalog.xml?page=3">
  <hydra:lastPage>http://opendata.swiss/catalog.xml?page=4</hydra:lastPage>
  <hydra:itemsPerPage rdf:datatype="http://www.w3.org/2001/XMLSchema#integer">1000</hydra:itemsPerPage>
  <hydra:totalItems rdf:datatype="http://www.w3.org/2001/XMLSchema#integer">3479</hydra:totalItems>
  <hydra:firstPage>http://opendata.swiss/catalog.xml?page=1</hydra:firstPage>
  <hydra:previousPage>http://opendata.swiss/catalog.xml?page=2</hydra:previousPage>
</hydra:PagedCollection>

Falls Ihr Datenkatalog zu gross ist und nicht in einer einzigen Anfrage übermittelt werden kann, besteht die Möglichkeit, ihn seitenweise zu übergeben. Dafür empfehlen wir die Paginierung mit dem Hydra Vocabulary zu implementieren. Senden Sie uns abschliessend eine E-Mail mit der entsprechenden URL.

Harvesting testen

Das Harvesting von Datasets im DCAT-AP-CH Standard wird von uns für Sie getestet. Nachdem wir Ihre URL erhalten und den Harvester eingerichtet haben, lassen wir ihn auf Ihrem Endpunkt in der Abnahmeumgebung laufen. Bei allfälligen Fehlern melden wir uns bei Ihnen, sodass Sie diese an Ihrem Katalog-Endpunkt korrigieren können. Geben Sie uns Bescheid, sobald die Fehler behoben sind und schon beginnt unser nächster Testlauf. Bitte beachten Sie, dass die Daten, die per Harvesting importiert werden, nicht im Backend angezeigt werden.

Datenkatalog veröffentlichen

Organisation im Frontend von opendata.swiss

Nach einer abschliessenden Prüfung Ihrer Datasets richten wir das Harvesting für Sie in der Produktionsumgebung ein. Kontaktieren Sie uns, um das Go-Live gemeinsam zu planen.

Dataset im Frontend von opendata.swiss

Beispielansicht eines publizierten Datasets

Support

Sie haben eine Frage zum Harvester? Schreiben Sie uns und wir helfen Ihnen gerne weiter.

Mehr zum Thema