Daten suchen

Wie finde ich die Daten, die ich brauche?

Um Ihnen die Suche nach Daten zu erleichtern, bietet opendata.swiss ein Suchfeld an sowie Filtermöglichkeiten. Sie können einfache Suchanfragen stellen oder mittels sogenannter Abfragesyntax (Querysyntax) komplexere Suchanfragen formulieren. Diese Seite erklärt, wie die Suche funktioniert, erläutert die Abfragesyntax und stellt hilfreiche Beispiele zur Verfügung.

Sie können nach Datasets auf der Einstiegsseite von opendata.swiss oder unter der Rubrik Daten suchen. Auf der Organisationsseite können Sie nach Organisationen suchen. Wenn Sie an Beispielen für die Wiederverwendung von Open Government Data interessiert sind, finden Sie unter der Rubrik Showcases Applikationen, Visualisierungen und Veranstaltungen.

Wie funktioniert das Suchfeld von opendata.swiss?

Das Suchfeld von opendata.swiss ist so konzipiert, dass es einfache Phrasen (Suchbegriffe ohne komplexe Syntax) verarbeiten und nach einzelnen Begriffen in mehreren Metadatenfeldern mit unterschiedlicher Gewichtung suchen kann, je nach Bedeutung der einzelnen Metadatenfelder. So hat beispielsweise das Feld Titel eine stärkere Gewichtung als das Feld Beschreibung. Die Suchmaschine Solr ordnet Ihre Anfrage entsprechend ein und liefert Ihnen je nach Suchstrategie die passenden Treffer.

Suchfeld auf der Seite Daten auf opendata.swiss

Suchindex

Der Suchindex ist im Grunde die Datenbank, in der alle Informationen für die Suche gespeichert werden. Es wird ein benutzerdefiniertes Schema mit allen Datensatzfeldern, die indiziert werden sollen, verwendet. Das Schema ist flach, das heisst verschachtelte Elemente wie Ressourcen müssen anders gespeichert werden, damit Solr sie indizieren kann. Das Gleiche gilt für die mehrsprachigen Felder, die alle mit dem dazugehörenden Sprachsuffix gespeichert werden. So enthält keywords_en die englischen Schlüsselwörter. Standarmässig werden alle Felder, die zu einem Datensatz gehören, in ein Feld (genannt text) kopiert, so dass der Suchprozess nur ein Feld überprüfen muss, um eine Übereinstimmung zu finden. Wenn also ein Benutzer eine Suche mit der Abfrage Wetter in das Suchfeld eingibt, führt Solr diese Abfrage über das Feld text aller Datensätze aus.

URL
Index-Name	Name des Metadatenfeldes
downloadURL	DownloadURL
res_url	URL der Ressource

Text-Felder
Index-Name	Name des Metadatenfeldes
name	Slug des Datasets, z.B. wassertemperaturen-freibader
title	Titel des Datasets
title_string	Titel
license	Nutzungsbedingungen
groups	Kategorien
organization	Organisation
res_name	Titel der Ressource
res_format	Format der Ressource
res_description	Beschreibung der Ressource
identifier	Identifier
see_alsos	Verwandte Datasets
maintainer	Kontaktstelle
author	Urheber Showcase
publisher	Publisher
contact_points	Kontaktstellen

Übersetzte Felder
Index-Name	Name des Metadatenfeldes
title	Titel des Datasets
keywords	Schlagwörter
groups	Kategorien
organization	Organisation
res_name	Titel der Ressource
res_description	Beschreibung der Ressource

Trefferliste

In der Trefferliste werden alle Datasets angezeigt, die den von Ihnen eingegebenen Suchkriterien entsprechen. Wenn Sie keine Suchkriterien ausgewählt haben, wird Ihnen eine Liste aller auf opendata.swiss vorhandenen Datasets angezeigt.

In der Trefferliste finden Sie unterhalb des Suchfeldes die Anzahl der Datasets, die Ihrer Suchanfrage entsprechen. Damit Sie sich einen schnellen Überblick über die gefundenen Datasets verschaffen können, werden diese mit folgenden Metadaten angezeigt: Titel des Datasets, Name der Organisation, Kategorien, Beschreibung, Letzte Aktualisierung der Metadaten (Ebene Dataset/Ressource), Formate und Schlagwörter.

Durch Anklicken des Dataset-Titels gelangen Sie zur Dataset-Seite, mit den wichtigen Beschreibungen (Metadaten) des entsprechenden Datasets, wie Titel, Beschreibung, Nutzungsbedingungen, etc. Die Daten können entweder direkt über eine Download-URL heruntergeladen werden oder, wenn sie nur über eine Landing Page verfügbar sind, über eine Zugangs-URL. Dies können Sie direkt auf der Dataset-Seite machen oder Sie können auch weiter auf die Ressourcen-Seite navigieren.

Filtern

Duch Anklicken der entsprechenden Facetten der Filterkategorien können Sie Ihre Suchergebnisse verfeinern. Es kann nach Kategorien, Schlagwörtern, Organisationen, politischen Ebenen, Nutzungsbedingungen und den Formaten gefiltert werden. Wenn Sie nach Datasets einer bestimmten Kategorie suchen, können Sie diese direkt von der Startseite von opendata.swiss bereits filtern.

In der Rubrik Daten finden Sie alle Filtermöglichkeiten links neben der Trefferliste. Eine Mehrfachauswahl innerhalb einer Filterkategorie ist möglich, jedoch nur innerhalb der gefilterten Ergebnisse in der Trefferliste (Schnittmenge). Interessieren Sie sich beispielsweise für Datasets aus den Kategorien Geographie oder Raum und Umwelt, müssen Sie diese einzeln nacheinander auswählen, da sonst nur Dataset, die beide Kategorien tragen gefunden werden. Nachdem Sie einen Filter gesetzt haben, können Sie die Trefferliste mit weiteren Filtermöglichkeiten, wie zum Beispiel Formate erweitern. Zum Beispiel wenn ich nur an Dataset interessiert bin, die der Kategorie Geographie zugehörig sind, aber nur Ressourcen mit dem Format JSON enthalten.

Sortieren

Sie haben die Möglichkeit, Ihre Trefferliste zu sortieren. Dazu stehen Ihnen die Sortierung nach Relevanz, Daten zuletzt geändert, Metadaten zuletzt geändert, Name aufsteigend und nach Name absteigend zur Verfügung.

Wichtig

Bei der Suche nach einem Begriff im Index, wird für jedes Dataset eine Punktzahl berechnet. Mit der Option Relevanz werden die Ergebnisse in der Trefferliste nach der Punktzahl absteigend sortiert.

Stichwortsuche

Bei der Stichwortsuche geben Sie Ihre(n) Suchbegriff oder Ihre Suchbegriffe in das Suchfeld ein. Während der Eingabe erscheint unterhalb des Suchfeldes eine Auswahl von Vorschlägen. Diese können Sie bei Bedarf anklicken. Mit der Eingabetaste (Enter) starten Sie die Suche.

Wichtig

Bitte achten Sie auf die korrekte Schreibweise Ihrer Suchbegriffe. Falsch eingegebene Suchbegriffe ergeben keine Treffer. Gross- und Kleinschreibung wird nicht berücksichtigt.

Vorschläge für Suchbegriffe

Bei der Eingabe von Suchbegriffen werden Ihnen Vorschläge angezeigt, die Sie bei Bedarf auswählen können. Für jede Sprache wird mehrmals täglich ein in sich geschlossener Solr-Index aufgebaut. Das bedeutet, dass Änderungen an Datasets oder neue Datasets nicht sofort in den Vorschlägen berücksichtigt werden.

Index - Vorschläge für Suchbegriffe

Der entsprechende Index für die Vorschläge ist aus den folgenden Feldern aufgebaut:

Index - Vorschläge für Suchbegriffe
Index-Name	Name des Metadatenfeldes
dataset-title (translated)	Titel des Datasets
keywords	Schlagwörter
groups	Kategorien
organization	Organisation
distribution-name	Titel der Ressource
author	Einreichende Person oder Stelle in der Showcase-Rubrik
publishers	Publisher

Suchsprache

Die Syntax kommt von Solr und das Vokabular von opendata.swiss

Tabelle Solr-Syntax

Solr-Syntax
Syntax-Element	Funktion	Beispiel	Bedeutung
*	Existenz	title_de:*	Hat einen deutschen Titel
-	Ausschluss	-title_de:open	Deutscher Titel enthält nicht Begriff open
+	Einschluss	+title_fr:ouvert	Französischer Titel enthält Begriff ouvert
? *	Wildcards		ein Zeichen, beliebig viele Zeichen
AND	und	keywords_en:(geodaten&&energy)	Schnittmenge
OR	oder	organization:(kanton-thurgau \|\| stadt-zurich)	Vereinigungsmenge

Erweiterte Suche mithilfe von Operatoren

Eine Suchanfrage gliedert sich in einzelne Begriffe open, Phrasen open data und Operatoren. Um eine komplexere Suchanfrage zu erstellen, können Sie mehrere Begriffe oder Phrasen mit Suchoperatoren kombinieren. Die Suchlogik folgt der Syntax von Apache Lucene/Solr. Der Standardoperator im Suchfeld ist der Operator OR . Das bedeutet, dass, wenn Sie mehrere Begriffe in das Suchfeld eingeben, die Suchanfrage als OR-Anfrage behandelt wird, ohne dass Sie diesen Operator eingeben müssen. Wenn Sie den Begriff open data in das Suchfeld eingeben, werden open und data als Einzelbegriffe behandelt. In der Trefferliste finden Sie nun Datasets aufgelistet, bei denen open oder data im Suchindex gefunden wurde. Wenn Sie nach der Phrase open data suchen wollen, dann müssen Sie die Begriffe in Anführungs- und Schlusszeichen setzen: „open data“.

Suche nach Begriffen open und data ohne Operatoren

Suchmodi

OR (||)

Der Operator OR gibt Ihnen alle Datasets zurück, die den Begriff open oder data in ihrem Index enthalten. Dieser Operator ist als Standardoperator im Suchfeld implementiert. Sie können daher mehrere Begriffe auch ohne OR in das Suchfeld eingeben.

Suche nach Begriffen open und data mit dem OR-Operator

AND (&&)

Mit dem Operator AND werden alle Datasets angezeigt, deren Suchindex open und data enthält. Datasets, die nur einen dieser Begriffe enthalten, erscheinen nicht in der Trefferliste.

Suche nach Begriffen open und data mit dem AND-Operator

Ein- und Ausschluss von Begriffen (+)(-)

Wenn Sie nach Datasets suchen, die den Begriff open, aber nicht den Begriff data enthalten sollen, können Sie den gewünschten Begriff mit dem Operator + einschliessen und den unerwünschten Begriff mit dem Operator - ausschliessen.

Suche nach Begriffen mit Plus-Zeichen vor open und Minus-Zeichen vor data

Phrasensuche

Mit Anführungszeichen können Sie nach Begriffen suchen, die zusammengehören. In der Trefferliste finden Sie mit "open data" nun Datasets, die open data als Phrase enthalten. Entscheidend ist die Reihenfolge der beiden Begriffe. Datasets, die die Phrase data open enthalten, erscheinen nicht in der Trefferliste.

Suche nach dem Begriff open data mit Anführungszeichen

Suche in den Feldern

Wenn Sie nach einem Dataset suchen, in dessen Beschreibung der Begriff open data vorkommen soll, können Sie dem Begriff die Feldbezeichnung description gefolgt von einem Doppelpunkt : voranstellen.

Suche in description nach Phrase open data

Wenn Sie nach einem Dataset suchen, das sowohl open als auch data in seiner Beschreibung enthalten soll, können Sie eine Suchanfrage mit dem Operator AND formulieren und in Klammern hinter die Feldbezeichnung setzen. Dasselbe können Sie mit dem Operator OR tun, wenn entweder der Begriff open oder der Begriff data in der Beschreibung des Datasets vorkommen soll.

Sie können auch Begriffe innerhalb eines bestimmten Feldes einschliessen: +{field}:{value}. Wenn Sie zum Beispiel an einem Dataset interessiert sind, in dessen englischem Titelfeld der Begriff power vorkommen soll.

Die gleiche Suche ist auch möglich, wenn Sie zusätzlich einen Begriff ausschliessen wollen: -{field}:{value}. Sie suchen zum Beispiel nach einem Dataset, in dessen englischem Titelfeld zwar der Begriff power vorkommt, nicht aber der Begriff hydraulic.

Weiter können Sie auch nach Datasets suchen, die bestimmte Schlüsselwörter enthalten. Sie möchten zum Beispiel alle Datasets mit den englischsprachigen Schlagwörtern geology und geophysics finden.

Es ist auch möglich, mehrere Suchbegriffe mit dem Operator OR zu verknüpfen. Zum Beispiel möchten Sie ein Dataset finden, das entweder von der Organisation Kanton Thurgau oder Stadt Zürich publiziert wird. Bei dieser Suche muss jedoch der Slug der Organisation angegeben werden. Diesen finden Sie in der URL der Organisationsseite der jeweiligen Organisation. In unserem Beispiel wäre das für den Kanton Thurgau: kanton-thurgau.

organization:(kanton-thurgau OR stadt-zurich)

Diese Suche kann auch noch erweitert werden. In unserem Beispiel mit dem Suchbegriff karte.

organization:(kanton-thurgau OR stadt-zurich)karte

Wortstämme

Bitte beachten Sie bei der Suche in bestimmten Feldern, dass Wortstämme und Sonderzeichen nur in den sprachspezifischen Feldern berücksichtigt werden. Damit zum Beispiel das Dataset Luftbilder swisstopo farbig in der Trefferliste erscheint, können sie folgende Suchanfrage in das Suchfeld eingeben: title_de:(bild AND farbe).

Wichtig

Im allgemeinen Textfeld werden Wortstämme nicht berücksichtigt. Wenn nur das Feld title in die Suche eingegeben wird, ohne _de, wird das entsprechende Dataset nicht gefunden.

Wichtig

Im allgemeinen Textfeld ergeben nur exakte Übereinstimmungen der Begriffe, wie z.B. Luftbilder und farbig Treffer.

SOLR-Konfiguration

Ausführlichere Informationen zur Solr-Konfiguration finden Sie in der offiziellen Solr-Dokumention (Englisch). Die Konfiguration und das Schema von opendata.swiss ist auf Github verfügbar. solr.xml referenzierte Dateien, wie italian_stop.txt, fr_elision.txt, etc., sind im offiziellen CKAN-Repository der aktuellen CKAN-Version auf Github zu finden. Alle anderer Dateien (z.B. stopwords.txt) werden von Solr bereitgestellt.