Schritt für Schritt - Formatauswahl

Die Maschinenlesbarkeit der Formate ist ein wichtiges Kriterium.

Unter Maschinenlesbarkeit wird die softwaregestützte Erkennung und Verarbeitung in Prozessoren oder Computern verstanden. Für Datensätze, Texte oder Geodaten können ganz konkrete Dateiformate empfohlen werden.

 

Denn erst wenn Ihre Daten maschinenlesbar sind, können sie mit entsprechendem Spezialwissen zur Dateninterpretation, -analyse und -visualisierung verarbeitet, lesbar und nutzbar gemacht werden. Einige Datenformate machen gerade eine automatisierte Weiterverwertung deutlich einfacher, andere jedoch schränken eine einfache Weiterverarbeitung ein.

 

Daher gilt: Soll eine möglichst breite Nutzergruppe die Verwaltungsdaten verwenden können, müssen die Daten in möglichst offenen Formaten bereitgestellt werden. Zum Beispiel sind tabellarische Daten zwar im PDF gut für Menschen lesbar, jedoch schwierig für Maschinen zu interpretieren.

 

Bedenken Sie auch, für welche zur Weiterverarbeitung geeigneten Formate haben Sie Zugriff auf Transformationswerkzeuge? Welche Formate sind im Einzelfall für die Weiterverarbeitung besonders geeignet? Bei Fragen zur technischen Aufbereitung können Sie sich an das Redaktionsteam des Open Data-Portals wenden.

Empfohlene Formate

Für Tabellen und Texte gelten daher folgende empfohlene Dateiformate:

xls
Excel
csv
Comma Separated Value
xml
Extensible Markup Language
html
Hypertext Markup Language
rss
Newsfeed/Webfeed Syndication
rdf
Resource Description Framework
json
Java Script Object Notation
txt
Text File
odt, ods
OpenDocument

Für Geodaten gelten somit folgende empfohlene Dateiformate:

gml
Geography Markup Language
gpx
GPS Exchange Format
kml
Keyhole Markup Language
dxf
Drawing Interchange File
shp, shx, dbf
ESRI Shapefile Format

Tipps

  • Die Daten können ausschließlich oder zusätzlich in maschinenlesbaren Formaten veröffentlicht werden.
  • PDF-Dateien, DOC- und DOCX-Dateien oder Grafikformate wie JPG, TIFF oder GIF sind keine maschinenlesbare Datenformate. Daten in diesem Format müssen um eine Ressource in einem offenen Format entsprechend der obigen Tabelle ergänzt werden.
  • Werden in Tabellen-Dateien Arbeitsblätter mit mehreren Tabellenblättern verwendet, müssen diese in Einzeldateien zerlegt werden, um jeden Datensatz einzeln beschreiben zu können.

Weiter zum nächsten Schritt


_