Jupyter Notebook: Kitas in Berlin

Screenshots des Artikels "Open Data: Berlin Kitas" mit Text, Diagrammen und Sourcecode

Der Mathematiker und Datenwissenschaftler („data scientist“) Dr. Juan Camilo Orduz hat sich den Datensatz „Kitas in Berlin“ vorgenommen und ausführlich analysiert. Er untersucht dabei u.a. die Verteilung der Kitas auf die verschiedenen Berliner Bezirke und Postleitzahlen, das Verhältnis von Größe der Kitas zu Anzahl pro Bezirk, die unterschiedlichen Träger und deren Verteilung auf die Stadt, das Verhältnis von großen zu kleinen Trägern etc. Außerdem integriert Orduz die Kita-Daten mit den Bevölkerungszahlen Berlins, um so z.B. Aussagen über die Verteilung von Kita-Plätzen auf Einwohner machen zu können.

Ein interessanter Aspekt ist die Veröffentlichung der Analyse als sog. Notebook (basierend auf der frei verfügbaren Jupyter Notebook-Software). Diese Form der Veröffentlichung mischt Text und Grafiken (Diagramme, Karten etc.) mit dem entsprechenden Computer-Code, der die Daten verarbeitet, analysiert und visualisiert. Man kann dem Autor also quasi bei seiner Arbeit über die Schulter schauen und von Anfang an mitprogrammieren, vom Laden und Bereinigen der Daten, über die ersten Analysen, bis hin zur Erstellung komplexer Statistiken. Gerade für Nutzer*innen, die selber an der Arbeit mit offenen Daten interessiert sind, ist dieser Artikel also sehr lohnenswert!

Hier geht's zum Notebook Open Data: Berlin Kitas. Das Notebook ist in englischer Sprache geschrieben.

Informationen zur Anwendung