Jupyter Notebook: Kitas in Berlin

Screenshots des Artikels "Open Data: Berlin Kitas" mit Text, Diagrammen und Sourcecode
Screenshots der App „Open Data: Berlin Kitas“ vom 22.09.2020

Der Mathematiker und Datenwissenschaftler („data scientist“) Dr. Juan Camilo Orduz hat sich den Datensatz „Kitas in Berlin“ vorgenommen und ausführlich analysiert. Er untersucht dabei u.a. die Verteilung der Kitas auf die verschiedenen Berliner Bezirke und Postleitzahlen, das Verhältnis von Größe der Kitas zu Anzahl pro Bezirk, die unterschiedlichen Träger und deren Verteilung auf die Stadt, das Verhältnis von großen zu kleinen Trägern etc. Außerdem integriert Orduz die Kita-Daten mit den Bevölkerungszahlen Berlins, um so z.B. Aussagen über die Verteilung von Kita-Plätzen auf Einwohner machen zu können.

Ein interessanter Aspekt ist die Veröffentlichung der Analyse als sog. Notebook (basierend auf der frei verfügbaren Jupyter Notebook-Software). Diese Form der Veröffentlichung mischt Text und Grafiken (Diagramme, Karten etc.) mit dem entsprechenden Computer-Code, der die Daten verarbeitet, analysiert und visualisiert. Man kann dem Autor also quasi bei seiner Arbeit über die Schulter schauen und von Anfang an mitprogrammieren, vom Laden und Bereinigen der Daten, über die ersten Analysen, bis hin zur Erstellung komplexer Statistiken. Gerade für Nutzer*innen, die selber an der Arbeit mit offenen Daten interessiert sind, ist dieser Artikel also sehr lohnenswert!

Hier geht's zum Notebook Open Data: Berlin Kitas. Das Notebook ist in englischer Sprache geschrieben.


Erstellt
Tuesday, September 22, 2020 - 16:29
URL
https://juanitorduz.github.io/kitas_berlin/
Datenquellen
Kitas in Berlin
Tags
open data
datenanalyse
data analysis
data science
Visualisierung. visualization
kita
Kindertagesstätten