Schlagwort-Archive: polizei

Datenjournalismus: Einbrüche in Unterfranken

Winter 2013. Die Tage werden kürzer, die zunehmenden Stunden der Dunkelheit rufen immer mehr Einbrecher auf den Plan. So war damals zumindest der Eindruck bei uns in der Online-Redaktion der Main-Post, den die Polizeiberichte aus dem Regierungsbezirk Unterfranken vermittelten.

Nur einen Eindruck haben ist einem als Journalist allerdings zu wenig. Wie viele Einbrüche finden in der dunklen Jahreszeit statt — und wie viele im Sommer? Zu welcher Uhrzeit wird am meisten eingebrochen? Und wo sind die Schwerpunkte? In den Städten? Auf dem flachen Land? Nur eine möglichst konkrete Datenbasis kann darüber Auskunft geben. Das Datenjournalismus-Projekt „Einbrüche in Unterfranken“ wurde gestartet.

Nur wie kommt man an diese Daten? Die Polizei konnte uns aus Nachfrage kein brauchbares Material zur Verfügung stellen, die allgemeine Einbruchsstatistik genügte uns nicht.

So blieb nur der harte Weg: Möglichst viele Einbrüche in Unterfranken aus den Polizeiberichten von Hand erfassen, die die Redaktion per E-Mail erreichen — manchmal sogar noch innerhalb eines Word-Dokuments.

Dateneingabe

Tabelle der Einbruchsstatistik bei Google Drive
Tabelle der Einbruchsstatistik bei Google Drive

Dafür wurde bei Google Drive eine Tabelle angelegt, in die über ein Formular der jeweilige Online-Redakteur am Newsdesk die Daten der Einbrüche eingeben kann.

Erfasst wurden der Ort — mit Längen- und Breitengrad, das Datum und die Uhrzeit und knapp etwas zum entstandenen Schaden. Dem Einbruch wird noch eine Kategorie mitgegeben — Wohnungseinbruch, Firmeneinbruch, oder Gartenhaus-/Wohnwageneinbruch — und im Idealfall ein Link auf den Artikel bei mainpost.de.

Leider musste wir in Online-Redaktion in der Praxis einige Abstriche an der Genauigkeit der Daten machen. In den Polizeiberichten ist oft nicht der exakte Ort — also zum Beispiel die Hausnummer — angegeben, manchmal nicht einmal die Straße. Gerade bei Einbrüchen „auf der grünen Wiese“ konnte der Tatort vom Redakteur nur geschätzt werden.

Ähnlich ungenau wurde es bei der Zeit. Oft wissen die Bestohlenen nicht, wann genau der Einbruch stattfand. Wir haben darum nur grobe Zeitfenster wie „Früh“, „Vormittag“, „Mittag“ verwendet, da uns ein solches Zeitraster für eine Auswertung genügte. Noch schwieriger war es bei Einbrüchen, die irgendwann in einem Zeitraum über mehrere Tage passiert sein konnten. Letztlich gehen diese Einbrüche gar nicht in die Auswertung der Tageszeit ein, da dazu keine Aussage getroffen werden kann.

Wir hätten auch gerne den Wert und Art der Beute und den verursachten Schaden bei den Einbrüchen besser erfasst. Doch in den Polizeiberichten ist dieser Punkt meist noch offen oder nur sehr ungenau angegeben, so dass uns eine einigermaßen brauchbare Auswertung gar nicht möglich ist.

Datenverarbeitung

Die Daten in der Tabelle können nur schwer direkt für eine Online-Präsentation verwendet werden. Darum werden sie durch ein Programm verarbeitet, vereinheitlicht, teilweise verifiziert und in maschinenlesbarer Form wieder ausgegeben.

Ausschnitt aus dem PHP-Script, dass die Daten aus der Tabelle bei Google Drive weiterverarbeitet.
Ausschnitt aus dem PHP-Script, das die Daten aus der Tabelle bei Google Drive weiterverarbeitet.

Ohne in technische Details zu gehen: Ein PHP-Script liest den Inhalt der Tabelle ein. In einem ersten Programmschritt wird unter anderem auf die korrekte Angabe der Geokoordinate des Orts geprüft. Ist der Breitengrad um die 50 und der Längengrad um die 10? Dann befindet sich der so angegebene Ort in etwa in Unterfranken. Sonst tauscht das Programm die beiden Zahlen aus und prüft dann das Ergebnis noch einmal — denn eventuell wurden bei der Eingabe Längen- und Breitengrad verwechselt. Es können durch Eingabefehler — oder Google Drive selbst —  die Dezimalpunkte der Geokoordinaten „verschwinden“, auch dieses Problem wird durch das Programm korrigiert.

Die Einbrüche in der Tabelle werden nun vom Programm strukturiert, zum Beispiel nach Tageszeit oder Datum, zusammengefasst. Diese strukturierten Daten werden dann in den Formaten — alles JSON-Dateien — ausgegeben, wie es die später verwendete Software zur Präsentation der Daten benötigt.

Visualisierung der Daten

Wo wurde eingebrochen? Die Tatorte in Unterfranken auf einer Karte.
Wo wurde eingebrochen? Die Tatorte in Unterfranken auf einer Karte.

Die Präsentation der Einbrüche in Unterfranken geschieht auf einer Webseite in zwei großen Blöcken. Zum einen wird eine Karte verwendet, auf der alle erfassten Einbrüche angezeigt werden. Zum anderen werden zwei Statistiken grafisch dargestellt: Die Anzahl der Einbrüche pro Tag und die Verteilung der Einbruchszeiten.

Zur Darstellung der Karte wird das Javascript-Framework Leaflet verwenden. Gefüttert wird die Karte durch eine GeoJSON-Datei, die vom PHP-Script geschrieben wurde. Als Kartenmaterial greift Leaflet auf Daten des OpenStreetMap-Projekts zu.

Die Anzahl der Einbrüche - eine deutliche Spitze in der dunklen Jahreszeit.
Die Anzahl der Einbrüche – eine deutliche Spitze in der dunklen Jahreszeit.

Für die Statistiken hätte man auch Leaflet verwenden können, doch mit dem jqPlot-Plugin des jQuery-Frameworks konnte schneller das gewünschte Ergebnis erreicht werden.

Zu welchen Uhrzeiten wurde eingebrochen? Eine Balkengrafik gibt Auskunft.
Zu welchen Uhrzeiten wurde eingebrochen? Eine Balkengrafik gibt Auskunft.

Der Vorteil der Verwendung des PHP-Scripts als Zwischenschritt kommen hier zum Tragen: Die Daten liegen genau so vor, wie es die einzelnen Komponenten der Visualisierungs-Software benötigen, eine Umformung ist auf der Webseite nicht mehr nötig. Der Programmcode zur Darstellung der einzelnen Grafiken konnte dadurch recht knapp und übersichtlich gehalten werden.

Diese interaktiven Grafiken wurden auf mainpost.de mit einem IFrame in das Angebot eingebunden:

Karte und Statistik auf mainpost.de: Einbrüche in Unterfranken

(Anmerkung: Ich arbeite noch an einer Visualisierung in „Clustern“, wo räumlich nahe Einbrüche zusammengefasst angezeigt werden. Die Version ist aber noch nicht ausgereift, den Stand der Dingen kann man sich aber schon anschauen.)

Fazit

Das Jahr 2014 hat Halbzeit, ebenso wie das Projekt „Einbrüche in Unterfranken“.  Wir in der Online-Redaktion der Main-Post haben damit versucht, das Ausmaß der Einbrüche in der Region „live“ zu visualisieren und zu analysieren. Etwas unbefriedigend ist nach wie vor die Datenbasis. Die Einbrüche aus den Pressemitteilungen der Polizei zu ziehen, ist ein fehleranfälliger Weg. Hat die Polizei auch wirklich jeden kleinen Einbruch dort vermeldet? Wir wissen, dass gerade in Spitzenzeiten der Einbruchsserien nicht jeder kleine Einbruchsversuch in den Pressemitteilungen zu finden war.
Oder wurde auch wirklich jeder Einbruch von dem Redakteur an dem Tag in die Tabelle eingetragen? In hektischen Zeiten kann man schon mal einen Einbruch in einer langen Polizeimeldung übersehen. Und wie schon erwähnt, sind die Daten in den Pressemitteilungen oft recht ungenau.

Im Grunde müsste man jeden Einbruch noch einmal genau nachrecherchieren — und das ist ein Problem der Ressourcen. Braucht man für einen Einbruch dann etwa 10 Minuten, hätte man im ersten Halbjahr schon gut 70 Stunden allein für die Recherche verwendet — und muss man sich als Redaktion erst mal leisten können. Wir haben versucht, mit wenig Aufwand möglichst viele und genau Daten zu bekommen, mit einem nur mäßig befriedigendem Ergebnis.

Ideal wäre natürlich, die Daten direkt an der Quelle anzapfen zu können, bei der Polizei. Wenn es dort eine Möglichkeit geben würde, dort online auf Daten von Einbrüchen, Unfällen, Bränden, etc. strukturiert und maschinenlesbar  zugreifen zu können, wäre das eine große Erleichterung und würde die Zahlenbasis deutlich solider machen. Aber hier befinden wir uns schon im Traumland der Open-Data-Idee. Noch ist so etwas nicht möglich und nach Angaben der Polizei Unterfranken auch erst mal nicht geplant.

Die Arbeit an dem Projekt geht weiter …

Weiterführende Links

Update: Gerade über Twitter erfahren: „Die Stimme“ in Heilbronn hat sich auch dem Thema „Einbrüche“ angenommen — ganz ähnlich wie die Main-Post. 🙂