Datenanalyse

Woher stammen die Daten?

Aus dem Bauch heraus weiß jeder Pendler in etwa wann er wie lange zur Arbeit braucht. Doch wie kann man die Intuition untermauern? - Als Informatiker liegt die Nutzung der digitalen Möglichkeiten nahe.

Streckenauswahl / Hotspots

Zunächst habe ich natürlich meinen Hotspot untersucht: auf der B29 von Böbingen Höhe MVO bis Aalen in etwa zur Abzweigung B29/B19 vor dem Tunnel. Hier muss ich jeden Morgen vor 8 Uhr und am Nachmittag ab ca. 16 Uhr durch.

Als ich einer Freundin von meinen ersten Ergebnissen erzählt habe, meinte sie, dass ihre Strecke von Remshalden bis Backnang ebenfalls stark staubelastet ist. Daraufhin habe ich meine Auswertung auf die Strecke von Winnenden über Waldrems bis Backnang ausgeweitet.

Dann kam das Thema immer wieder zur Sprache, sodass ich noch weitere Strecken zur Aufzeichnung aufgenommen habe:

  • Zwischen der B29-Auffahrt Weinstadt-Endersbach und der B14 auf Höhe des Mercedes-Benz Museums
  • Von Filderstadt kommend auf der B27 zur Weinsteige in Stuttgart
  • Auf der B10 aus Richtung Göppingen bis zur Auffahrt B14/B10
  • An der Wilhelma vorbei von der B10 am Neckar vor dem Tunnel bis nach Zuffenhausen Höhe Zahbergäustraße

Zum besseren Verständnis, hier eine Übersicht:

Aufzeichnung

Im Gegensatz zu Verkehrsmessungen, die auf die Anzahl der Fahrzeuge zu einer Zeit an einer Stelle messen, wollte ich die für Pendler wesentlich wichtigere Information einfangen: wie lange dauert es durch den Hotspot zu kommen? Daher habe ich ein Programm entwickelt, das seit November 2016 zwischen Montag und Freitag alle 10 Minuten die oben genannten Strecken in einen bekannten Routenplaner eines amerikanischen Suchkonzern eingibt und 2 Werte neben eines Zeitstempels speichert:

  • Standard Fahrtdauer: Die Zeit (in Sekunden), die es benötigt diese Strecke im Mittel zu dieser Tageszeit zu passieren, wenn kein Verkehr wäre.
  • Aktuelle Fahrtdauer: Die Zeit (in Sekunden), die es benötigt wenn man aktuell am Streckenbeginn ist und durch diese Strecke möchte.

Der Trick ist, dass man bei Abfahrt ja nicht abschätzen kann wie sich der Verkehr entwickelt und man bis zum Streckenbeginn eine relativ konstante Zeit noch benötigt. Daher braucht es eine unabhängige dritte Einheit, die einfach ständig die Zeiten notiert.

Auswertung

Das Programm schreibt die Daten einfach in Dateien, die dann in eine Datenbank eingelesen werden kann. Für die ersten Auswertungen habe ich Excel Pivot-Tabellen benutzt, künftig werden die Daten allerdings mit SAP HANA 2 ausgewertet.

Weitere Informationen

Auch andere Websites bieten Verkehrsdaten zur Auswertung an. Ich möchte hier auf zwei interessante Websites verweisen:

Die Straßenverkehrszentrale Baden-Württemberg bietet die aktuelle Verkehrszählung zur Einsicht an. Das OpenDataCity Projekt bietet diverse Datensätze zum Thema Verkehrs an, unter anderem der Zugmonitor der SZ.