News
36c3-Vortrag: BahnMining - Pünktlichkeit ist eine Zier
Ha, jetzt isses raus. Ich habe mich schon gewundert, warum plötzlich so viele Leute denken, ich würde auf dem 36C3 einen Vortrag über Bahndaten halten – und dann stellt sich raus: Der CCC hat seinen halfnarp rausgebracht, in dem alle Vorträge drin stehen. Tja, also, äh, dann: Ich halte auf dem 36C3 einen Vortrag über Bahndaten. Wann und in welchem Saal, steht noch nicht fest. Der Vortrag wird vermutlich wieder gestreamt und in diverse Sprachen simultanübersetzt. Sobald ich zu alledem mehr weiß, informiere ich an dieser Stelle.
Seit Anfang 2019 habe ich jeden einzelnen Halt jeder einzelnen Zugfahrt auf jedem einzelnen Fernbahnhof in ganz Deutschland systematisch gespeichert. Inklusive Verspätungen und allem drum und dran. Und die werden wir in einem bunten Vortrag erforschen und endlich mal wieder ein bisschen Spaß mit Daten haben.
Rechtlicher Hinweis: Es liegt eine schriftliche Genehmigung der Bahn vor, von ihr abgerufene Rohdaten aggregieren und für Vorträge nutzen zu dürfen. Inhaltliche Absprachen oder gar Auflagen existieren nicht.
Die Bahn gibt ihre Verspätungen in „Prozent pünktlicher Züge pro Monat“ an. Das ist so radikal zusammengefasst, dass man daraus natürlich nichts interessantes lesen kann. Jetzt stellt euch mal vor, man könnte da mal ein bisschen genauer reingucken. Stellt sich raus: Das geht! Davids Datensatz umfasst knapp 20 Millionen Halte - mehr als 50.000 pro Tag. Wir haben die Rohdaten und sind in unserer Betrachtung völlig frei. Der Vortrag hat wieder mehrere rote Fäden.
- Wir vermessen ein fast komplettes Fernverkehrsjahr der deutschen Bahn. Sinn ist keinesfalls Bahn-Bashing - wer einen Hassvortrag gegen die Bahn erwartet, ist in dieser Veranstaltung falsch. Wir werden die Daten aber nutzen, um die Bahn einmal ein bisschen kennenzulernen. Die Bahn ist eine riesige Maschine mit Millionen beweglicher Teile. Wie viele Zugfahrten gibt es überhaupt? Was sind die größten Bahnhöfe? Wir werden natürlich auch die unerfreulichen Themen ansprechen, für die sich im Moment viele interessieren: Ist das Problem mit den Zugverspätungen wirklich so schlimm, wie alle sagen? Gibt es Orte und Zeiten, an denen es besonders hapert? Wann und wo hapert es besonders? Wo fallen ganze Züge aus?
- Es gibt wieder mehrere Blicke über den Tellerrand, wie bei meinen vorherigen Vorträgen auch. Ihr werdet wieder ganz automatisch und nebenher einen allgemeinverständlichen Einblick in die heutige Datenauswerterei bekommen und ich hoffe, möglichst viele von euch zur Auswertung öffentlich verfügbarer Daten zu inspirieren. Die Welt braucht Leute mit Ratio, die Analyse wichtiger als Kreischerei finden. Und darum beschreibe ich auch, wie man so ein durchaus aufwändiges Hobbyprojekt technisch angeht, Anfängerfehler vermeidet, und verantwortungsvoll handelt.
Ich würde mich freuen, möglichst viele von euch zu sehen. Und by the way: Nutzt den Halfnarp. Mit diesem Tool könnt ihr der CCC-Orga sagen, welche Talks ihr gerne sehen würdet, und so versuchen sie, die Raumplanung zu optimieren und zeitliche Kollisionen zu vermeiden.
Ankündigung: Vortrag auf dem 36c3
Ich freue mich, hier ankündigen zu können, dass ich auf dem diesjährigen Chaos Communication Congress (36C3) mal wieder mit einem Vortrag dabei sein werde. Was es genau ist, wird noch veröffentlicht – ein bisschen sollen die im Umlauf befindlichen Verschwörungstheorien ja noch weiterleben dürfen. Ich greife hier dem offiziellen 36C3-Fahrplan nicht vor. (Anmerkung aus gegebenem Anlass: Das Wort „Fahrplan“ hat hier nichts mit der Bahn zu tun, sondern ist das offizielle Wort des CCC für das Congress-Programm.)
Aber vorab schon so viel: Es wird wieder um ein Datenhobbyprojekt von mir gehen, aber eins, das ich noch nicht publik gemacht habe. Und ich gebe mir wieder große Mühe, dass mein Vortragsstil für jedermann verständlich sein wird, und es gibt auch wieder nicht nur Daten, sondern wir gucken auch wieder über den Tellerrand. Näheres bald an dieser Stelle! Ick freu mir!
Sonntagsfragen-Liveansicht: SPD jetzt bei kleinen Parteien sichtbar
Die bahnbrechenden Fortschritte der SPD im Hinblick auf ihr „Projekt 5%“ zwingen mich zur Neuausrichtung einiger Plots meiner Sonntagsfragen-Liveansicht (http://www.dkriesel.com/sonntagsfrage). In den Plots, die den Fokus auf die kleinen Parteien legen (eigentlich AfD, Grüne, Linke, FDP) wird die SPD jetzt mit angezeigt, sofern sie in den Prozentbereich der kleinen Parteien vordringt. Diese Konstellation hatte ich mir beim programmieren nicht träumen lassen. Danke für eure Zuschriften. Was ich mache, wenn die SPD das Anschlussvorhaben „Projekt SPD – Sonstige Partei Deutschlands“ in Angriff nimmt und den Bereich der kleinen Parteien wieder nach unten verlässt, überlege ich mir noch.
Auch anderweitig ist die Sonntagsfragen-Ansicht nun auf den neuesten Stand gebracht und die Diagramm-Zeiträume sind sinnvoller gesetzt (30-Tage-Ansicht ausgetauscht durch 90 Tage, und die Ansicht ab Start 2017 ist ausgetauscht in eine Ansicht „seit letzter Wahl“). Erstere Ansicht findet ihr nachfolgend.
DSGVO for the win!
Die Datenschutzgrundverordnung ist in Kraft getreten. Wie wir ja alle wissen, ist das Recht auf informationelle Selbstbestimmung heute das Supergrundrecht – deutlich höher priorisiert als im Vergleich mindere Grundrechte wie z.B. das Recht auf körperliche Unversehrtheit. Im Ergebnis machen sich auch private, nichtkommerzielle, werbefreie Webseiten wie meine sehr einfach zum Abmahnziel.
Um allfälligen Quersubventionierungen irgendwelcher Abmahnanwälte vorzubeugen, dürft ihr ab heute nicht nur meine neue Datenschutzerklärung bewundern, sondern auch einen Banner klicken, auf dem ihr euch damit einverstanden erklärt, dass diese Webseite Cookies benutzen darf. Toll! Der Fortschritt ist nicht aufzuhalten!
Das mit den Cookies habe ich absichtlich so formuliert, weil ich seit Jahren keine Cookies für irgendwas nutze. Selbst die Cookies, die mein Content Management System (Dokuwiki) automatisch generiert, filtere ich raus, bevor sie euch erreichen. Wenn man's ganz genau nimmt, klickt ihr den Cookie-Banner also umsonst. Da ich aber nicht weiß, was zukünftig technisch notwendig wird, und auch keine Lust habe, auf-Verdacht-Abmahnungen von irgendwelchen technisch semi-versierten Anwälten zu kriegen, bloß weil der Banner fehlt, gibt es den Banner eben dennoch. Schöne neue Welt.
Edit: Da ich alle Cookies filtere, filtere ich natürlich auch den Cookie, der den Cookie-Banner daran hindert, bei euch immer und immer wieder angezeigt zu werden. Mist. Muss mal schauen, wie ich damit umgehe, vielleicht lasse ich den Banner dann doch einfach weg.
Edit 2: Eine weitere, in meinen Augen gangbare Herangehensweise an die DSGVO findet sich hier. (Danke, Thilo)
Edit 3: Habe den Banner jetzt temporär entfernt.