News

Corona-Plots, kontinuierlich aktualisiert

Auf http://www.dkriesel.com/corona findet ihr jetzt kommentierte, mehrmals täglich aktualisierte Plots zu Covid19-Fallzahlen (vulgo: Corona) für eine weltweite Auswahl an Ländern. Auf diese Titelseitenvorschau kommt aus Platzgründen nur die Grafik für Deutschland mit ein paar knappen Interpretationshilfen. Auf der Unterseite selbst ist das ganze genauer beschrieben und mit mehr Beispielen untermalt.

Vorsicht: Wenn ihr weniger Neuinfektionen an Wochenanfängen und Wochenenden seht, würde ich darauf erstmal nichts geben, da ist nämlich Behördenwochenende (kein Witz!). Schwankungen in der täglich neu hinzukommenden Fallzahl, und auch sonst allen Daten, sind üblich! Ich würde generell eher auf längerfristige Trends achten. You have been warned.

Linker Plot. Die farbige Fläche ist die kumulative Covid19-Fallzahl. (unterteilt in aktive Fälle, Geheilte, Tode, wo die Länderdaten es erlauben). Breitet sich der Virus ungehindert aus, wächst die Fallzahl exponentiell; Wird die Fallzahl irgendwann nicht mehr größer, ist die Pandemie im jeweiligen Land eingedämmt (siehe z.B. China).

Dicke schwarze Linie: Wachstum der aktiven Fälle pro Tag, und zwar in Prozent, etwas geglättet. Wird die Ausbreitung nicht gebremst, schwankt das Wachstum in den meisten Ländern um ca. 25% am Tag. Stabile höhere Werte weisen auf besonders große Ansteckungszahlen hin, oder darauf, dass man im Vorhinein zu wenig auf Covid19 getestet hat. Stabile niedrigere Werte deuten auf eine Einbremsung der Ansteckungen hin.

Im rechten Plot in analogen Farben die täglich neu gemeldeten Fälle / Heilungen / Tode pro Tag, wiederum in geglätteter und Originalversion.

Hier noch mal der Link zur ausführlicheren Version mit mehr Ländern und Erklärungen.

Explorierbare Corona-Daten

Ich habe in der letzten Woche knapp hundert Mails bekommen, ob ich die Corona-Fallzahlen nicht mal anschaulich auswerten könnte. Das gibt es in der Tat schon! Hier zwei Portale in aller Kürze. Bitte beachtet, dass die Messverfahren und auch die Informationspolitik sich von Land zu Land unterscheiden und die Vergleichbarkeit der Länder untereinander darum nicht immer gewährleistet ist (und im Übrigen auch in Relation zur Bevölkerungsstärke gesetzt werden müsste). Es steht aber zu hoffen, dass die Länder ihre individuellen Messverfahren nicht andauernd wechseln, so dass man in den Kurven sehr wohl gucken kann, wann denn in einem Land der Peak wohl erreicht ist.

  1. https://mackuba.eu/corona/ – Schlichtes Portal, in dem man Fallzahlen und Neuinfektionen pro Land übersichtlich in Charts darstellen kann. Sehr flott, Blanke Daten ohne Shi-shi.
  2. https://www.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6 – Aufwändiges, toll designtes aber auch schwergewichtiges ArcGis-Dashboard mit geographischer Darstellung. Sehr schön gemacht, wirklich!

Möge jeder mit dem Portal glücklich werden, das ihm das beste deucht. :-)

Verschiedenste globale Aktiencrashs direkt nebeneinander

Weil es im Moment verschiedene Leute zu interessieren scheint, hier mal ein paar Aktiencrashs nebeneinander. So könnt ihr die Größenordnungen richtig einschätzen und solche Grafiken vermisse ich häufiger mal in den Medien. Das interessante bei so etwas sind nicht die absoluten Werte der Indizes, sondern wieviel Prozent Verlust sie ab ihrem individuellen Höchstwert machen.

In den folgenden beiden Grafiken (Stand: 10. März 2020 nach Börsenstart; nicht automatisch aktualisiert) sieht man, wieviel Verlust die beiden Indizes DAX (oben) und Dow Jones (unten) in verschiedenen Crashs angesammelt haben, Corona eingeschlossen. Alle fangen bei 0% Verlust an, und der zeitliche Startpunkt von allen wurde exakt aufeinandergelegt.

Neben den beiden großen, globalen Krisen habe ich relativ willkürlich als „Vergleichskrise“ noch den kleinen Rückschlag Ende 2018 mit eingebaut.

EDIT: Grafiken jetzt Stand 12. März 2020, abends.

Ein kleiner Technologiestack für DataScience-Heimprojekte

Ich bin jetzt ziemlich weit damit, den Mailhaufen abzuarbeiten, den ich im Nachgang zu meinem BahnMining-Vortrag gekriegt habe. Die mit Abstand am häufigsten gestellte Frage, die mich erreicht hat, war die nach einer kurzen Beschreibung meines Techstacks, bzw. einer verallgemeinerten kurzen Beschreibung, wie man technisch an sowas herangeht. Also gibt es hierfür vorweg mal einen eigenen Blogpost. Ich unterteile die vier Phasen Download, Parsing, Zusammenführung, und zum Schluss die Analyse an sich. Alsdann: