Pavel Mayer 2:14:51
Genau und jeden Tag kommt ein halbes Gigabyte dazuUnd wenn ich halt die offiziellen Zahlen reinrechnen will, muss ich mir halt äh diese äh gesamten vierzig Gigabyte äh halt durcharbeitenund zwar ähm ja Tausende von Malen muss ich da Auswertungen drüber fahren so und.Das habe ich jetzt soweit auch sagen am am Start,das Ganze, das das gibt es, also ich kann jetzt die offiziellen Daten rein rekonstruieren und nicht nur das. Ähm.Ich,schreibe halt bereits Daten rein, äh jeweils für hm die verschiedenen Altersstufen und für die Geschlechter und so, so dass ich dann am Ende mit.Einer Datei sage ich mal oder einem einer Tabelle,Für jeden Landkreis und eine für jedes Bundesland und eine äh für Deutschland gesamt äh kommedie dann halt alle möglichen Spalten enthalten eben fürNeuinfektion für Infektion komuliert, für Tote, für Tote komuliert und dann eben für Infektionen in der Altersgruppe und auch Genesung in der Altersgruppe und ja.Das äh ist sozusagen jetzt gerade der der Stand, den ich, den ich habe mit der,neuen Pipeline und was ich im Moment mache, ist, ich lade mir die Daten ins Excelund mache dann im Moment mit Excel die eine oder andere Visualisierung zum Beispiel für Berlin äh was wir halt vorhin erwähnt hatten, so dies nach Alters äh Gruppen ähm oder.Institutionen nach Altersgruppen, so dass es stammt aus diesen neuen,Tabellen, die daneben in Excel äh visualisiert wurden. Ja ähm was ich jetzt gerade.In den letzten Tagen dazu gebaut habe ist was mir noch fehlte um sagen nicht nur.Zahlen der infizierten zu haben oder die Zahlen der Toten, sondern die tatsächlichen Institenzen.Pro Altersgruppe und nicht nur die Zahlen pro Altersgruppe muss ich natürlich wissen wie viele Menschen,in dieser Altersgruppe jetzt in diesem Landkreis oder Land wohnen. Das ist natürlich einekrasse Datenbasis, aber wir haben ja Volkszählungen in Deutschland und wir haben eben auch Zensusdaten, Banken und da kann man dann auch genau diese Daten runterladen, abernicht genau in denAltersstufen, wie sie zu den RKI-Datensätzen passen, weil da gibt's halt diese Altersstufen null bis vier. Äh dann fünf bis.Vierzehn und fünfzehn bis fünfunddreißig und dann fünfunddreißig bis und so weiter und achtzig plus und so nur und da gibt es aber äh dann kein,Angebot,genau diese Zahlen, in denen Altersgruppen runterzahlen, aber man kann dann den Weg gehen und,sich die Zahlen für jedes einzelne Jahr holen,und dann die entsprechenden Jahre, die man dann braucht, um auf das RKI-Format zu kommen, dann zusammenzählen, ist halt auch ja.Nicht ganz unproabarist, das das geht, das hat das habe ich halt dann auch gemacht. Weiteres Problem war aber noch, dass in den Bundesdaten,nicht die Daten für die Berliner Bezirke mit enthalten sind, die mich natürlich auch besondersinteressieren so, da gibt es eben aus den letzten in den letzten Volkszählungsdaten halt nichts drüber, die gibt's dann aber wiederum bei Statistik Berlin Brandenburg, allerdings nur von zweitausenddreizehnSo, weißt, dann habe ich mir dort noch die zweitausenddreizehner Daten äh besorgt, weil das die neuesten sind für die BezirkeAber die passen dann natürlich nicht zu den neueren Volkszählungsdaten. Die sind natürlich dann viel zu niedrig. Und deswegen habe ich dann nochAlso ich hatte halt die wiederum die Daten für ganz Berlin aktuellund dann habe ich einfach noch die Daten für die Bezirke in den einzelnen Altersgruppen entsprechend hochgerechnet.Auf die neueste Volkszählung, damit halt die Summen der einzelnen Bezirke, auch die Summen der aktuellen Volkszählung für Berlin ergeben. So.Ja. So, jetzt habe ich halt äh tatsächlich äh ähm.Für sämtliche Bezirke und Länder und auch für die Berliner,Bezirke halt 'ne schöne Datenbasis wo ich weiß wie viele Menschen in dieser entsprechenden jetzt passenden Altersgruppe dort.Ähm wohnen, sodass ich dann tatsächlich mit richtigen Institzen pro hunderttausend Einwohnern dann rechnen kann.Zu.Diese Datenbasis jetzt zu zu produzieren äh ist halt der nächste Schritt. Da muss ich noch ein paar Stunden aufwenden, um dann auch äh,haben überall die Inzidenzspalten jetzt noch einzurechnen. Problem ist so ein Lauf äh dauertauf meinem Laptop dann jetztmehrere Stunden auf jeden Fall und wenn jetzt also es wird zu sechs bis acht Stunden dauern, das heißt, da muss ich dann halt auch noch was machen, beziehungsweise,da ist dann der Plan, dass halt jeweils nur für den neusten Tag zu machen und eben nicht die gesamten Tabellen neu rauszurechnen und ja an der Stellekäme dann auch möglicherweise eine Datenbank ins Spiel, in die man dann jeweils jeden Tag für.Jeden Landkreis und jedes Land eine neue.Zeile äh in die in die Tabelle hängt, also wo man dann pro Tag äh ja äh fallen dann ungefähr fünfhundert.Äh an äh neuen Daten an äh wobei das dann, weiß ich nicht, hundert, zweihundert Spalten sind äh oder so, aber es ist alles dann eine handhabbare Datenmenge pro Tag. So,Und dann möchte ich im nächsten Schritt äh sobald ich das habe, dann erstmal die Tabelle, alsowas ich jetzt äh nach dem diesen Konsolidierungsverfahren, was aber jetzt aus dem Ruder gelaufen ist, äh möchte ich gerne die Risikotabelle.Wieder äh daraus generieren, aber vor allem sind natürlich dann diese Daten äh wunderbar geeignet,um ganz tolle Kurven zu machen. Äh also ganz tolle Grafiken, äh wo man dann hm,ja für jeden im Prinzip, für jeden Landkreis sehen kann, äh, wie sich dort die Institanz in welchen Altersgruppen.Entwickelt hat und ähm äh andere Dinge eventuell wäre dann auch noch interessant. Äh.Einen Feature, äh wo man dann tatsächlich.Ein Tag reingehen kann und sich dann die Fälle eines Tages nochmal genauer angucken kann,Das ist aber auch eher erstmal erstmal ein bisschen perspektivisch,und ähm ja ansonsten,habe ich halt auch noch die Geodaten, das heißt, es steht auch nichts im Wege, dann das Ganze auch als Karte äh zu visualisieren. Es gibt auch,die Schwerpunkte jedesLandkreises, so dass man dann auch Auswertungen machen kann über ja, nachbarschaftliche Beziehungen, wie ist das, wie ist es da gelaufen, PlusIch habe auch die Fläche äh von jedem.Landkreis mittlerweile drin, so dass man dann auch Institzen pro Fläche äh oder so angeben äh.Kann. Also viele neue Möglichkeiten ähm aber jetzt nachdem halt leider sagt die alte Tabelle so falsche Zahlen auswirft, steht halt erstmal im Vordergrund,wie möglichst viele Features von der Tabelle zu rekonstruieren.
Hallo
Habe diese Folge noch nicht durchgehört.
Mir viel heute bei SPON ein Artikel der evtl. für hier oder den LNP relevant wäre. Gerade vor dem Hintergrund CWA vs. Luca-App.
Check-in direkt in der Warn-App – Wie QR-Codes in England gegen die Pandemie helfen: https://www.spiegel.de/netzwelt/apps/coorna-wie-qr-codes-in-england-gegen-die-pandemie-helfen-a-9d52dc9b-045f-4269-99e6-f2113f4ae62c
Ich kenne den Wunderheiler aus Lübeck nicht, bin aber doch erstaunt über die Message von Tim: wenn jemand nicht seinen Moralvorstellungen genügt, ist dessen Impfstoff per se schon mal verdächtig – ich denke, das sollte ausschließlich an die Anforderungen der Impfzuslassungen geknüfpft sein (die sind wohl schlicht nicht erfüllt) und nicht an Meinungen zur Flüchtlingskrise.
Wenn sich ohnehin Zweifel an der ethischen Eignung und sonstigen wissenschaftlichen Ausrichtung aufdrängen, dann scheinen mir solche Äußerungen durchaus ein sinnvoller Teil des Beurteilungsrahmens zu sein.
Es gibt durchaus Tätigkeiten, für die man charakterlich schlichtweg nicht geeignet sein kann. Das Testen von nicht zugelassenen Medizinprodukten gehört definitiv dazu.
Ehre, wem Ehre gebührt 😉 Der Link zum Einspieler von Peter Wittkamp
aka @diktator:
https://twitter.com/diktator/status/1367365765343625217
Enttäuschend wie in Politik, Medien, Gesellschaft und auch hier bei „laufen lassen“ Diskussionen die chronisch Kranken einfach vergessen werden. Wie beim Impfen ja weitgehend auch wie sich abzeichnet. Solidarität hört wohl bei Oma und Opa auf.
Lieber Tim,
das V in Sputnik V steht nicht für die Zahl 5, sondern für den Buchstaben „v“ wie in „vaccin“.
Laut Hersteller steht das v für „victory“. 🙂
https://www.mimikama.at/aktuelles/sputnik-v/
Hey Leute,
Immer wieder höre ich dass 80% der Infektionen nicht nachverfolgt werden können.
Aber was ist mit Leuten die nicht alleine leben? Da sollten doch die Gesundheitsämter sagen können dass das intern weiter gegeben wird. Ich denke dass allein die übrigen 20% mit Infektionen im selben Haushalt zu begründen sind. Bei einer Haushaltsgröße von im Mittel 2 sollte man sogar deutlich höher liegen.
Zudem gibts auch hier die „Dunkelziffer“. Hier gibts viele die sagen „ich hatte keine Kontakte, keine Ahnung woher das kommt“ damit, Zitat, „ihr weiter in Freiheit leben könnt“. Und das nachdem sie mehrmals pro Woche zu Zehnt ein paar Kästen Bier vernichten. Das ist halt abartig von den Menschen aber so sind manche.
LG
Flo
Hey Pavel, bevor du anfängst die ganze Visualisierung mit entsprechendem Frontend und Backend selbst zu implementieren, könntest du erwägen, eine Abstraktionsebene höher anzusetzen und dir Apache Superset ansehen. Superset ist Open Source, ein auf Python-Flask basierendes Business-Intelligence-Werkzeug, in dem man schöne interaktive Analysen bauen kann. Es hat kürzlich die Version 1.0 erreicht. Der Vorteil daran ist, dass so etwas wie Filterungen, Aggregationen und Diagramme schon eingebaut und einfach zu verwenden sind, Geo-Karten inklusive. Es steht als Docker-Container zur Verfügung und biete Verbindungen zu diversen Backends wie Postgres, Elasticsearch, Presto, Drill etc. Einen Blick in die Galerie kann ich empfehlen. 🙂
https://superset.apache.org/gallery
Für Wetter Daten scrapen: wttr.in vielleicht ne Alternative. Kann man schon mit curl benutzen.
Hi.
Was ist eigentlich aus den Impfstoff Fabriken geworden, die Bill Gates von seiner Stiftung bauen lassen wollte. Wenn ich danach google finde ich nur alte Berichte oder verschwörungssagen.
Der Bill, der stellt jetzt Schnee her!
wie auf twitter schon geschrieben: Wenn du mir spezifizierst, wie und welche Wetterdaten du haben willst, ich würde das gerne bauen. In einem Format, wo du nur die fertigen und kompletten Daten runterladen musst.
Ich hatte dem Podcast irgendwie entnommen das würde noch fehlen
Unter all den zu untersuchenden Korrelationen scheint die zum Pollenflug lohnend: https://www.tagesschau.de/inland/pollen-corona-101.html
Der Landkreis Germersheim ist gerade in in Rheinland-Pfalz der Landkreis mit der höchsten Inzidenz. Am Mittwoch, den 10.3.2021 informierte der Landrat, daß „bei der Nachverfolgung der Kontakte herausgefunden [wurde], dass sich die meisten Betroffenen in und vor Supermärkten, in Schnellimbissen und an Bushaltestellen angesteckt haben.“
Quelle: https://www.swr.de/swraktuell/rheinland-pfalz/liveblog-corona-100.html (10.3.2021)
Die passende Pressemitteilung: https://www.kreis-germersheim.de/kv_germersheim/Unsere%20Themen/Pressemitteilungen/2021/Neue%20Erkenntnisse%20%C3%BCber%20Infektionen%20im%20Landkreis%20%3A%20Ansteckungsorte%20identifiziert/
Hattet ihr es nicht gerade erst davon, daß es viele Ansteckungen beim Einkaufen gibt?
Hallo Tim, Hallo Pavel,
Ihr hattet im Podcast bemängelt, dass die Öffnungsstrategie der MPK ungeachtet des R-Wertes zu Öffnungen führt. Ich glaube, das stimmt nicht. Zumindest hat Frau Merkel in der Pressekonferenz mehrmals darauf hingewiesen, das die Öffnungsschritte nur dann passieren, wenn die Inzidenz stabil oder sinkend sind. Unter 50 aber stehende Inzidenz sollte also nicht zum Öffnen führen. Man sollte auch beachten, dass die Schritte immer 14 Tage Abstand haben. Nicht nur jetzt bei der Einführung.
Es geht laut Beschluss maximal auf die Regelungen vom 7. März zurück. Aber ab dem 1. März sind Schulen schon wieder teilweise geöffnet worden und es besteht im Beschluss nichts davon, dass das zurückgenommen werden soll, egal bei welcher Inzidenz.
Hallo
Auch im Vogtland gibt es scheinbar interessante Erkenntnisse aus den dort verstärkt durchgeführten Schnelltests:
“ Positivanteil bei Kindern viermal so hoch
Die ersten statistischen Auswertungen der Tests zeigen besonders im Bereich der Kinder einen hohen Positivanteil. „Wir haben in dem Zeitraum von zwölf Tagen 290 Kinder von null bis neun Jahren getestet“, so Nagel. „Die hatten einen Positivanteil, der viermal so hoch war wie beim Mittel der Bevölkerung.“ Die Wahrscheinlichkeit, dass ein Kind ohne Symptome positiv sei, sei daher viermal so hoch wie beim Rest der Bevölkerung. „Dazu kommt die Kategorien der Eltern, also 20 bis 30 und 30 bis 40 Jahre, die eine Positivrate zwischen 1,4 und 1,7 Prozent haben“, sagt er. Das sei noch fast das Doppelte dieser 0,8 Prozent Positivrate des Vogtlandkreises.“
von hier: https://www.mdr.de/sachsen/chemnitz/vogtland/corona-vogtland-tests-impfstrategie-100.html
Die steigende Inzidenz in den Altersgruppen gibt dem Recht, hier für Berlin:
https://www.berlin.de/corona/lagebericht/desktop/corona.html#altersgruppen
Es ist langsam einfach nur noch zum weglaufen.
Jetzt kann man ja kritisch diskutieren, ob die neue Schnallteststategie was bringt, oder eher nur Aktionismus vortäuscht, aber beim lesen des letzten Absatzes dieses Artikels viel mir fast der Kaffe auf dem Mund.
https://www.volksstimme.de/lokal/haldensleben/landkreis-boerde-corona-schnelltests-wider-willen
„Derzeit werden alle Lehrer und Erzieher einmal wöchentlich in den Einrichtungen auf das Coronavirus getestet. „Auch hier macht sich die Tendenz deutlich: Mehr Testungen, mehr positive Fälle, mehr Schulschließungen“, resümiert Marges. Dabei seien die Tests doch dafür da, die Schulen offen zu halten.“
Wer ist dieser „Marges“, der da auf Trump macht, magt ihr euch jetzt fragen. Der örtliche Depp der Querdenker, oder Vorsitzender des Ortsvereins der wütenden Deutschen?
Keine Ahnung, welchen Ansichten er so anhängt, aber hauptberuflich ist er Chef im örtlichen Gesundheitsamt.
Unfassbar, dass so einer den Zweck einer möglichst frühen Erkennung von Coronaausbrüchen an Schulen nicht erkennt….