Kako uvek baš umro jedan ili nijedan – statistika protiv zvaničnih podataka

Izvor: FB, 27. jun 2020 – Na Fejsbuku se protekle nedelje razvila zanimljiva polemika oko objavljivanja broja preminulih od korone, onog koji se zvanično prezentuje javnosti. Inicirao ju je Igor Smolić, nekadašnji šef Odeljenja za astronomiju u Petnici, sada u Laboratoriji za primenu računara u nauci beogradskog Instituta za fiziku. U najkraćem, statistika kao nauka ne može da se složi sa brojkama – nemoguće je da uvek bude jedan ili nijedan preminuo od korone dnevno, nikad dva ili više, i fali li onda više nula, dana kada nema umrlih. Uostalom pročitajte.

Dokaz da se iz nadležnih institucija plasiraju lažne informacije u vezi sa situacijom sa COVID-19 leži u zvaničnim brojevima preminulih u poslednja 24 časa. Po njima je tokom juna 18 puta umrla jedna, a 3 puta niti jedna osoba u poslednja 24 časa. Ukupno 18 umrlih za 21 dan, piše Smolić.

Ukoliko je (zvanična) stopa umiranja bila konstantna, a pretpostavimo na trenutak da je bila, broj umrlih za jedan dan mora odgovarati Poasonovoj distribuciji sa srednjom vrednošću od 18/21. Poasonova distribucija se očekuje kod ovakvih procesa, a kazuje nam koliko se posmatranih događaja (smrti) očekuje u fiksnom vremenskom intervalu (u ovom slučaju: dan) u zavisnosti od prosečne stope (umrlih za dan).
Na slici je prikazana zvanična i očekivana Poasonova distribucija.

Kada je srednja vrednost 18/21, tj. manja od 1, očekuje se da je broj dana sa nula preminulih osoba veći od broja dana kada premine jedna osoba, a nisu ni toliko malo verovatni dani kada se očekuje da umre dve i više osoba. Ovo je u očiglednom kontrastu sa zvaničnim podacima, a statistički testovi (npr. Kolmogorov-Smirnovljev, hi-kvadrat…) pokazuju da je verovatnoća da zvanični podaci ne odstupaju od očekivane Poasonove distribucije značajno manja od 1%. Ukratko, zvanični podaci ne odgovaraju prirodno očekivanoj distribuciji! Ovo važi i za bilo kojih sedam uzastopnih dana, ukoliko nas brine da (zvanična) stopa umiranja nije bila baš konstantna tokom celog perioda.

Ekipa je zaboravila, ili nije znala, da prirodni procesi ostavljaju u podacima „potpis“ na više mesta, i da nije teško uvideti kada su podaci fabrikovani, zaključuje Smolić.

Naravno, kako to obično biva na društvenim mrežama, ima i onih sa drugačijim mišljenjem.

– To je pod pretpostavkom da je umiranje potpuno slučajan proces sa fiksnom verovatnoćom i da svako od obolelih ima fiksnu verovatnoću da umre od korone. A niti je to slučajan proces niti je verovatnoća umiranja od korone fiksna, odgovara Smoliću Vladimir Hedrih.

– Potpuno je nebitno da li je stopa varirala. Samo iz broja jedinica vs sve ostalo je jasno da ovo nije produkt nezavisnih događaja. A na skali od dan moraju biti nezavisni, napisao je Milovan Šuvakov, Smolićev kolega iz Petnice.

Sviđa mi se tvoja analiza, ima tu nešto. Jedino se ne slažem da je stopa fiksna. Za tvoj period (mesec dana?) broj novozaraženih nije fiksan, broj ljudi na intenzivnoj nije fiksan, pa nije ni stopa novoumrlih fiksna. Jedino što ta varijacija najverovatnije ne može da objasni manjak ‘nula’ na koji ukazuješ, ali definitvno iskrivljuje distribuciju za određen stepen. Ima tu sigurno i drugih efekata koji je iskrivljuju (tipa recimo u Fr vidljivo manje ‘umiru’ vikendima a vidljivo više ponedeljkom, itd.). Definitivno je dobar gornji komentar, tj upoređivanje sa nekom drugom zemljom koja isto tako ima nizak broj umrlih po danu. To bi bio sjajan pokazatelj očekivanja ili ne pravilne Poasonove distribucije, piše Bojan Sič.

Nauka protiv „struke“, ili „nauka“ protiv struke – pitanje je sad.

Skorašnji članci

WP-Backgrounds Lite by InoPlugs Web Design and Juwelier Schönmann 1010 Wien