Connect with us

Ajánló

Nem hagyományos könyvajánló: Adatok vs COVID-19… meg egy kis gin-tonic

Fotó: Babák Zoltán
Fotó: Babák Zoltán

Karácsonyra könyveket kértem, hogy majd egy lazább időszakban kiülök a teraszra, és elolvasom. Ez valahogy nem akar beköszönteni, bár a karantén elején azért volt rá halvány remény. Ekkor elő is vettem párat, hogy párhuzamosan elolvasgatom őket. A legmesszebbre eddig A Gin szellemében jutottam…

De igazából itt most Kenneth Cukier – Viktor Mayer-Schönberger Big data című könyvét szerettem volna ajánlani.

Ne ijedjen meg senki! Ez nem egy informatikusoknak szóló könyv, inkább egy sztorigyűjtemény, ami minden informatikai véna nélkül is érdekes lehet. Informatikai vénával inkább a Barabási Albert László által jegyzett A hálózatok tudománya című könyvnek feküdjön neki, ami lényegesen nehezebb könyv – 1819 gramm – mint a Big data, ami csak 562! Ahhoz kelleni fog egy-egy pohár gin-tonic is! Barabási Albert László egyébként ennek a friss tudományágnak, a hálózatkutatásnak a szakértője. Bár Amerikában él és dolgozik, számtalanszor megnyilatkozott a mainstream magyar sajtóban a vírus terjedésének modellezésével kapcsolatban.

Ahogy a Big data kezdődik, az ember elgondolkodik, hogy a fenébe tudott ekkorát menni a COVID-19, mikor már a 2009-es H1N1 terjedését a techóriások pontosabban modellezték le mint a közegészségügyi hatóságok politikai támogatással.

Így kezdődik, és hasonlóan is folytatódik. Mondom, sztorigyűjtemény, jó bevezetés abba, hogy mit lehet ma kezdeni az adatokkal. Már ha ért hozzá a kezelője… és itt elérkeztünk a mába. Az elmúlt napokban hatalmas felhördülést váltott ki a titkosszolgálatokat érintő törvény módosítása, ami után mindenki attól tart, hogy a róla gyűjtött adatokban fognak turkálni a szolgálatok. 😂😂😂

2009-BEN EGY KORÁBBAN ISMERETLEN influenzavírust fedeztek fel. Az új törzs, amely egyesítette a madár- és a sertésinfluenzát okozó vírusok tulajdonságait, a H1N1 nevet kapta, és rendkívül gyorsan terjedt. Sok országban a közegészségügyi hatóságok egy borzalmas világjárvány kitörésétől tartottak. Egyes híradások már azt emlegették, hogy hasonló méreteket ölthet, mint az 1918-as spanyolnáthajárvány, amely félmilliárd embert fertőzött meg, és több tízmillió beteggel végzett. Az új vírus ellen ráadásul nem volt oltóanyag. A hatóságok csak abban reménykedhettek, hogy lassíthatják a járvány terjedését. Ehhez azonban ki kellett deríteni, hol ütötte már fel a fejét.

Az amerikai járványügyi hivatal, a Centers for Disease Control and Prevention (CDC) arra kérte az orvosokat, jelentsék a friss influenzás megbetegedéseket. Csakhogy a szakemberek így egy-két héttel mindig le voltak maradva a valós helyzethez képest. Az első tünetek jelentkezése után az emberek általában vártak néhány napot, mielőtt orvoshoz fordultak volna, emellett a jelentéseket is időbe telt eljuttatni a hivatalhoz, a CDC pedig csak heti egy alkalommal készített kimutatást. Egy gyorsan terjedő kór esetében két hét késés maga az örökkévalóság, ezért a közegészségügyi hatóság épp a legválságosabb pillanatokban bizonyult tehetetlennek.

Néhány héttel azelőtt, hogy a H1N1 vírus feltűnt volna az újságok címlapján, a Google fejlesztői közreadtak egy figyelemre méltó tanulmányt a Nature című természettudományos folyóiratban.[1] Bár a cikk nagy feltűnést keltett a közegészségügyi és az informatikai szakmai berkekben, egyébként nem volt visszhangja. A szerzők kifejtették, hogyan tudná prognosztizálni a Google a téli influenza terjedését az Egyesült Államokban, méghozzá nemcsak országos szinten, hanem régiókra, sőt egyes államokra lebontva is, azáltal hogy nyomon követi, mire keresnek rá az emberek az interneten. Mivel a Google nap mint nap több mint 3 milliárd keresést hajt végre és ment el, rengeteg felhasználható adat állt rendelkezésre.

A Google kilistázta az amerikaiak által leggyakrabban keresett 50 millió kifejezést, majd ezt összevetette a szezonális influenza 2003–2008 közötti terjedésére vonatkozó CDC-adatokkal. Az ötlet az volt, hogy az internetes keresések alapján feltérképezik a már fertőzött területeket. Mások is próbálkoztak már az internetes keresőkifejezések alapján ugyanezzel, csakhogy nekik nem állt rendelkezésükre olyan sok adat, akkora feldolgozókapacitás, és nem volt olyan statisztikai szakértelmük, mint a Google-nak.
Bár a Google-nál abból indultak ki, hogy az emberek az influenzával kapcsolatos információkra keresnek rá – például olyan kifejezésekre, mint „gyógyszer köhögésre és lázra” -, nem ez volt a lényeg: valójában olyan rendszert terveztek, amely magukkal a kifejezésekkel nem is foglalkozott. A programjuk nem tett egyebet, mint összefüggéseket keresett egyes keresési lekérdezések és az influenza tér- és időbeli elterjedtsége között. 450 millió különféle matematikai modellt próbáltak ki a keresési kifejezések tesztelésére, összevetve saját előrejelzéseiket a CDC által 2007-ben és 2008-ban rögzített influenzás megbetegedések adataival. És igazi kincsre bukkantak: szoftverjük 45 olyan keresőkifejezés-kombinációt talált, amelyeket együttesen egy matematikai modellben alkalmazva, szoros összefüggést mutattak a prognózisaik és a hivatalos országos statisztikák között. A CDC-hez hasonlóan most már a Google is körvonalazni tudta az influenza területi elterjedtségét, ám a CDC-vel ellentétben szinte valós idejű járványtérképpel rendelkezett, nem pedig olyannal, amely az egy-két héttel korábbi állapotot mutatta.

Így történt, hogy 2009-ben, a H1N1-válság kirobbanásakor a Google rendszere hasznosabbnak és pontosabbnak bizonyult a késésben lévő kormányzati statisztikáknál. A közegészségügyi tisztviselők immár értékes információk birtokába juthattak.

Lényeges különbség, hogy a Google módszeréhez nincs szükség kenetek vizsgálatára, és háziorvoshoz sem kell fordulni. Ez a módszer az ún. big datára épül, vagyis a társadalom azon képességére, hogy az információt új módon munkára fogva hasznos felismerésekhez, értékes árucikkekhez vagy szolgáltatásokhoz juthatunk. Ennek köszönhetően az emberiség már egy korábbiaknál hatékonyabb eszközbirtokában készülhet fel egy esetleges új világjárványra.

Aki eddig eljutott, és érdeklődése nem lankadt, itt beleolvashat.

Népszerű

Fotó: Babák Zoltán Fotó: Babák Zoltán

Nézők nélkül fejeződött be a teremfoci-bajnokság

Sport

Pavilon-projekt: Pirruszi vereség budiügyben

Közérdekű

A Libalapos csapata: Kiss Márton, Lizon Loretta, Németh Judit, Földi Zsolt és Gál Patrik A Libalapos csapata: Kiss Márton, Lizon Loretta, Németh Judit, Földi Zsolt és Gál Patrik

A járvány után újraindult a Fakupa

Sport

Sadie Mulholland (Fotó: Babák Zoltán) Sadie Mulholland (Fotó: Babák Zoltán)

Szarvas és Cardiff után Sadie London bevételét tervezi

Koncert

A rovatot támogatja:

Archívum

2020. május
h k s c p s v
« ápr    
 123
45678910
11121314151617
18192021222324
25262728293031

Kategóriák

Friss

Hirdetés

Connect