Dane, dane, dane…
…gdzie są te dane!
Nie chcąc zbyt wiele pisać na ten temat podepnę wpis z portalu Smarter Poland (poświęconego różnym ciekawym sposobom przetwarzania danych). Opiekunem portalu jest Przemysław Biecek (absolwent Politechniki Wrocławskiej), z którym miałem przyjemność kiedyś się spotkać…
Rząd Polski publikuje dane na temat rozwoju pandemii w postaci wpisów twitterowych, bardzo chętnie umieszczając tam infografiki zawierające różne pożyteczne informacje (o liczbie zajętych respiratorów, na przykład). Oczywiście, można zapytać cóż w tym złego? Niby nic, ale taki Rząd Włoski publikuje dane na githubie: Presidenza del Consiglio dei Ministri – Dipartimento della Protezione Civile. Czyli można inaczej.
W Polsce wszyscy podniecają się, że dane takie ręcznie zbiera i publikuje jako arkusz kalkulacyjny Google nastolatek z Torunia. Z danych tych korzystają praktycznie wszystkie zespoły naukowe chcące dokonywać jakichś prognoz.
Na koniec zobaczmy co pisze Przemysław Biecek:
Dlaczego dostępność dobrej jakości danych jest taka ważna?
Brak dobrej jakości danych paraliżuje prace niezliczonej ilości podmiotów. Począwszy od modelarzy, którzy miesiącami opracowują modele predykcyjne dla możliwych scenariuszy pandemii, przez właścicieli małych biznesów, którzy nie wiedząc jak wygląda sytuacja nie mogą efektywnie planować swojej pracy, po szeregowych obywateli, którzy po prostu chcą wiedzieć co się dzieje. Bardzo chcą wiedzieć, więc jeżeli nie będzie oficjalnych rzetelnych danych to tworzy się przestrzeń dla fakenewsów.