Wstęp
Połowa semestru. Potraktujmy te zajęcia jako pewnego rodzaju „sprawdzian”. Termin oddania prac wyniesie trzy tygodnie i nie zostanie przedłużony.
To co państwo mają zrobić nie jest specjalnie trudne, ale musicie — żeby zdobyć dobrą ocenę — mnie zadziwić. Poniżej przykładowe zestawy danych i ewentualne zadania.
Temat 1
Dane
Do wykonania
- import danych;
- ewentualne ich wyczyszczenie;
- podstawowa analiza statystyczna (jak na wykładzie);
- coś co mnie zadziwi 😄;
dla jednego albo drugiego zestawu danych1.
Statystyki prezentowane na wykładzie (live script)
Temat 2
Dane i materiały pomocnicze:
- „stare dane covidowe” w formacie CSV (plik skompresowany zip)
- skrypt importu danych (live) omawiany na wykładzie
- skrypt prostego „przetwarzania” danych prezentowany na wykładzie
Do wykonania
- przedstawienie na jednym wykresie danych z lat 2020–2024 dla Polski (w skrypcie są dane od pierwszego września)
- porównanie na jednym wykresie wybranej statystyki (innej niż
new_cases
,new_cases_smoothed
) dla dwu (lub więcej) wybranych państw. Zwracam też uwagę, że ze względu na różną liczność populacji — lepiej porównywać parametry na tysiąć lub milion mieszkańców.
Temat 3
Dane i materiały pomocnicze
- nowe dane kowidowe (plik CSV jako archiwum zip)
- plik metadanych opisujących zawartość danych (trochę o metadanych było na wykładzie) , plik JSON2.
Do wykonania
- zadania jak w Temacie 2
Temat 4
Dane pomocnicze
Format pliku identyczny jak ten opisany w w Zadaniu 2 z poprzedniego projektu.
Cechą charakterystyczną czujnika jest to, że wysyła informacje dosyć często i zazwyczaj są to wartości różniące się od poprzedniej o $\pm .1$ stopnia Celsjusza, co powoduje, że dane są „zaszumione”.
Do wykonania
- wygładzenie przebiegu,
- ewentualne zmniejszenie liczby próbek3;
Nie mam teraz pewności, ale najprawdopodobniej prawidłowy import zmiennych czasowych może mieć wpływ na wymniki zadania4.
Hint:
- Są takie funkcje
movemean()
(używana w skrypcie z Tematu 2),smoothdata()
- W Live Script można użyć zadania (Task) Smooth Data.
- Polecam rozdział z dokumentacji MATLABa Data Smoothing and Outlier Detection
Zakończenie
Do zrobienia jest od jednego do czterech z wymienionych zadań.
Dobrze napisany algorytm (skrypt) skoro radzi sobie z jednym zestawem danych powinie radzić sobie i z drugim! ↩︎
Import pliku JSON omówiony był na wykładzie ↩︎
O redukcji liczby pomiarów będzie mowa na kolejnym wykładzie. ↩︎
O sposobie odczytu i konwersji czasu do wartosci
double
było w Zadaniu 2 i 3 z poprzednich zajęć ↩︎