Generalizirani linearni modeli - tečaj 3600 rub. iz odprtega izobraževanja, usposabljanje 3 tedne, približno 6 ur na teden, datum 29. november 2023.
Miscellanea / / December 01, 2023
Eden od pogojev za uporabnost običajnih linearnih modelov je medsebojna neodvisnost opazovanj, na podlagi katerih se izbere model. Vendar pa v praksi pogosto prihaja do situacij, ko je zasnova zbiranja gradiva takšna, da je kršitev tega pogoja neizogibna. Predstavljajte si, da ste se odločili zgraditi model, ki opisuje razmerje med uspešnostjo telesne vzgoje in rezultati testov IQ med učenci. Da bi rešili ta problem, ste naredili številne vzorce na več institucijah. Ali je mogoče takšne podatke združiti v eno analizo, zgrajeno po tradicionalni shemi? Seveda ne. Študenti na vsaki univerzi so si lahko na nek način podobni. Tudi narava razmerja med preučevanimi količinami je lahko nekoliko drugačna. To vrsto podatkov, v katerih so medskupinske korelacije, je treba analizirati z uporabo linearnih mešanih modelov. Pokazali bomo, da je treba nekatere napovednike vključiti v model kot tako imenovane »naključne dejavnike«. Naučili se boste, da so naključni dejavniki lahko hierarhično podrejeni. Razpravljali bomo o tem, kako je mogoče zgraditi takšne mešane modele za odvisne spremenljivke, ki sledijo različnim vrstam porazdelitev. Poleg tega bomo pokazali, da je naključni del modela lahko še bolj kompleksen – lahko ima komponento, ki modelira obnašanje variance kot odziv na vpliv kovariate. Na koncu tečaja boste našli projekt, v katerem lahko vadite gradnjo mešanih modelov z izbiro enega od več nizov podatkov. Na podlagi analize teh podatkov lahko ustvarite poročilo v tradiciji ponovljivih raziskav.
Izredni profesor, Oddelek za zoologijo nevretenčarjev, Fakulteta za biologijo, Državna univerza v Sankt Peterburgu, dr.
Znanstveni interesi: struktura in dinamika združb morskega bentosa, prostorske lestvice, sukcesija, medvrstno in znotrajvrstno biotske interakcije, rast in razmnoževanje morskih nevretenčarjev, demografska struktura populacij, mikroevolucija, biostatistika.
Tečaj je sestavljen iz 4 modulov:
1) Uvod v generalizirane linearne modele
Splošni linearni modeli (GLM) vam omogočajo modeliranje obnašanja količin, ki ne sledijo normalni porazdelitvi. Da bi vam olajšali prve korake v svetu GLM, bomo analizirali njihovo strukturo na primeru GLM za normalno porazdeljene količine – tako lahko povlečete vzporednice s preprostimi linearnimi modeli. Naučili se boste, kaj je povezovalna funkcija, kako deluje največja verjetnost in kako preizkusiti hipoteze GLM z uporabo Waldovih testov in testov razmerja verjetnosti.
2) Problem izbire modela
V tem modulu bomo govorili o metodoloških vprašanjih, povezanih z gradnjo modelov. Model je poenostavljena predstavitev realnosti in izbiranje med različnimi konkurenčnimi metodami takšne poenostavitve je pogosta naloga analitika. V tem modulu se boste naučili primerjati modele z uporabo meril informacij. Razpravljali bomo o glavnih možnostih analize pri izbiri modelov in govorili o težavah, ki nastanejo v povezavi s skrito množico modelov. Nazadnje vas bomo naučili prepoznati glavne vrste zlorab pri izbiri modelov (data-fishing, p-hacking).
3) Posplošeni linearni modeli za štetje podatkov
V tem modulu bomo razpravljali o osnovnih metodah za modeliranje števnih količin. Najprej bomo razpravljali o tem, zakaj običajni linearni modeli niso primerni za štetje podatkov. Lastnosti štetnih porazdelitev vam bodo pomagale razumeti razlike med vrstami GLM za štetne podatke in značilnosti njihove diagnostike. Funkcijo povezave boste videli na delu, ko boste vizualizirali napovedi GLM na lestvici funkcije povezave in na lestvici spremenljivke odziva.
4) Posplošeni linearni modeli z binarnim odzivom
Včasih je treba simulirati, ali se je dogodek zgodil ali ne, ali je nogometno moštvo ali izgubljeno, ne glede na to, ali si je pacient po zdravljenju opomogel ali ne, ali se je stranka zavezala nakup ali ne. Običajni linearni modeli niso primerni za modeliranje takšnih binarnih podatkov (dogodkov z dvema izidoma), vendar je to mogoče enostavno narediti z uporabo generaliziranih linearnih modelov. V tem modulu se boste naučili modelirati verjetnosti dogodkov tako, da jih predstavite kot kvote. Ogledali si bomo, kako deluje povezovalna funkcija logit in kako se razlagajo koeficienti GLM, ko se uporablja. Končno boste lahko vadili analizo posplošenih linearnih modelov z različnimi porazdelitvami z dokončanjem projekta analize podatkov. Rezultate te analize bo treba predstaviti kot poročilo v formatu html, napisano z rmarkdown/knitr.
• Naučite se, katere veščine potrebujete za začetek analitike in podatkovne znanosti • Naučite se uporabljati Excel, SQL, Power BI, Google Data Studio za delo podatke in napišite svojo prvo kodo v Pythonu• Pridobite vodnik po korakih in se naučite, kako vstopiti na področje znanosti o podatkih in izbrati vlogo v znanosti o podatkih
4,4
1 490 ₽