Strojno učenje v praksi - tečaj 41.500 rub. iz izobraževalnega centra IBS, usposabljanje 24 ur, datum 26. november 2023.
Miscellanea / / December 02, 2023
Tečaj temelji na več praktičnih primerih, ki vsebujejo tabele z začetnimi podatki.
Za vsak primer gremo skozi celoten življenjski cikel projekta strojnega učenja:
raziskovanje, čiščenje in priprava podatkov,
izbira metode usposabljanja, ki je primerna za nalogo (linearna regresija za regresijo, naključni gozd za klasifikacijo, K-means in DBSCAN za grozdenje),
usposabljanje po izbrani metodi,
ocena rezultatov,
optimizacija modela,
predstavitev rezultata stranki.
Med diskusijskim delom predmeta razpravljamo o praktičnih problemih, s katerimi se soočajo študenti, ki jih je mogoče rešiti z obravnavanimi metodami.
Zajete teme:
1. Pregled naloge (teorija – 1 ura)
Katere probleme strojno učenje dobro rešuje in katere probleme poskuša rešiti?
Kaj se zgodi, če namesto podatkovnega znanstvenika najamete nestrokovnjaka na tem področju (samo razvijalca/analitika/vodjo) s pričakovanjem, da se bo učil v procesu.
2. Priprava, čiščenje, raziskava podatkov (teorija – 1 ura, praksa – 1 ura)
Kako razumeti izvorne poslovne podatke (in na splošno zaznati kakršen koli vrstni red v njih).
Zaporedje obdelave.
Kaj lahko in bi morali prenesti na domenske analitike in kaj najbolje naredi Data Scientist sam.
Prioritete za rešitev določenega problema.
3. Klasifikatorji in regresorji (teorija – 2 uri, praksa – 2 uri)
Praktični del - dobro formalizirane naloge s pripravljenimi podatki.
Razlika med nalogami (binarna/nebinarna/probabilistična klasifikacija, regresija), prerazporeditev nalog med razredi.
Primeri klasifikacije praktičnih problemov.
4. Grozdenje (teorija – 1 ura, praksa – 2 uri)
Kje in kako izvesti grozdenje: raziskava podatkov, preverjanje navedbe problema, preverjanje rezultatov.
Katere primere je mogoče zmanjšati na združevanje.
5. Evalvacija modela (teorija – 1 ura, praksa – 1 ura)
Poslovne metrike in tehnične metrike.
Metrike za probleme klasifikacije in regresije, matrika napak.
Notranje in zunanje metrike kakovosti grozdenja.
Navzkrižno preverjanje.
Ocenjevanje prekvalifikacije.
6. Optimizacija (teorija – 5 ur, praksa – 3 ure)
Zakaj je en model boljši od drugega: parametri, funkcije, sklopi.
Upravljanje nastavitev.
Praksa izbire funkcij.
Pregled orodij za iskanje najboljših parametrov, funkcij in metod.
7. Grafi, poročila, delo z živimi nalogami (teorija – 2 uri, praksa – 2 uri)
Kako jasno razložiti, kaj se dogaja: sebi, ekipi, stranki.
Več lepih odgovorov na nesmiselna vprašanja.
Kako predstaviti tri terabajte rezultatov na enem diapozitivu.
Polavtomatski testi, katere kontrolne točke procesa so res potrebne.
Od nalog v živo do celotnega R&R procesa (»R&R v praksi«) - analiza in analiza nalog iz publike.