A) Izračunavanje povprečij številčnih podatkov. B) Povzetek kategoričnih podatkov. C) Preučitev razmerja med spremenljivkami. D) ustvarjanje vizualnih predstavitev podatkov.
A) Kako dobro se model ujema z opazovanimi podatki. B) Velikost nabora podatkov. C) Vrsta uporabljenega statističnega testa. D) Število spremenljivk v modelu.
A) Neodvisnost opazovanj B) Linearnost C) Normalna porazdelitev ostankov D) Homoskedastičnost
A) Kadar je model preveč preprost in nima zadostne napovedne moči. B) Kadar se model popolnoma prilega podatkom za usposabljanje, vendar je neuspešen pri novih podatkih. C) Kadar je model preveč zapleten in zajame šum v podatkih. D) Ko je model ravno pravšnji in se dobro posplošuje na nepoznane podatke.
A) ANOVA B) Logistična regresija C) PCA D) Drevo odločanja
A) Za avtomatizacijo celotnega postopka modeliranja. B) Odstranitev vseh vhodnih spremenljivk razen najpomembnejše. C) Natančno prileganje modela podatkom za učenje. D) ustvarjanje novih vhodnih spremenljivk iz obstoječih podatkov za izboljšanje delovanja modela.
A) Povzetek porazdelitve nabora podatkov. B) Preverjanje predpostavke o linearnosti v regresijskih modelih. C) Oceniti ustreznost logistične regresije. D) Ocenjevanje uspešnosti klasifikacijskega modela.
A) Analiza glavnih komponent B) Navzkrižno preverjanje C) Regresijska analiza D) Test Chi-kvadrat
A) Ustvarjanje enega sestavljenega merila iz več spremenljivk. B) Izris podatkovnih točk v dvodimenzionalnem prostoru. C) Združevanje podobnih podatkovnih točk na podlagi vzorcev ali značilnosti. D) Raziskovanje vzročno-posledičnih povezav. |