bych se vyhýbal. Když tam musíte psát konkrétní ID řádku, je to z pohledu programátora prohra ;). Podobně pro for cykly, pandas a spol. to umí rychleji.
Doplnění věku šlo udělat lépe. I když jste to rozdělil do 6 podskupin, i v rámci nich to je dost rozptýlené. Kolegové např. vysosali tituly ze jména a doplňovali to podle nich. Příp. šlo klasicky použít kNN atp.
Dost mi chybí tunění hyperparametrů, vzít defaultní nastavení rozhodovacího stromu by normálně nestačilo, zde jste měl ale štěstí, že pro takto malá a osekaná data to bylo blízko optimálním hodnotám.
Dobrý den,
trochu jsem na Vás zapomněl ale je to tady, posílám komentář k druhému úkolu.
Váš výsledek je accuracy 0.7799352750809061, což je lehce nadprůměrný výsledek vzhledem ke kolegům. Nejlepší se dostali přes 0.8, ale ne moc.
Oceňuji obsah notebooku a průzkum dat až na úroveň příběhů :).
Kódu typu
bych se vyhýbal. Když tam musíte psát konkrétní ID řádku, je to z pohledu programátora prohra ;). Podobně pro for cykly, pandas a spol. to umí rychleji.
Doplnění věku šlo udělat lépe. I když jste to rozdělil do 6 podskupin, i v rámci nich to je dost rozptýlené. Kolegové např. vysosali tituly ze jména a doplňovali to podle nich. Příp. šlo klasicky použít kNN atp.
Dost mi chybí tunění hyperparametrů, vzít defaultní nastavení rozhodovacího stromu by normálně nestačilo, zde jste měl ale štěstí, že pro takto malá a osekaná data to bylo blízko optimálním hodnotám.
Pro forma Vám dávám 8 bodů.
Mějte se! Doufám, že se Vám daří s diplomkou.
Karel