Hyperparameteroptimierung
Die neue Datenversion ist das Ergebnis der Feature Selection und eine Konsolidierung der letzten drei Varianten. Anna und Karl betrachten also nicht mehr drei Datenvarianten, sondern konzentrieren sich auf eine einzige. Diesmal befassen sich die beiden Trainees deshalb wieder stärker mit der Phase 4 (Modeling) und dort insb. mit dem Thema Hyperparameteroptimierung (HPO). Hyperparameter sind externe Parameter, mit denen Data Scientists die Modellierung steuern. Karl führte bisher manuelle Parameterstudien durch, um geeignete Einstellungen zu finden. Anna dagegen nutzte ihre Programmierkenntnisse, um dieses Vorgehen zu automatisieren. Beide Trainees lernen nun verschiedene Optimierungsstrategien kennen, bspw. die Rastersuche (Grid Search), die Zufallssuche (Random Search), die sukzessive Halbierung (Successive Halving) und die Bayes’sche Optimierung. Sie wenden diese Strategien natürlich wieder direkt auf die Titanic-Fallstudie an. Können Anna und Karl damit die Leistungsfähigkeit ihrer Modelle verbessern?
Keywords: Hyperparameter, Hyperparameteroptimierung (HPO), Rastersuche, Grid Search, Zufallssuche, Random Search, sukzessive Halbierung, Successive Halving, Bayes’sche Optimierung.
KNIME Videos und Workflows
Titanic_191_Phase_4_Modeling_TE

Titanic_191_Phase_4_Modeling_TE.knwf
Titanic_192_Phase_4_Modeling_TE_Brute-Force

Titanic_192_Phase_4_Modeling_TE_Brute-Force.knwf
Titanic_193_Phase_4_Modeling_TE_Random

Titanic_193_Phase_4_Modeling_TE_Random.knwf
Titanic_194_Phase_4_Modeling_TE_Hillcliming

Titanic_194_Phase_4_Modeling_TE_Hillcliming.knwf
Titanic_195_Phase_4_Modeling_TE_Bayesian

Titanic_195_Phase_4_Modeling_TE_Bayesian.knwf
Titanic_196_Phase_5_Evaluation_TE

Titanic_196_Phase_5_Evaluation_TE.knwf
Titanic_197_Phase_6_Deployment_TE

Titanic_197_Phase_6_Deployment_TE.knwf
Anaconda (Python) Jupyter Notebooks
Titanic_191_Phase_4_Modeling_GB / Titanic_192_Phase_4_Modeling_GB_GridSearch
Titanic_191_Phase_4_Modeling_GB.ipynb
Titanic_192_Phase_4_Modeling_GB_GridSearch.ipynb
Titanic_193_Phase_4_Modeling_GB_RandomizedSearch / Titanic_194_Phase_4_Modeling_GB_HalvingGridSearch / Titanic_195_Phase_4_Modeling_GB_HalvingRandomSearch / Titanic_196_Phase_5_Evaluation / Titanic_197_Phase_6_Deployment
Titanic_193_Phase_4_Modeling_GB_RandomizedSearch.ipynb
Titanic_194_Phase_4_Modeling_GB_HalvingGridSearch.ipynb
Titanic_195_Phase_4_Modeling_GB_HalvingRandomSearch.ipynb
Titanic_196_Phase_5_Evaluation.ipynb
Titanic_197_Phase_6_Deployment.ipynb