Kapitel 19

Hyperparameteroptimierung


Die neue Datenversion ist das Ergebnis der Feature Selection und eine Konsolidierung der letzten drei Varianten. Anna und Karl betrachten also nicht mehr drei Datenvarianten, sondern konzentrieren sich auf eine einzige. Diesmal befassen sich die beiden Trainees deshalb wieder stärker mit der Phase 4 (Modeling) und dort insb. mit dem Thema Hyperparameteroptimierung (HPO). Hyperparameter sind externe Parameter, mit denen Data Scientists die Modellierung steuern. Karl führte bisher manuelle Parameterstudien durch, um geeignete Einstellungen zu finden. Anna dagegen nutzte ihre Programmierkenntnisse, um dieses Vorgehen zu automatisieren. Beide Trainees lernen nun verschiedene Optimierungsstrategien kennen, bspw. die Rastersuche (Grid Search), die Zufallssuche (Random Search), die sukzessive Halbierung (Successive Halving) und die Bayes’sche Optimierung. Sie wenden diese Strategien natürlich wieder direkt auf die Titanic-Fallstudie an. Können Anna und Karl damit die Leistungsfähigkeit ihrer Modelle verbessern?

Keywords: Hyperparameter, Hyperparameteroptimierung (HPO), Rastersuche, Grid Search, Zufallssuche, Random Search, sukzessive Halbierung, Successive Halving, Bayes’sche Optimierung.


KNIME Videos und Workflows

Titanic_191_Phase_4_Modeling_TE

Workflow bei KNIME Community Hub
Tree Ensemble Learner
Tree Ensemble Predictor

Titanic_191_Phase_4_Modeling_TE.knwf


Titanic_192_Phase_4_Modeling_TE_Brute-Force

Workflow bei KNIME Community Hub
Parameter Optimization Loop Start
Parameter Optimization Loop End

Titanic_192_Phase_4_Modeling_TE_Brute-Force.knwf


Titanic_193_Phase_4_Modeling_TE_Random

Workflow bei KNIME Community Hub

Titanic_193_Phase_4_Modeling_TE_Random.knwf


Titanic_194_Phase_4_Modeling_TE_Hillcliming

Workflow bei KNIME Community Hub

Titanic_194_Phase_4_Modeling_TE_Hillcliming.knwf


Titanic_195_Phase_4_Modeling_TE_Bayesian

Workflow bei KNIME Community Hub

Titanic_195_Phase_4_Modeling_TE_Bayesian.knwf


Titanic_196_Phase_5_Evaluation_TE

Workflow bei KNIME Community Hub

Titanic_196_Phase_5_Evaluation_TE.knwf


Titanic_197_Phase_6_Deployment_TE

Workflow bei KNIME Community Hub

Titanic_197_Phase_6_Deployment_TE.knwf


Anaconda (Python) Jupyter Notebooks

Titanic_191_Phase_4_Modeling_GB / Titanic_192_Phase_4_Modeling_GB_GridSearch

Phase 4: Grid Search

Titanic_191_Phase_4_Modeling_GB.ipynb
Titanic_192_Phase_4_Modeling_GB_GridSearch.ipynb


Titanic_193_Phase_4_Modeling_GB_RandomizedSearch / Titanic_194_Phase_4_Modeling_GB_HalvingGridSearch / Titanic_195_Phase_4_Modeling_GB_HalvingRandomSearch / Titanic_196_Phase_5_Evaluation / Titanic_197_Phase_6_Deployment

Hyperparameteroptimierung (RS, HGS, HRS)

Titanic_193_Phase_4_Modeling_GB_RandomizedSearch.ipynb
Titanic_194_Phase_4_Modeling_GB_HalvingGridSearch.ipynb
Titanic_195_Phase_4_Modeling_GB_HalvingRandomSearch.ipynb
Titanic_196_Phase_5_Evaluation.ipynb
Titanic_197_Phase_6_Deployment.ipynb