Kapitel 14

Bekannte Methoden


Die ersten Ergebnisse der Regressionsanalyse sehen vielversprechend aus. Trotzdem gibt es noch Luft nach oben. Deshalb probieren Anna und Karl nun bekannte Methoden aus. Entscheidungsbäume haben sie bereits zur Klassifizierung benutzt. Mit dem Algorithmus CART können wir Entscheidungsbäume sowohl für die Klassifikation als auch für die Regression konstruieren. Aus vielen Entscheidungsbäumen bilden wir wiederum Ensembles: Random Forest und Gradient Boosted Trees. Statt einer Abstimmung der einzelnen Modelle, wird nun jedoch der Mittelwert der Schätzungen berechnet. Ein neuronales Netz, speziell das Multilayer-Perzeptron, kann ebenfalls Regressionsprobleme bearbeiten. Mit diesen elaborierten Methoden schlagen die beiden Trainees die bisherigen. Allerdings kommen Anna und Karl zu unterschiedlichen Testergebnissen. Ihre besten trainierten Modelle haben sie mit unterschiedlichen Methoden erstellt. Das hat Auswirkungen auf zukünftige Prognosen.

Keywords: Regression Tree, CART, Random Forest, Gradient Boosted Trees, Multilayer-Perzeptron.


KNIME Videos und Workflows

Titanic_141_Age_Phase_4_Modeling_RT

Workflow bei KNIME Community Hub
Simple Regression Tree Learner
Simple Regression Tree Predictor

Titanic_141_Age_Phase_4_Modeling_RT.knwf


Titanic_142_Age_Phase_4_Modeling_RF

Workflow bei KNIME Community Hub
Random Forest Learner (Regression)
Random Forest Predictor (Regression)

Titanic_142_Age_Phase_4_Modeling_RF.knwf


Titanic_143_Age_Phase_4_Modeling_GBT

Workflow bei KNIME Community Hub
Gradient Boosted Trees Learner (Regression)
Gradient Boosted Trees Predictor (Regression)

Titanic_143_Age_Phase_4_Modeling_GBT.knwf


Titanic_144_Age_Phase_4_Modeling_MLP

Workflow bei KNIME Community Hub
Denormalizer (PMML)
Column Rename (Regex)

Titanic_144_Age_Phase_4_Modeling_MLP.knwf


Titanic_145_Age_Phase_5_Evaluation

Workflow bei KNIME Community Hub

Titanic_145_Age_Phase_5_Evaluation.knwf


Titanic_146_Age_Phase_6_Deployment

Workflow bei KNIME Community Hub

Titanic_146_Age_Phase_6_Deployment.knwf


Anaconda (Python) Jupyter Notebooks

Titanic_141_Age_Phase_4_Modeling_RT

Age Phase 4: RT

Titanic_141_Age_Phase_4_Modeling_RT.ipynb


Titanic_142_Age_Phase_4_Modeling_RFR / Titanic_143_Age_Phase_4_Modeling_GBR / Titanic_144_Age_Phase_4_Modeling_MLR

Age Phase 4: RFR GBR MLR

Titanic_142_Age_Phase_4_Modeling_RFR.ipynb
Titanic_143_Age_Phase_4_Modeling_GBR.ipynb
Titanic_144_Age_Phase_4_Modeling_MLR.ipynb


Titanic_145_Age_Phase_5_Evaluation

Age Phase 5: Evaluation

Titanic_145_Age_Phase_5_Evaluation.ipynb


Titanic_146_Age_Phase_6_Deployment

Age Phase 6: Deployment

Titanic_146_Age_Phase_6_Deployment.ipynb


Titanic_149_Age_Phase_4_Modeling_SVR

Titanic_149_Age_Phase_4_Modeling_SVR.ipynb