Mehrklassen-Klassifikation
Die genaue Schätzung des Alters eines Passagiers der Titanic ist mit den gegebenen Daten schwer. Vielleicht ist es einfacher, stattdessen den Altersbereich vorherzusagen. Hierzu können Anna und Karl mit Hilfe der Binning-Technik eine solche Einteilung vornehmen. Sie bekommen dann bspw. die folgenden Kategorien bzw. Klassen: Child, Teenage, Young, Adult, Middle, Senior. Das neue Zielattribut nennen sie
AgeBinned
. Dieses ist nun nicht mehr kardinal-, sondern ordinalskaliert. Da es mehr als zwei Klassen gibt, handelt es sich bei dieser Aufgabenstellung um eine Mehrklassen-Klassifikation. Als Klassifizierer verwenden die beiden Trainees wieder die bekannten Klassifikationsmethoden. Einige dieser Methoden sind eigentlich nicht für viele Klassen entwickelt worden, lassen sich aber auf die binäre Klassifikation zurückführen. Die Bewertung ist jedoch nicht ganz so einfach. Es gibt eine Mikro- und Makro-Mittelwertbildung zu Gütemaßen wie bspw. Präzision, Recall und das F-Maß. Außerdem benutzen Anna und Karl ein neues Güte- bzw. Fehlermaß: den LogLoss bzw. die Kreuzentropie. Am Ende stehen sie als Gewinner mit einem Pokal in den Händen da und Max ist mächtig stolz auf sie.
Keywords: Mehrklassen-Klassifikation, Binning, One vs. All, One vs. One, Mikro-Mittelwertbildung, Makro-Mittelwertbildung, LogLoss, Kreuzentropie, Naive Bayes, Entscheidungsbaum, Multilayer-Perzeptron, Support Vector Machine, logistische Regression, Random Forest, Gradient Boosted Trees.
KNIME Videos und Workflows
Titanic_151_AgeBinned_Phase_3_Binning_Idee

Titanic_151_AgeBinned_Phase_3_Binning_Idee.knwf
Titanic_152_AgeBinned_Phase_3_Data_Preparation_v2

Titanic_152_AgeBinned_Phase_3_Data_Preparation_v2.knwf
Titanic_153_AgeBinned_Phase_4_Modeling_(a)_kNN

Titanic_153_AgeBinned_Phase_4_Modeling_(a)_kNN.knwf
Titanic_153_AgeBinned_Phase_4_Modeling_(b)_NB

Titanic_153_AgeBinned_Phase_4_Modeling_(b)_NB.knwf
Titanic_153_AgeBinned_Phase_4_Modeling_(c)_DT

Titanic_153_AgeBinned_Phase_4_Modeling_(c)_DT.knwf
Titanic_153_AgeBinned_Phase_4_Modeling_(d)_MLP

Titanic_153_AgeBinned_Phase_4_Modeling_(d)_MLP.knwf
Titanic_153_AgeBinned_Phase_4_Modeling_(e)_SVM

Titanic_153_AgeBinned_Phase_4_Modeling_(e)_SVM.knwf
Titanic_153_AgeBinned_Phase_4_Modeling_(f)_LR

Titanic_153_AgeBinned_Phase_4_Modeling_(f)_LR.knwf
Titanic_153_AgeBinned_Phase_4_Modeling_(g)_RF

Titanic_153_AgeBinned_Phase_4_Modeling_(g)_RF.knwf
Titanic_153_AgeBinned_Phase_4_Modeling_(h)_GBT

Titanic_153_AgeBinned_Phase_4_Modeling_(h)_GBT.knwf
Titanic_154_AgeBinned_Phase_5_Evaluation

Titanic_154_AgeBinned_Phase_5_Evaluation.knwf
Titanic_155_AgeBinned_Phase_6_Deployment

Titanic_155_AgeBinned_Phase_6_Deployment.knwf
Anaconda (Python) Jupyter Notebooks
Titanic_151_AgeBinned_Phase_3_Binning_Idee
Titanic_151_AgeBinned_Phase_3_Binning_Idee.ipynb
Titanic_151_AgeBinned_Phase_3_Binning_Idee_Seaborn.ipynb
Titanic_152_AgeBinned_Phase_3_Data_Preparation_v2
Titanic_152_AgeBinned_Phase_3_Data_Preparation_v2.ipynb
Titanic_153_AgeBinned_Phase_4_Modeling
Titanic_153_AgeBinned_Phase_4_Modeling.ipynb
Titanic_154_AgeBinned_Phase_5_Evaluation / Titanic_155_AgeBinned_Phase_6_Deployment
Titanic_154_AgeBinned_Phase_5_Evaluation.ipynb
Titanic_155_AgeBinned_Phase_6_Deployment.ipynb