Kapitel 15

Mehrklassen-Klassifikation


Die genaue Schätzung des Alters eines Passagiers der Titanic ist mit den gegebenen Daten schwer. Vielleicht ist es einfacher, stattdessen den Altersbereich vorherzusagen. Hierzu können Anna und Karl mit Hilfe der Binning-Technik eine solche Einteilung vornehmen. Sie bekommen dann bspw. die folgenden Kategorien bzw. Klassen: Child, Teenage, Young, Adult, Middle, Senior. Das neue Zielattribut nennen sie AgeBinned . Dieses ist nun nicht mehr kardinal-, sondern ordinalskaliert. Da es mehr als zwei Klassen gibt, handelt es sich bei dieser Aufgabenstellung um eine Mehrklassen-Klassifikation. Als Klassifizierer verwenden die beiden Trainees wieder die bekannten Klassifikationsmethoden. Einige dieser Methoden sind eigentlich nicht für viele Klassen entwickelt worden, lassen sich aber auf die binäre Klassifikation zurückführen. Die Bewertung ist jedoch nicht ganz so einfach. Es gibt eine Mikro- und Makro-Mittelwertbildung zu Gütemaßen wie bspw. Präzision, Recall und das F-Maß. Außerdem benutzen Anna und Karl ein neues Güte- bzw. Fehlermaß: den LogLoss bzw. die Kreuzentropie. Am Ende stehen sie als Gewinner mit einem Pokal in den Händen da und Max ist mächtig stolz auf sie.

Keywords: Mehrklassen-Klassifikation, Binning, One vs. All, One vs. One, Mikro-Mittelwertbildung, Makro-Mittelwertbildung, LogLoss, Kreuzentropie, Naive Bayes, Entscheidungsbaum, Multilayer-Perzeptron, Support Vector Machine, logistische Regression, Random Forest, Gradient Boosted Trees.


KNIME Videos und Workflows

Titanic_151_AgeBinned_Phase_3_Binning_Idee

Workflow bei KNIME Community Hub

Titanic_151_AgeBinned_Phase_3_Binning_Idee.knwf


Titanic_152_AgeBinned_Phase_3_Data_Preparation_v2

Workflow bei KNIME Community Hub

Titanic_152_AgeBinned_Phase_3_Data_Preparation_v2.knwf


Titanic_153_AgeBinned_Phase_4_Modeling_(a)_kNN

Workflow bei KNIME Community Hub

Titanic_153_AgeBinned_Phase_4_Modeling_(a)_kNN.knwf


Titanic_153_AgeBinned_Phase_4_Modeling_(b)_NB

Workflow bei KNIME Community Hub

Titanic_153_AgeBinned_Phase_4_Modeling_(b)_NB.knwf


Titanic_153_AgeBinned_Phase_4_Modeling_(c)_DT

Workflow bei KNIME Community Hub

Titanic_153_AgeBinned_Phase_4_Modeling_(c)_DT.knwf


Titanic_153_AgeBinned_Phase_4_Modeling_(d)_MLP

Workflow bei KNIME Community Hub

Titanic_153_AgeBinned_Phase_4_Modeling_(d)_MLP.knwf


Titanic_153_AgeBinned_Phase_4_Modeling_(e)_SVM

Workflow bei KNIME Community Hub

Titanic_153_AgeBinned_Phase_4_Modeling_(e)_SVM.knwf


Titanic_153_AgeBinned_Phase_4_Modeling_(f)_LR

Workflow bei KNIME Community Hub

Titanic_153_AgeBinned_Phase_4_Modeling_(f)_LR.knwf


Titanic_153_AgeBinned_Phase_4_Modeling_(g)_RF

Workflow bei KNIME Community Hub

Titanic_153_AgeBinned_Phase_4_Modeling_(g)_RF.knwf


Titanic_153_AgeBinned_Phase_4_Modeling_(h)_GBT

Workflow bei KNIME Community Hub

Titanic_153_AgeBinned_Phase_4_Modeling_(h)_GBT.knwf


Titanic_154_AgeBinned_Phase_5_Evaluation

Workflow bei KNIME Community Hub

Titanic_154_AgeBinned_Phase_5_Evaluation.knwf


Titanic_155_AgeBinned_Phase_6_Deployment

Workflow bei KNIME Community Hub

Titanic_155_AgeBinned_Phase_6_Deployment.knwf


Anaconda (Python) Jupyter Notebooks

Titanic_151_AgeBinned_Phase_3_Binning_Idee

AgeBinned Phase 3: Idee

Titanic_151_AgeBinned_Phase_3_Binning_Idee.ipynb
Titanic_151_AgeBinned_Phase_3_Binning_Idee_Seaborn.ipynb


Titanic_152_AgeBinned_Phase_3_Data_Preparation_v2

AgeBinned Phase 3: v2

Titanic_152_AgeBinned_Phase_3_Data_Preparation_v2.ipynb


Titanic_153_AgeBinned_Phase_4_Modeling

AgeBinned Phase 4

Titanic_153_AgeBinned_Phase_4_Modeling.ipynb


Titanic_154_AgeBinned_Phase_5_Evaluation / Titanic_155_AgeBinned_Phase_6_Deployment

Age Binned Phasen 5 und 6

Titanic_154_AgeBinned_Phase_5_Evaluation.ipynb
Titanic_155_AgeBinned_Phase_6_Deployment.ipynb