Datenvorbereitung
Feature Engineering ist ein besonderer Schritt in der Phase 3 (Data Preparation) von CRISP-DM. Mit Hilfe dieser Methode erzeugen Anna und Karl neue Attribute, bspw.
Title
,
FamilySize
und
LogFare
. Diese neuen Attribute sollen zukünftig zu besseren Modellergebnissen führen. Die beiden Trainees lernen die Techniken One Hot Encoding und Binning sowie einige Skalierungen und Transformationen kennen. Dabei stoßen sie auf Herausforderungen wie den Fluch der Dimensionalität, Overfitting und Rauschen. Sie erkennen Gemeinsamkeiten und Unterschiede zwischen Klassifikation und Clusteranalyse. Schließlich erstellen Anna und Karl mit ihren Werkzeugen drei neue Sets von Trainings-, Test- und Anwendungsdaten. Die verschiedenen Datenvarianten unterscheiden sich hinsichtlich der Skalenniveaus und Datentypen der Attribute. Damit legen sie den Grundstein für den nächsten Teil ihres Data Science Trainings. Das Team, inklusive Max und Sophia, ist schon gespannt, wie k-Nearest Neighbor und weitere Klassifikationsmethoden abschneiden, wenn sie mit diesen vermeintlich verbesserten Daten arbeiten.
Keywords: Feature Engineering, One Hot Encoding, Binning, Skalierungen, Min-Max-Normierung, Standardisierung, Transformation, Textoperationen, Fluch der Dimensionalität, Overfitting, Rauschen, Clusteranalyse vs. Klassifikation.
KNIME Videos und Workflows
Titanic_051_Phase_3_Name

Titanic_052_Phase_3_Age

Titanic_053_Phase_3_SibSp_Parch

Titanic_053_Phase_3_SibSp_Parch.knwf
Titanic_054_Phase_3_Fare

Titanic_055_Phase_3_Cabin

Titanic_055_Phase_3_Cabin.knwf
Titanic_056_Phase_3_Data_Preparation_v3

Titanic_056_Phase_3_Data_Preparation_v3.knwf
Titanic_057_Phase_3_Data_Preparation_v4

Titanic_057_Phase_3_Data_Preparation_v4.knwf
Titanic_058_Phase_3_Data_Preparation_v5

Titanic_058_Phase_3_Data_Preparation_v5.knwf
Anaconda (Python) Jupyter Notebooks
Titanic_051_Phase_3_Name
Titanic_051_Phase_3_Name.ipynb
Titanic_052_Phase_3_Age
Titanic_053_Phase_3_SibSp_Parch
Titanic_053_Phase_3_SibSp_Parch.ipynb
Titanic_054_Phase_3_Fare
Titanic_054_Phase_3_Fare.ipynb
Titanic_054_Phase_3_Fare_Seaborn_Hist.ipynb
Titanic_055_Phase_3_Cabin
Titanic_055_Phase_3_Cabin.ipynb
Titanic_056_Phase_3_Data_Preparation_v3
Titanic_056_Phase_3_Data_Preparation_v3.ipynb
Titanic_056_Phase_3_Data_Preparation_v3_Seaborn_Barcharts.ipynb
Titanic_057_Phase_3_Data_Preparation_v4
Titanic_057_Phase_3_Data_Preparation_v4.ipynb
Titanic_058_Phase_3_Data_Preparation_v5
Titanic_058_Phase_3_Data_Preparation_v5.ipynb
Titanic_058_Phase_3_Data_Preparation_v5_Seaborn_Barcharts.ipynb