Lineare und polynomiale Regression
Können Anna und Karl das Alter der Titanic-Passagiere mit Hilfe des Vornamens schätzen? Zunächst betrachten die beiden Trainees fünf sehr einfache Modelle. Diese bewerten sie mit Hilfe verschiedener Güte- und Fehlermaße der Regression: Bestimmtheitsmaß, Mean Squared Error (MSE) bzw. Root Mean Squared Error (RMSE), Mean Absolute Error (MAE) und Mean Absolute Percentage Error (MAPE). Danach widmen sich Anna und Karl der linearen und polynomialen Regression. Die Methode der kleinsten Quadrate bestimmt die Regressionskoeffizienten so, dass die Anpassung der Schätzfunktion möglichst gut an die gegebenen Trainingsdaten erfolgt. Karl benutzt dann noch den T-Test, um Attribute zu eliminieren, die keinen wesentlichen Einfluss auf das Ergebnis haben. Anna verwendet dagegen Regularisierungsmethoden wie Ridge, LASSO und Elastic-Net, um einer möglichen Überanpassung entgegenzuwirken. Schließlich vergleichen die beiden Trainees ihre trainierten Modelle miteinander.
Keywords: Methode der kleinsten Quadrate, Bestimmtheitsmaß, Fehlermaße, Mean Squared Error (MSE), Root Mean Squared Error (RMSE), Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE), lineare Regression, polynomiale Regression, T-Test, Regularisierung, Ridge, LASSO, Elastic-Net.
KNIME Videos und Workflows
Titanic_131_Age_Phase_4_Modell_1_Mean

Titanic_131_Age_Phase_4_Modell_1_Mean.knwf
Titanic_132_Age_Phase_4_Modell_2_Median

Titanic_132_Age_Phase_4_Modell_2_Median.knwf
Titanic_133_Age_Phase_4_Modell_3_Zufallszahlen

Titanic_133_Age_Phase_4_Modell_3_Zufallszahlen.knwf
Titanic_134_Age_Phase_4_Modell_4_Mean_Gruppierung

Titanic_134_Age_Phase_4_Modell_4_Mean_Gruppierung.knwf
Titanic_135_Age_Phase_4_Modell_5_Median_Gruppierung

Titanic_135_Age_Phase_4_Modell_5_Median_Gruppierung.knwf
Titanic_136_Age_Phase_4_Lineare_Regression

Titanic_136_Age_Phase_4_Lineare_Regression.knwf
Titanic_137_Age_Phase_4_Polynomiale_Regression

Titanic_137_Age_Phase_4_Polynomiale_Regression.knwf
Anaconda (Python) Jupyter Notebooks
Titanic_131_Age_Phase_4_Modell_1_Mean / Titanic_132_Age_Phase_4_Modell_2_Median / Titanic_133_Age_Phase_4_Modell_3_Zufallszahlen / Titanic_134_Age_Phase_4_Modell_4_Mean_Gruppierung / Titanic_135_Age_Phase_4_Modell_5_Median_Gruppierung
Titanic_131_Age_Phase_4_Modell_1_Mean.ipynb
Titanic_132_Age_Phase_4_Modell_2_Median.ipynb
Titanic_133_Age_Phase_4_Modell_3_Zufallszahlen.ipynb
Titanic_134_Age_Phase_4_Modell_4_Mean_Gruppierung.ipynb
Titanic_135_Age_Phase_4_Modell_5_Median_Gruppierung.ipynb
Titanic_136_Age_Phase_4_Lineare_Regression
Titanic_136_Age_Phase_4_Lineare_Regression.ipynb
Titanic_137_Age_Phase_4_Polynomiale_Regression
Titanic_137_Age_Phase_4_Polynomiale_Regression.ipynb
Titanic_138_Age_Phase_4_Ridge_Regression / Titanic_139_Age_Phase_4_LASSO
Titanic_138_Age_Phase_4_Ridge_Regression.ipynb
Titanic_139_Age_Phase_4_LASSO.ipynb