Kapitel 13

Lineare und polynomiale Regression


Können Anna und Karl das Alter der Titanic-Passagiere mit Hilfe des Vornamens schätzen? Zunächst betrachten die beiden Trainees fünf sehr einfache Modelle. Diese bewerten sie mit Hilfe verschiedener Güte- und Fehlermaße der Regression: Bestimmtheitsmaß, Mean Squared Error (MSE) bzw. Root Mean Squared Error (RMSE), Mean Absolute Error (MAE) und Mean Absolute Percentage Error (MAPE). Danach widmen sich Anna und Karl der linearen und polynomialen Regression. Die Methode der kleinsten Quadrate bestimmt die Regressionskoeffizienten so, dass die Anpassung der Schätzfunktion möglichst gut an die gegebenen Trainingsdaten erfolgt. Karl benutzt dann noch den T-Test, um Attribute zu eliminieren, die keinen wesentlichen Einfluss auf das Ergebnis haben. Anna verwendet dagegen Regularisierungsmethoden wie Ridge, LASSO und Elastic-Net, um einer möglichen Überanpassung entgegenzuwirken. Schließlich vergleichen die beiden Trainees ihre trainierten Modelle miteinander.

Keywords: Methode der kleinsten Quadrate, Bestimmtheitsmaß, Fehlermaße, Mean Squared Error (MSE), Root Mean Squared Error (RMSE), Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE), lineare Regression, polynomiale Regression, T-Test, Regularisierung, Ridge, LASSO, Elastic-Net.


KNIME Videos und Workflows

Titanic_131_Age_Phase_4_Modell_1_Mean

Workflow bei KNIME Community Hub
Numeric Scorer

Titanic_131_Age_Phase_4_Modell_1_Mean.knwf


Titanic_132_Age_Phase_4_Modell_2_Median

Workflow bei KNIME Community Hub

Titanic_132_Age_Phase_4_Modell_2_Median.knwf


Titanic_133_Age_Phase_4_Modell_3_Zufallszahlen

Workflow bei KNIME Community Hub

Titanic_133_Age_Phase_4_Modell_3_Zufallszahlen.knwf


Titanic_134_Age_Phase_4_Modell_4_Mean_Gruppierung

Workflow bei KNIME Community Hub

Titanic_134_Age_Phase_4_Modell_4_Mean_Gruppierung.knwf


Titanic_135_Age_Phase_4_Modell_5_Median_Gruppierung

Workflow bei KNIME Community Hub

Titanic_135_Age_Phase_4_Modell_5_Median_Gruppierung.knwf


Titanic_136_Age_Phase_4_Lineare_Regression

Workflow bei KNIME Community Hub
Linear Regression Learner
Regression Predictor

Titanic_136_Age_Phase_4_Lineare_Regression.knwf


Titanic_137_Age_Phase_4_Polynomiale_Regression

Workflow bei KNIME Community Hub
Polynomial Regression Learner

Titanic_137_Age_Phase_4_Polynomiale_Regression.knwf


Anaconda (Python) Jupyter Notebooks

Titanic_131_Age_Phase_4_Modell_1_Mean / Titanic_132_Age_Phase_4_Modell_2_Median / Titanic_133_Age_Phase_4_Modell_3_Zufallszahlen / Titanic_134_Age_Phase_4_Modell_4_Mean_Gruppierung / Titanic_135_Age_Phase_4_Modell_5_Median_Gruppierung

Age Phase 4: Modelle 1 bis 5

Titanic_131_Age_Phase_4_Modell_1_Mean.ipynb
Titanic_132_Age_Phase_4_Modell_2_Median.ipynb
Titanic_133_Age_Phase_4_Modell_3_Zufallszahlen.ipynb
Titanic_134_Age_Phase_4_Modell_4_Mean_Gruppierung.ipynb
Titanic_135_Age_Phase_4_Modell_5_Median_Gruppierung.ipynb


Titanic_136_Age_Phase_4_Lineare_Regression

Age Phase 4: Lineare Regression

Titanic_136_Age_Phase_4_Lineare_Regression.ipynb


Titanic_137_Age_Phase_4_Polynomiale_Regression

Age Phase 4: Polynomiale Regression

Titanic_137_Age_Phase_4_Polynomiale_Regression.ipynb


Titanic_138_Age_Phase_4_Ridge_Regression / Titanic_139_Age_Phase_4_LASSO

Age Phase 4: Ridge & Lasso

Titanic_138_Age_Phase_4_Ridge_Regression.ipynb
Titanic_139_Age_Phase_4_LASSO.ipynb