Normalverteilung in der Statistik erklärt
Normalverteilung – prüfen und interpretieren
Viele statistische Tests setzen Normalverteilung voraus – t-Test, ANOVA, Pearson-Korrelation, lineare Regression. Wenn deine Daten nicht normalverteilt sind, brauchst du nicht-parametrische Alternativen oder Transformationen. Wir zeigen dir, wie du die Normalverteilung prüfst und was du tun kannst, wenn sie verletzt ist.
Was ist eine Normalverteilung?
Eine glockenförmige, symmetrische Verteilung. Charakteristika: Mittelwert = Median = Modus, etwa 68 % der Werte liegen innerhalb einer Standardabweichung um den Mittelwert, 95 % innerhalb von zwei Standardabweichungen.
Wann ist Normalverteilung wichtig?
Bei parametrischen Tests (t-Test, ANOVA, Pearson, Regression) sollten die Daten näherungsweise normalverteilt sein. Bei Stichproben > 30 sind die Tests aber relativ robust gegen leichte Abweichungen (zentraler Grenzwertsatz).
Prüfen auf Normalverteilung
- Visuell: Histogramm, P-P-Plot oder Q-Q-Plot. Bei normalverteilten Daten bilden Punkte im Q-Q-Plot eine gerade Linie.
- Shapiro-Wilk-Test: Statistischer Test. Bei p > 0.05 wird die Nullhypothese „Daten sind normalverteilt" nicht verworfen.
- Kolmogorov-Smirnov-Test (mit Lilliefors-Korrektur): Alternative zu Shapiro-Wilk, eher bei großen Stichproben.
- Schiefe und Kurtosis: Werte zwischen -1 und +1 deuten auf Normalverteilung.
SPSS: Normalverteilung prüfen
- Analysieren → Deskriptive Statistik → Explorative Datenanalyse.
- Variable wählen.
- Bei Diagrammen: „Normalverteilungsdiagramm mit Tests" ankreuzen.
- OK klicken.
Im Output findest du Shapiro-Wilk- und Kolmogorov-Smirnov-Tests sowie Q-Q-Plot.
R: Normalverteilung prüfen
# Shapiro-Wilk
shapiro.test(daten$Lernerfolg)
# Q-Q-Plot
qqnorm(daten$Lernerfolg); qqline(daten$Lernerfolg)
# Histogramm
hist(daten$Lernerfolg, breaks = 20)
Was bei Verletzung der Normalverteilung?
- Bei großen Stichproben (n > 30 pro Gruppe): Tests sind robust, du kannst trotzdem t-Test/ANOVA verwenden.
- Bei kleinen Stichproben: nicht-parametrische Tests verwenden (Mann-Whitney-U, Wilcoxon, Kruskal-Wallis, Spearman).
- Daten transformieren: Logarithmus oder Wurzel können schiefe Verteilungen normalisieren.
- Bootstrapping: Moderne Methode, die keine Verteilungsannahmen macht.
Bericht in der Arbeit
„Die Hauptvariable wurde mit dem Shapiro-Wilk-Test auf Normalverteilung geprüft. Der Test war signifikant (W = 0.92, p < 0.001), was auf Abweichung von der Normalverteilung hinweist. Da die Stichprobe groß ist (n = 240), wird der zentrale Grenzwertsatz angewendet und parametrische Tests werden trotz Abweichung verwendet."
Häufige Fehler
- Normalverteilung gar nicht geprüft.
- Shapiro-Wilk bei großen Stichproben überinterpretiert – wird bei n > 1000 fast immer signifikant.
- Bei Verletzung trotzdem parametrische Tests ohne Begründung.
- Normalverteilung der falschen Variable geprüft (sollte Residuen sein, nicht UV).
Mehr typische Stolperfallen findest du in unserem Beitrag zu häufigen Fehlern in Bachelorarbeit und Masterarbeit. Im Lektorat wird auch die methodische Konsistenz geprüft.