Deskriptive Statistik
Deskriptive Statistik – Daten beschreiben
Deskriptive Statistik beschreibt die Daten, ohne Schlüsse über die Population zu ziehen. Sie ist der erste Schritt jeder quantitativen Auswertung – bevor du Hypothesen testest, willst du wissen, wie deine Daten aussehen. Wir zeigen dir die wichtigsten Maße: Mittelwert, Median, Modus, Standardabweichung, Verteilung.
Maße der zentralen Tendenz
- Mittelwert (M): Summe aller Werte geteilt durch Anzahl. Empfindlich für Ausreißer.
- Median: Mittlerer Wert, wenn alle sortiert. Robust gegen Ausreißer.
- Modus: Häufigster Wert. Bei kategorialen Daten oft die einzige sinnvolle Tendenz.
Beispiel
Datensatz: 18, 19, 20, 20, 21, 22, 23, 25, 67 (eine 67-jährige Person als Ausreißer)
Mittelwert M = 26.1 (verzerrt durch Ausreißer)
Median = 21 (gibt typische Mitte besser wieder)
Modus = 20 (häufigster Wert)
Maße der Streuung
- Standardabweichung (SD): Durchschnittliche Abweichung vom Mittelwert. Standard-Streuungsmaß.
- Varianz: SD zum Quadrat. Wird in mathematischen Formeln verwendet, weniger für Berichte.
- Spannweite: Max minus Min. Sehr empfindlich für Ausreißer.
- Interquartilabstand: 75. minus 25. Perzentil. Robust gegen Ausreißer.
Verteilungsformen
- Normalverteilung: symmetrische Glocke. Mittelwert = Median = Modus.
- Schiefe Verteilung: Asymmetrisch, oft mit langem rechten oder linken Schwanz.
- Bimodale Verteilung: Zwei Häufungspunkte, oft Hinweis auf zwei verschiedene Subgruppen.
Mehr zur Normalverteilung in der separaten Anleitung Normalverteilung.
Welches Maß wann?
- Intervall- oder verhältnisskaliert, normalverteilt: Mittelwert + SD.
- Intervall- oder verhältnisskaliert, schief: Median + Interquartilabstand.
- Ordinal: Median + Interquartilabstand (Mittelwert ist eigentlich nicht zulässig).
- Nominal: Modus + Häufigkeitstabelle.
Bericht in der Bachelorarbeit
Standard-Format für eine Stichprobenbeschreibung:
„Die Stichprobe besteht aus 240 Erstsemestern (M_Alter = 20.1, SD = 1.8; 65 % weiblich, 33 % männlich, 2 % divers). Der durchschnittliche Lernerfolg-Wert lag bei M = 4.21 (SD = 0.78), Median = 4.20, mit einer Spannweite von 1 bis 5."
Häufige Fehler
- Mittelwert berichtet, obwohl Median besser passt (bei schiefen Verteilungen).
- Standardabweichung vergessen – nur Mittelwert nennen ist unvollständig.
- Häufigkeiten ohne Prozente – „65 weibliche Personen" ist weniger informativ als „65 % weiblich (n = 156)".
- Verteilung nicht visualisiert – Histogramm gehört zur Stichprobenbeschreibung.
Mehr typische Stolperfallen findest du im Beitrag zu häufigen Fehlern in Bachelorarbeit und Masterarbeit. Im Lektorat wird die korrekte Notation deskriptiver Statistik geprüft.