R und RStudio – Grundlagen
R und RStudio für die Bachelorarbeit
R ist die mächtigste statistische Programmiersprache der Forschung – kostenlos, plattformübergreifend, mit unzähligen Erweiterungspaketen. RStudio ist die Standard-Oberfläche dafür. Im Vergleich zu SPSS programmierst du in R statt zu klicken – das ist anfangs ungewohnt, gibt dir aber maximale Kontrolle und Reproduzierbarkeit. Wir zeigen dir Installation, Grundlagen und erste Auswertungen.
Installation
- R von cran.r-project.org herunterladen (kostenlos).
- RStudio Desktop von posit.co/download/rstudio-desktop herunterladen (kostenlos).
- Beide installieren – RStudio findet R automatisch.
RStudio-Oberfläche
Vier Hauptfenster:
- Source (oben links): Hier schreibst du deinen Code als R-Skript.
- Console (unten links): R führt Befehle direkt aus.
- Environment (oben rechts): Übersicht aller geladenen Variablen.
- Files / Plots / Help (unten rechts): Dateibrowser, Diagramme, Hilfe.
Erstes R-Skript
# Daten einlesen
daten <- read.csv("meine_daten.csv")
# Erste Übersicht
str(daten)
summary(daten)
# Mittelwert einer Variable
mean(daten$Lernerfolg, na.rm = TRUE)
Pakete installieren
R hat über 19.000 Erweiterungspakete (CRAN). Die wichtigsten für Statistik:
install.packages("tidyverse") # Datenanalyse
install.packages("psych") # psychologische Tests
install.packages("car") # erweiterte Tests
install.packages("ggplot2") # Diagramme
install.packages("haven") # SPSS/SAS-Daten lesen
Daten einlesen
- CSV: read.csv("meine_daten.csv")
- Excel: library(readxl); read_excel("meine_daten.xlsx")
- SPSS-Datei: library(haven); read_sav("meine_daten.sav")
Deskriptive Statistik in R
library(psych)
describe(daten)
# Output: für jede Variable Mittelwert, SD, Median, Min, Max, Schiefe, Kurtosis
Beispiel: t-Test in R
t.test(Lernerfolg ~ Geschlecht, data = daten)
# Output mit t-Wert, Freiheitsgraden, p-Wert, Konfidenzintervall, Mittelwerten beider Gruppen.
Beispiel: Korrelation in R
cor.test(daten$PlattformNutzung, daten$Lernerfolg, method = "pearson")
Diagramme mit ggplot2
library(ggplot2)
ggplot(daten, aes(x = PlattformNutzung, y = Lernerfolg)) +
geom_point() +
geom_smooth(method = "lm") +
labs(title = "Plattform-Nutzung und Lernerfolg")
Häufige Fehler
- Variable mit „$" angesprochen, obwohl Tibble-Struktur (Tidyverse) – führt zu Warnings.
- Pakete vergessen zu laden – „library(paket)" pro Session.
- Fehlende Werte (NA) ignoriert – manche Funktionen brauchen na.rm = TRUE.
- Skript nicht gespeichert – nach RStudio-Schließen weg.
Mehr typische Stolperfallen findest du in unserem Beitrag zu häufigen Fehlern in Bachelorarbeit und Masterarbeit. Im Lektorat wird auch die formale Berichtsweise von R-Output geprüft.