Wie KI-Detektoren Texte einstufen — Perplexity, Burstiness und

KI-Detektoren: So funktioniert die Erkennung

Lesezeit ca. 3 Min. · aktualisiert: 3. Juli 2026 · zurück zum Blog

KI-Detektoren spucken eine Prozentzahl aus — aber was misst die eigentlich? Wenn du verstehst, wie Perplexity und Burstiness funktionieren, erkennst du auch, warum dein eigener Text falsch markiert werden kann.

Perplexity: Wie überraschend ist dein nächstes Wort?

Perplexity ist das Kernsignal jedes KI-Detektors. Vereinfacht gesagt fragt der Detektor ein Sprachmodell: „Wie wahrscheinlich hättest du dieses Wort an dieser Stelle vorhergesagt?" Liegt das tatsächliche Wort sehr nah an der Top-Vorhersage, ist die Perplexity niedrig — der Text wirkt „glatt" und damit KI-verdächtig.

Konkret heißt das: Schreibst du in einer Hausarbeit „Die Ergebnisse zeigen, dass..." hat das Modell die Folgewörter fast schon erraten. Schreibst du dagegen „Die Ergebnisse kichern uns ins Gesicht", explodiert die Perplexity. Menschliche Texte haben oft solche kleinen Brüche — Formulierungen, die ein Modell nicht als wahrscheinlichsten Pfad gewählt hätte.

Burstiness: Warum gleichmäßige Sätze verdächtig sind

Das zweite Signal ist die Burstiness — also die Varianz zwischen deinen Sätzen. Menschen schreiben rhythmisch ungleich. Ein langer, verschachtelter Satz wird oft von einem kurzen abgelöst. Dann kommt wieder ein mittlerer. KI-Modelle dagegen pendeln sich auf eine relativ konstante Satzlänge und ähnliche Strukturen ein.

Du kannst dir das wie einen Herzschlag vorstellen: Ein menschlicher Text hat Ausschläge, Pausen, Sprünge. Ein KI-Text läuft eher wie ein Metronom. Detektoren wie GPTZero werten genau diese Varianz statistisch aus und kombinieren sie mit der Perplexity zu einem Gesamtscore.

Praktischer Effekt: Wenn du als Studi besonders gewissenhaft schreibst und jeden Satz auf ungefähr 18–22 Wörter trimmst, drückst du deine eigene Burstiness — und der Detektor wird misstrauisch, obwohl du den Text selbst getippt hast.

KI-Detektor Perplexity Burstiness Score Skala

Vom Score zur Wahrscheinlichkeit: So entsteht die Prozentzahl

Perplexity und Burstiness sind nur Zahlen — bis ein Klassifikator daraus eine Wahrscheinlichkeit macht. Dieser Klassifikator wurde auf zwei Stapeln Texten trainiert: menschlich und KI. Er hat gelernt, welche Perplexity-Burstiness-Kombinationen statistisch in welchen Stapel gehören.

Wenn dein Text reinkommt, wird er im selben „Koordinatensystem" verortet. Liegt er näher am KI-Cluster, bekommst du 87 %. Liegt er dazwischen, vielleicht 42 %. Wichtig zu wissen:

Warum False Positives so häufig vorkommen

Die wichtigste Erkenntnis: KI-Detektoren irren sich systematisch — nicht nur zufällig. Weber-Wulff et al. (2023) haben 14 verbreitete KI-Detektoren getestet und festgestellt, dass keines der Tools eine Genauigkeit von 80 % erreichte. Alle produzierten sowohl falsch-positive als auch falsch-negative Treffer.

Eine Auswertung im Journal of Academic Ethics (2024) über mehr als 500 Einreichungen kam zu dem Ergebnis, dass Tools wie Turnitin bei rein menschlich verfassten Texten Falsch-Positiv-Raten von bis zu 20 % erzeugen — besonders betroffen sind Nicht-Muttersprachler und Studierende mit sehr formaler Schreibweise.

Der Grund liegt in der Methode selbst: Akademische Sprache ist standardisiert. Wer sauber zitiert, Passivkonstruktionen nutzt und Fachvokabular einsetzt, produziert niedrige Perplexity — genau das Signal, das auch KI-Texte liefern.

False Positives KI-Detektoren Genauigkeit Studien

Was du selbst tun kannst, bevor du abgibst

Du kannst deinen Text vor der Abgabe gezielt entschärfen, ohne ihn schlechter zu machen:

Und falls ein Detektor unfair Alarm schlägt: Bewahre Versionsverläufe deines Dokuments auf. Word und Google Docs protokollieren Tippgeschwindigkeit und Bearbeitungen — das ist im Streitfall dein bester Beleg.

Studien zum Thema

Wer einen Text final einstufen will, sollte deshalb nicht blind auf die Prozentzahl starren, sondern das Zusammenspiel aus Perplexity, Burstiness und Kontext betrachten. Ein guter Korrektor liest zuerst den Absatz, prüft Quellenlage, Argumentstruktur und Stil — und erst danach wirft er einen Blick auf den Detektor-Score. Genau hier scheitern viele Lehrstühle: Sie lassen das Tool entscheiden, statt es als Indiz zu lesen. Sinnvoll ist es, mindestens zwei Detektoren parallel laufen zu lassen, die Ergebnisse mit der eigenen Lesart abzugleichen und nur dann nachzufragen, wenn statistisches Signal und inhaltlicher Eindruck deutlich auseinanderlaufen.

Lies auch

Wenn du vor der Abgabe sehen willst, wie ein professioneller KI-Detektor deinen Text einstuft — und welche Passagen kritisch wirken — kannst du den KI-Detektor von korrektur.de nutzen. Du bekommst eine Wahrscheinlichkeit pro Abschnitt und kannst gezielt nachbessern, bevor deine Hochschule prüft.

Zu KI-Detektor →
Blogverzeichnis Bloggerei.de
Unsere Partner Skillsquare Plagiat-Detector AI CheckerAI Checker ThesisPrüfer