Likert-Skala auswerten mit SPSS

Likert-Skala auswerten mit SPSS: Skalenniveau, Tests und typische Streitfragen

Kaum ein Thema sorgt in Methodenseminaren für mehr Diskussion als die Frage: Ist eine Likert-Skala ordinal oder metrisch? Die Antwort bestimmt, welche statistischen Verfahren Sie verwenden dürfen. Und je nachdem, wen Sie fragen, bekommen Sie eine andere Antwort.

Dieser Beitrag klärt die Debatte mit pragmatischen Leitlinien, zeigt Ihnen Schritt für Schritt, wie Sie Likert-skalierte Daten in SPSS auswerten, und erklärt, welche Fehler Sie dabei unbedingt vermeiden sollten.

Was ist eine Likert-Skala – und was nicht?

Rensis Likert entwickelte in den 1930er Jahren ein Verfahren, bei dem mehrere Aussagen (Items) zu einem Thema auf einer abgestuften Antwortskala bewertet werden. Die Antworten werden anschließend zu einem Gesamtwert zusammengefasst. Genau genommen ist eine Likert-Skala also nicht die einzelne Frage, sondern die Gesamtskala aus mehreren Items.

Im akademischen Alltag hat sich allerdings eine andere Verwendung durchgesetzt: Die meisten Studierenden und auch viele Betreuer sprechen von „Likert-Skala”, wenn sie eine einzelne Frage mit Antwortoptionen wie „stimme gar nicht zu” bis „stimme voll zu” meinen. Diese einzelne Frage heißt korrekterweise „Likert-Item”. Die Unterscheidung ist nicht nur sprachlich relevant – sie hat Konsequenzen für die statistische Auswertung.

Ein einzelnes Likert-Item (z.B. eine Frage mit fünf Antwortmöglichkeiten) ist streng genommen ordinal. Eine Likert-Skala, die aus mehreren Items einen Mittelwert bildet, kann unter bestimmten Bedingungen als intervallskaliert (metrisch) behandelt werden.

Die Skalenniveau-Debatte: Ordinal oder metrisch?

Diese Frage spaltet die Methodenliteratur seit Jahrzehnten. Hier die beiden Positionen:

Position 1 – Streng ordinal: Die Abstände zwischen „stimme gar nicht zu” (1) und „stimme eher nicht zu” (2) müssen nicht gleich groß sein wie die zwischen „neutral” (3) und „stimme eher zu” (4). Da die Abstände nicht garantiert gleich sind, ist die Skala ordinal. Mittelwerte sind nicht zulässig. Stattdessen verwenden Sie Median und nichtparametrische Tests.

Position 2 – Pragmatisch metrisch: In der Praxis zeigt die Forschung, dass parametrische Verfahren (t-Test, ANOVA, Regression) auch bei Likert-skalierten Daten robuste Ergebnisse liefern, wenn bestimmte Bedingungen erfüllt sind. Diese Position wird unter anderem von Norman (2010) und Carifio & Perla (2008) vertreten und ist in den Sozialwissenschaften weit verbreitet.

Was bedeutet das für Ihre Abschlussarbeit?

In der Praxis hängt die Entscheidung von drei Faktoren ab: erstens den Konventionen Ihres Fachbereichs, zweitens der Haltung Ihres Betreuers und drittens der Art Ihrer Daten.

Als Faustregel gilt: Ein einzelnes Likert-Item mit weniger als fünf Stufen sollten Sie als ordinal behandeln. Einen Skalenmittelwert aus mindestens vier Items auf einer mindestens fünfstufigen Skala können Sie in den meisten sozialwissenschaftlichen Fächern als metrisch behandeln – vorausgesetzt, Sie begründen das im Methodenteil und die Verteilung ist nicht extrem schief.

Der wichtigste Rat: Klären Sie die Frage mit Ihrem Betreuer, bevor Sie mit der Auswertung beginnen. Nichts ist ärgerlicher, als eine fertige Analyse umstellen zu müssen, weil der Betreuer ein anderes Skalenniveau erwartet.

Einzelne Likert-Items auswerten (ordinal)

Wenn Sie einzelne Likert-Items auswerten oder Ihr Betreuer auf ordinalem Skalenniveau besteht, verwenden Sie die folgenden Verfahren in SPSS.

Deskriptive Statistik: Verwenden Sie Häufigkeiten und Prozente statt Mittelwerten. Gehen Sie auf Analysieren → Deskriptive Statistiken → Häufigkeiten und wählen Sie Ihre Likert-Items aus. Unter „Statistiken” aktivieren Sie Median und Modus. Unter „Diagramme” wählen Sie ein Balkendiagramm, das die Verteilung der Antworten visuell darstellt.

Der Median zeigt den zentralen Wert: Wenn der Median bei 4 liegt, hat mindestens die Hälfte der Befragten „stimme eher zu” oder „stimme voll zu” angekreuzt. Der Modus zeigt die am häufigsten gewählte Kategorie.

Gruppenvergleiche: Statt des t-Tests verwenden Sie den Mann-Whitney-U-Test (Analysieren → Nichtparametrische Tests → Alte Dialogfelder → 2 unabhängige Stichproben). Statt der ANOVA verwenden Sie den Kruskal-Wallis-Test (Analysieren → Nichtparametrische Tests → Alte Dialogfelder → K unabhängige Stichproben). Für verbundene Stichproben (Vorher-Nachher) verwenden Sie den Wilcoxon-Test.

Zusammenhänge: Verwenden Sie Spearmans Rangkorrelation statt Pearsons Korrelation (Analysieren → Korrelation → Bivariat → Spearman aktivieren).

Likert-Skalen auswerten (zusammengefasste Items, metrisch behandelt)

Wenn Sie mehrere Items zu einer Skala zusammenfassen und als metrisch behandeln, gehen Sie wie folgt vor.

Schritt 1 – Items umkodieren: Prüfen Sie, ob alle Items in dieselbe Richtung formuliert sind. Wenn Ihr Fragebogen vier positiv formulierte Items enthält („Ich bin zufrieden mit…”) und ein negativ formuliertes Item („Ich bin unzufrieden mit…”), müssen Sie das negative Item umkodieren. In SPSS: Transformieren → Umkodieren in andere Variablen. Bei einer 5er-Skala wird 1 zu 5, 2 zu 4, 3 bleibt 3, 4 wird 2, 5 wird 1.

Vergessen Sie diesen Schritt, ist Ihr Skalenmittelwert verzerrt und Cronbachs Alpha fällt künstlich niedrig aus.

Schritt 2 – Reliabilität prüfen: Berechnen Sie Cronbachs Alpha (Analysieren → Skalierung → Reliabilitätsanalyse). Wählen Sie alle Items der Skala aus. Ein Wert ab .70 gilt als akzeptabel. Prüfen Sie in der Spalte „Cronbachs Alpha, wenn Item gelöscht”, ob ein einzelnes Item die Reliabilität deutlich drückt.

Schritt 3 – Skalenmittelwert berechnen: Gehen Sie auf Transformieren → Variable berechnen. Verwenden Sie die Funktion MEAN: MEAN(Item1, Item2, Item3, Item4, Item5). Diese Funktion berechnet den Mittelwert auch bei einzelnen fehlenden Werten. Wenn Sie möchten, dass der Mittelwert nur bei einer Mindestanzahl vorhandener Werte berechnet wird, verwenden Sie MEAN.3(Item1, Item2, Item3, Item4, Item5) – hier muss mindestens 3 von 5 Items beantwortet sein.

Schritt 4 – Normalverteilung prüfen: Lassen Sie sich für den Skalenmittelwert ein Histogramm ausgeben und prüfen Sie die Verteilung. Bei starker Schiefe (> |1|) oder wenn die Stichprobe sehr klein ist (< 30), sollten Sie auf nichtparametrische Verfahren ausweichen – auch wenn Sie die Skala grundsätzlich als metrisch behandeln.

Schritt 5 – Analysen durchführen: Mit dem Skalenmittelwert können Sie nun parametrische Verfahren verwenden: t-Tests für Gruppenvergleiche, ANOVA für mehrere Gruppen, Pearson-Korrelation für Zusammenhänge, lineare Regression für Vorhersagemodelle.

Ergebnisse richtig darstellen

Die Ergebnisdarstellung unterscheidet sich je nach Skalenniveau.

Bei ordinaler Auswertung einzelner Items: Erstellen Sie eine Häufigkeitstabelle, die für jedes Item die prozentuale Verteilung der Antworten zeigt. Ergänzen Sie Median und Modus. Ein gestapeltes Balkendiagramm (Diverging Stacked Bar Chart) ist die beste Visualisierung für Likert-Daten – es zeigt auf einen Blick, wie sich die Antworten verteilen. SPSS kann dieses Diagramm nicht direkt erstellen; verwenden Sie dafür Excel oder R.

Bei metrischer Auswertung von Skalenmittelwerten: Berichten Sie Mittelwert und Standardabweichung. In einer Korrelationstabelle zeigen Sie die Zusammenhänge zwischen Ihren Skalenwerten. Für Gruppenvergleiche berichten Sie neben dem p-Wert immer auch die Effektstärke.

In beiden Fällen gehört in den Methodenteil Ihrer Arbeit eine explizite Begründung, warum Sie das jeweilige Skalenniveau gewählt haben. Ein Satz wie „Die Likert-skalierten Items wurden zu Skalenmittelwerten zusammengefasst und aufgrund der mindestens fünfstufigen Antwortskala sowie der akzeptablen Reliabilität (α = .83) als intervallskaliert behandelt (vgl. Norman, 2010)” reicht in den meisten Fällen aus.

Fünf Fehler, die Sie bei Likert-Daten vermeiden sollten

Einzelne Items als metrisch behandeln, ohne es zu begründen. Den Mittelwert eines einzelnen Items mit fünf Stufen zu berechnen ist nicht grundsätzlich falsch – aber Sie müssen es im Methodenteil begründen. Ohne Begründung ist es ein methodischer Schwachpunkt, den Gutachter regelmäßig anmerken.

Negativ formulierte Items nicht umkodieren. Wenn vier Items Zustimmung als hohen Wert kodieren und ein Item Ablehnung als hohen Wert, zerstört das Ihren Skalenmittelwert. Prüfen Sie vor der Skalenbildung jedes einzelne Item auf seine Polung.

Cronbachs Alpha für die gesamte Befragung statt pro Skala berechnen. Wenn Ihr Fragebogen drei verschiedene Konstrukte misst (z.B. Arbeitszufriedenheit, Stresslevel, Motivation), berechnen Sie Alpha für jede Skala einzeln – nicht für alle 20 Items zusammen.

Decken- oder Bodeneffekte ignorieren. Wenn 85 % der Befragten bei einem Item „stimme voll zu” ankreuzen, differenziert dieses Item nicht. Es liefert kaum Varianz und kann die Analyseergebnisse verfälschen. Prüfen Sie die Häufigkeitsverteilung jedes Items vor der Skalenbildung.

Mittlere Kategorie falsch interpretieren. „Neutral” oder „weder noch” kann verschiedene Dinge bedeuten: echte Indifferenz, Ambivalenz (gleichzeitig positiv und negativ), Unsicherheit oder Desinteresse an der Frage. Seien Sie vorsichtig mit Interpretationen wie „die Befragten stehen dem Thema neutral gegenüber.” Sie wissen nur, dass sie die mittlere Kategorie gewählt haben – nicht warum.

Wann professionelle Hilfe sinnvoll ist

Die Auswertung von Likert-Skalen klingt einfach, hat aber methodische Fallstricke, die Ergebnisse kippen können: falsches Skalenniveau, fehlende Umkodierung, unpassende Tests. Wer auf der sicheren Seite sein möchte, kann die SPSS-Auswertung an erfahrene Statistiker übergeben – von der Skalenbildung bis zur fertigen Ergebnisdarstellung nach wissenschaftlichen Standards.