Häufigkeitsauszählung

Aus Meinungsklima.de
Zur Navigation springenZur Suche springen

Wenn man einen Datensatz eingegeben hat, sollte man zunächst eine einfache Häufigkeitsauszählung aller Variablen machen. Das hat erstens den Zweck, Eingabefehler zu finden (Datenbereinigung) und zweitens verschafft man sich so einen ersten Überblick über die Daten. Die Häufigkeitsauszählung erreicht man über das Menü Analysieren|Deskriptive Statistiken|Häufigkeiten...

Haeufigkeit1.jpg


Es erscheint das Häufigkeiten-Bedienfenster, in dem links die verfügbaren Variablen stehen. Aus dieser Liste kann man die Variablen, für die man eine Häufigkeitsauszählung erstellen lassen möchte, auswählen. Sie erscheinen dann im rechten Teil des Fensters.

Haeufigkeit2.jpg


Über den Button "Statistik..." kann eingestellt werden, welche Kennwerte ausgegeben werden sollen. Neben den Perzentilen sind die wichtigsten Angaben, die bei Analysen durch eine Häufigkeitsauszählung ermittelt werden:

  • Mittelwert (arithmetisches Mittel)
  • Median (Mitte der Wertreihe)
  • Modalwert (auch Modus genannt, der am häufigsten vorkommende Wert)
  • Summe
  • Standardabweichung (Mittelwert der Abweichung der Werte vom Gesamtmittelwert)
  • Varianz (quadrierte Standardabweichung)
  • Kurtosis ("Wölbung" einer Verteilung)
  • Schiefe (Rechts- oder Linkslastigkeit einer Verteilungskurve)

Über den Button "Diagramme" kann man die Daten graphisch aufbereiten lassen. Besonders wichtig ist in dem Zusammenhang die Option "Historgramm, mit Normalverteilungskurve". Sie wird für Tests auf Normalverteilung gebraucht.

Beispielausgabe

Die Häufigkeitsauszählung für den kleinen Beispieldatensatz (10 Fälle), mit dem die Screenshots erstellt wurden, sieht (bei eingeschalteter Anzeige von Mittelwert und Modalwert folgendermaßen aus (Ausschnitt):

Haeufigkeit3.jpg


In der ersten Tabelle ("Statistiken") werden die angeforderten Werte Mittelwert und Modalwert für alle untersuchten Variablen dargestellt. Darunter wird für jede Variable eine Häufigkeitstabelle angelegt. Sie enthält folgende Angaben (Spalten von links nach rechts):

  • Ausprägungen der Variablen; wenn Wertelabels vorhanden sind, werden diese Labels angezeigt.
  • Häufigkeit in absoluten Zahlen. Das Beispiel enthält beispielsweise fünf männliche und fünf weibliche Fälle.
  • Häufigkeit in Prozent, bezogen auf den Gesamtdatensatz. Wenn ein Datensatz "Missings" (fehlende Werte für eine Variable) enthält, werden diese mit zur Basis der Prozentuierung gezählt. Wenn für die gezählte Variable keine fehlenden Werte vorliegen, sind "Prozent" und "gültige Prozent" identisch (wie hier im Beispiel).
  • Häufigkeit in gültigen Prozentwerten, bezogen nur auf gültige Werte für diese Variable (Missings werden nicht mitgezählt)
  • Kumulierte Prozente, die Prozentwerte der einzelnen Ausprägungen der Variablen werden addiert.