Doublette

Aus Meinungsklima

Wechseln zu: Navigation, Suche

Doubletten nennt man doppelte Fälle in SPSS-Datensätzen. Doubletten konnten früher nicht automatisch erkannt werden und mußten oft mühsam von Hand (durch wiederholte Sichtung der Daten nach Sortiervorgängen) gesucht und entfernt werden. In der aktuellen Version SPSS 13 gibt es im Menü Daten einen Punkt "Doppelte Fälle ermitteln...". Damit können Fälle nach ausgewählten Kriterien verglichen und doppelte identifiziert werden.

Doubletten entstehen durch Unachtsamkeit oder Organisationsmängel. Typische Ursachen für Doubletten sind:

  • Fehler beim Zusammenführen von Dateien
  • Fehler bei der Dateneingabe (irrtümliches wiederholtes Eingeben von Fragebögen oder Codebögen von Inhaltsanalysen)
  • Doppelte Datenerhebung (vor allem bei der Inhaltsanalyse: Doppeltes Codieren des gleichen Artikels/Beitrags)

Im zweiten und vor allem im dritten Fall sind die doppelten Fälle oft nicht völlig identisch, sondern durch Fehler bei der Dateneingabe oder unterschiedliche Codierungen leicht unterschiedlich. In diesem Fall kann auch die Funktion "Doppelte Fälle ermitteln..." nur bedingt weiterhelfen. Im Zweifel muß das ursprüngliche Material herangezogen werden, um Zweifel auszuräumen, z.B. eine codierte Zeitung oder die Originalfragebögen bei Umfragedaten. Bei großen Datensätzen kann die Suche nach und die Überprüfung vermeintlicher Doubletten sehr aufwendig sein.

Die wichtigsten Maßnahmen gegen Doubletten sind das Numerieren des Ausgangsmaterials und Sorgfalt beim Zusammenführen von Dateien.

Persönliche Werkzeuge