Deskriptive Statistik verstehen. Christian FG Schendera
Чтение книги онлайн.
Читать онлайн книгу Deskriptive Statistik verstehen - Christian FG Schendera страница 14
■ Definition: Messungen auf einer Intervallskala liegen dann vor, wenn neben Gleichheit/Verschiedenheit (Eigenschaft der Nominalskala), größer/kleiner-Relationen (Eigenschaft der Ordinalskala) auch die Größe von Unterschieden feststellbar ist.
■ Mögliche Aussagen: Äquidistanz: Die Differenzen von zwei (oder mehr) einzelner (oder auch Gruppen von) Merkmalsträgern sind gleich (oder auch ungleich).
■ Beispiele: Merkmal: Temperatur. Ein Unterschied zwischen 4 und 8 Grad Celsius ist gleich groß wie zwischen 20 und 24 °C; Merkmal: Uhrzeiten (Zeitmessungen): Die Differenz zwischen 20:15 und 21:45 ist genauso groß wie zwischen 18:00 und 19:30; Merkmal: Bundesligapunkte: Der Unterschied zwischen 81 und 73 Punkten ist genau so groß wie zwischen 48 und 40.
■ Transformation: linear.
■ Mögliche Maße: Lagemaße: Mittelwert, Minimum, Maximum, Median (auch berechnet), Quantile, Modus. Streumaße: Standardabweichung, Varianz
■ Zulässige Rechenoperation: numerische Differenzen, Mittelwert; f (Anzahl, frequency) bzw. Prozentanteile.
Welche Spalten aus der Bundesligatabelle enthalten Daten auf Intervallniveau? Das Kriterium, das zu erfüllen ist, lautet: Kategorien, die verschieden sind, sich in eine Rangreihe bringen lassen und deren Abstände genau gemessen werden können. Tricky ist es bei der Spalte „Platz“. Einerseits ließe sich argumentieren: Der Abstand zwischen den Rangwerten 1 und 3 erscheint genauso groß wie zwischen den Rangwerten 5 und 7 bzw. größer als zwischen den Rangwerten 5 und 6. Damit besäße die Spalte „Platz“ also auch ein Intervallniveau. Andererseits wäre es nicht weniger plausibel zu argumentieren: Die Rangwerte sind in Wirklichkeit nur „Kodes“, deren Abstände in Wirklichkeit auch unterschiedliche Punktzahlen aufweisen können (vgl. „Pkt“). Der Abstand zwischen den Plätzen 1 und 2 (8 Punkte) ist größer als zwischen den Plätzen 4 und 5 (4 Punkte) bzw. größer als zwischen den Plätzen 5 und 6 (1 Punkt). Damit besäße die Spalte „Platz“ weiterhin „nur“ ein Ordinalniveau. Der Unterschied zwischen Ordinalniveau (auf der Basis von Kodes) und Intervallniveau (auf der Basis von Werten) lässt sich über den Rückgriff auf Informationen „außerhalb“ der betreffenden Ordinaldaten differenzieren. Die Spalte „Platz“ hat damit zwei Gesichter: Die numerischen Kodes haben (selbstverständlich) Intervallniveau. Die Ränge, die diese Kodes repräsentieren, weisen jedoch keine äquidistanten Abstände auf, sind also (weiterhin) Ordinalniveau. Für welche Interpretation man sich nun entscheidet, liegt im Ermessen des Anwenders. Für uns, so legen wir jetzt fest, besitzt die Spalte „Platz“ weiterhin „nur“ Ordinalniveau. Die Spalte „Verein“ besitzt, wie wir wissen, nur das Nominalniveau. Wie sieht es mit den Spalten „Spiele“, „S“, „U“, „N“, „Diff“ und „Pkt“ aus? Nehmen wir zunächst die Spalte „Spiele“. Der Unterschied zwischen 34 und 34 Punkten ist jeweils exakt gleich groß. Springen wir gleich zur Spalte „Pkt“. Der Unterschied zwischen 81 und 73 Punkten ist genau so groß wie zwischen 48 und 40 Punkten, aber größer als zwischen 31 und 30 Punkten. Die Spalten „Spiele“ und „Pkt“ besitzen also auch ein Intervallniveau. Die Spalte „Tore“ besitzt, nach unserem Dafürhalten, nur das Nominalniveau. Wie es mit den Spalten „S“, „U“, „N“ und „Diff“ aussieht, überlassen wir bis zum nächsten Abschnitt vertrauensvoll der Kompetenz der werten Leserinnen und Leser. Das Zwischenfazit an dieser Stelle lautet: „Verein“ und „Tore“ beschränken sich auf das Nominalniveau. Alle anderen Spalten besitzen neben dem Ordinalniveau auch das Intervallniveau.
Während das Ordinalniveau nur aus sagt, dass etwas besser oder schlechter sei, erlaubt ein Intervallniveau auch auszusagen, um wie viel besser ein Wert ist. Gemeinsam von Ordinal- und Intervallniveau ist die Aussage, dass etwas gleich bzw. nicht verschieden ist. Ein Intervallniveau wird nicht mehr als diskret, sondern als kontinuierlich bezeichnet. Ab intervallskalierten Variablen wird auch von quantitativen Variablen gesprochen.
2.3.4 Verhältnisskala
■ Definition: Messungen auf einer Verhältnisskala liegen dann vor, wenn neben Gleichheit / Verschiedenheit (aus: Nominalskala), größer / kleiner-Relationen (aus: Ordinalskala), die Größe von Unterschieden (aus: Intervallskala) auch ein eindeutiger Nullpunkt vorliegt. Weiter unten finden sich weitere Hinweise zum Nullpunkt.
■ Mögliche Aussagen: Gleichheit von Verhältnissen: Die Verhältnisse von zwei (oder mehr) einzelnen (oder auch Gruppen von) Merkmalsträgern sind gleich (oder auch ungleich).
■ Beispiele: Merkmal: Nährwert in der Ausprägung kJoule: Ein Gericht mit 2400 kJ hat doppelt so viele kJoule wie ein Gericht mit 1200kJ; Merkmal: Gewässertiefe ab NN (Normalnull) in Metern: 40 m ist doppelt so tief wie 20 m; Merkmal: Ein Spielereinsatz von 30 Minuten ist halb so lang wie der Einsatz eines Spielers von 60 Minuten.
■ Transformation: proportional.
■ Mögliche Maße: Lagemaße: Geometrisches Mittel, Mittelwert, Minimum, Maximum, Median (auch berechnet), Quantile, Modus. Streumaße: Variationskoeffizient, Standardabweichung, Varianz, Spannweite R, Interquartilsabstand, Quantildifferenzen.
■ Zulässige Rechenoperation: Quotienten; Multiplikation mit einer Konstanten ungleich Null; numerische Differenzen, Mittelwert; f (Anzahl, frequency) bzw. Prozentanteile.
■ Besonderes: Nullpunkte, Temperaturen.
Nullpunkt
Der eindeutige Nullpunkt kann von einem willkürlich festgesetzten Nullpunkt dadurch unterschieden werden, dass es keine Werte geben kann, die unter diesem Nullpunkt liegen.
Beispiele für absolute Nullpunkte:
■ Ein Mittagessen kann nicht minus kJ aufweisen.
■ Ein Mensch kann kein negatives Gewicht aufweisen (auch wenn ein Blick auf die Badezimmerwaage einen anderen Eindruck vermitteln sollte).
■ Ein Fußballspiel kann nicht weniger als 0 Minuten dauern (eigentlich auch nicht weniger als 90 Minuten).
Beispiele für willkürlich gesetzte Nullpunkte:
■ Eine Fußballmannschaft sollte keinen negativen Punktestand aufweisen; wegen Sanktionsmaßnahmen kann dies trotzdem passieren. „Punktes tand“ besitzt daher einen willkürlichen Nullpunkt.
■ Ein explizit eingerichtetes Überziehungslimit sorgt dafür, dass ein Konto nicht in die „roten Zahlen“ gerät. Ist dieses Limit deaktiviert, könnte das Konto evtl. überzogen werden. „Kontostand“ besitzt daher einen willkürlichen Nullpunkt.
Temperaturen
Es gibt Temperatureinheiten mit und ohne Nullpunkt:
■ Kelvin: Kelvin besitzt einen Nullpunkt. Kelvin besitzt daher eine Verhältnisskala. Die Aussage „400 Kelvin ist doppelt so warm wie 200 Kelvin“ ist sinnvoll, da keine Werte unter 0 Kelvin vorkommen können.
■ Celsius / Fahrenheit: Celsius bzw. Fahrenheit besitzen