Deskriptive Statistik verstehen. Christian FG Schendera
Чтение книги онлайн.
Читать онлайн книгу Deskriptive Statistik verstehen - Christian FG Schendera страница 15

Zur Erinnerung: Erst verhältnisskalierte Daten (mit Nullpunkt) erlauben die Aussage, dass ein Wert doppelt so groß sei wie ein anderer Wert. Intervall- und verhältnisskalierte Variablen bilden zusammen mit der Absolutskala die höchste Variablengruppe, die der metrischen Variablen.
2.3.5 Absolutskala
■ Definition: Messungen auf einer Absolutskala liegen dann vor, wenn ein Nullpunkt und eine natürliche Maßeinheit gegeben sind.
■ Mögliche Aussagen: Gleichheit / Ungleichheit von Häufigkeiten (Zähldaten).
■ Beispiele: Merkmal: Bundesligapunkte: Schalke 04 (64) hat mehr als doppelt so viele Punkte wie Herta BSC (31); Merkmal: Aufstellungen: Die Aufstellung des SC Freiburg umfasst genauso viele Spieler wie die von Hannover 96 (11); Merkmal: Unentschieden: Borussia Dortmund hat in der Saison 2011/2012 mehr Unentschieden (6) als der VfL Wolfsburg (5).
■ Transformation: keine.
■ Mögliche Maße: Häufigkeit (Zähldaten).
■ Zulässige Rechenoption: Ermittlung von Häufigkeiten.
Welche Spalten aus der Bundesligatabelle enthalten Daten auf Absolutskalenniveau? Von allen Spalten aus der Bundesligatabelle müssen nur noch „Spiele“, „S“, „U“, „N“ und „Pkt“ festgelegt werden. „Verein“ und „Tore“ besitzen Nominalniveau, „Platz“ Ordinalniveau, und „Diff“ Intervallniveau. Das Kriterium, das zu erfüllen ist, lautet: Kategorien, die verschieden sind, sich in eine Rangreihe bringen lassen, deren Abstände genau gemessen werden können, einen Nullpunkt und eine natürliche Maßeinheit besitzen. Eine Absolutskala liegt also dann vor, wenn ein Nullpunkt und eine natürliche Maßeinheit gegeben sind. Eine natürliche Maßeinheit weisen z.B. Zähldaten auf, z.B. Seitenzahlen in einem Buch oder Anzahl von Zuschauern in einem Stadion. So gesehen ist es bei „Spiele“, „S“, „U“, „N“ und „Pkt“ insgesamt einfach: Alle fünf verbleibenden Spalten zählen etwas ab Null: „Spiele“ zählt die Anzahl der Spiele bis Saisonende. „S“, „U“, und „N“ zählen die Anzahl der Siege, Unentschieden und Niederlagen bis zum Saisonabschluss. „Pkt“ zählt die Anzahl der erzielten Punkte. Das abschließende Fazit lautet: „Verein“ und „Tore beschränken sich auf das Nominalniveau, „Platz“ auf das Ordinalniveau. Die Spalten „Diff“ besitzt das Intervallniveau. Die Spalten „Spiele“, „S“, „U“, „N“ und „Pkt“ besitzen auch das Absolutniveau.
[1] | Lässt sich das Merkmal in eine von Daten beschriebene Rangfolge bringen? Nein: Nominalskala |
[2] | Sind die Abstände zwischen zwei Rängen auf der Skala immer gleich (darf man also u.a. Differenzen bilden)? Nein: Ordinalskala |
[3] | Hat die Skala einen eindeutigen Nullpunkt (darf man also u.a. Mittelwerte bilden)? Nein: Intervallskala |
[4] | Hat die Skala keinen Nullpunkt (darf man also u.a. Proportionen bilden)? Nein: Verhältnisskala |
[5] | Hat die Skala Einheiten, z.B. €, PS, Kilometer? Nein: Absolutskala |
2.3.6 Weitere Skalenbegriffe
Neben den vorgestellten gibt es viele weitere Skalen, z.B. die Hype rordinalskalen (Rangordnung der Objektdifferenz), oder auch logarithmische Intervallskalen. Es gibt auch zahlreiche Oberbegriffe für Skalen, die hier kurz stichwortartig abgehandelt werden sollen; dazu gehören z.B. binäre (zweistufige Skalen), dicho- bzw. polytome (zwei- bzw. mehrstufige Skalen), diskrete (diskontinuierliche) vs. stetige (kontinuierliche) Skalen (vgl. anschließende Erläuterungen), kategoriale Skalen (zwei- bis mehrstufige Skalen), metrische Skalen (ab einschl. Intervallskala), qualitative / quantitative Skalen (vgl. anschließende Erläuterungen). Oft wird die Eigenschaft der Skala auf die betreffende Datenspalte bzw. Variable sprachlich verallgemeinert. Wurde z.B. eingangs gesagt, die Spalte „Verein“ besitze das Nominalniveau, so wird häufig stattdessen kürzer gesagt, z.B. die nominalskalierte bzw. Nominalvariable „Verein“. Die nachfolgenden Erläuterungen drücken nun genau dasselbe aus; sie beziehen sich in ihrer Formulierungen nicht auf die Skala, sondern auf die Datenspalte (Variable) mit dieser Skala.
Qualitative und quantitative Variablen: Art der Ausprägungen
Qualitative Variablen
Qualitative Variablen lassen sich in ihren Ausprägungen nur durch ihre Art oder ihren Rang unterscheiden. Qualitative Variablen sind nominal- oder ordinalskalierte Variablen, da diese nur in einer Qualität oder ihrem Rang unterschieden werden können.
Spielart: „Auswärtsspiel“, „Heimspiel“, „Freundschaftsspiel“, „Geisterspiel“ usw.
Schulnoten: „sehr gut“, „gut“ etc.
Quantitative Variablen
Quantitative Variablen sind Variablen ab dem Intervallniveau, die auf der Basis einer numerischen Skala mit einem einheitlichen Abstandsmaß genau geordnet werden können.
Punktestand (z.B. zur Winterpause).
Alter (z.B. in Jahren).
Temperaturen (z.B. in C).
Diskrete und stetige Variablen: Anzahl theoretisch möglicher Ausprägungen
Diskrete Variablen sind Variablen, die nur eine überschaubare, begrenzte Anzahl von Werten aufweisen. Stetige Variablen