|
Home |
  |   |
| LEISTUNGEN | ||
| Statistik | ||
| Datenbanken | ||
| Präsentation | ||
| Programmierung | ||
| Internet | ||
| Dissertation | ||
|   | ||
|   KONTAKT | ||
| Impressum | ||
| Kontakt | ||
|   | ||
| INFOTHEK | ||
| Statistik4You | ||
| Online rechnen | ||
| Links | ||
|   | ||
| Eingabe-Software | ||
| prakt. Vorgehen | ||
| Skalenniveau | ||
| Mehrf & Wdhlg. | ||
| abhängig & unabh. | ||
| Grafiken | ||
| Testauswahl | ||
| Chi-Quadrat-Test | ||
|   | ||
| webmaster@daten-consult | ||
Die grafische Darstellung
Grafiken sind ein ideales Mittel, sich schnell einen Überblick über das Zahlenmaterial zu verschaffen
bevor statistischen Prozeduren gerechnet werden.
Dies erleichtert das Verständnis und die Analyse der Daten ungemein und hilft gerade dem Anfänger,
sich gegen Fehlinterpretationen zu schützen. Daten nur mit den Rohdaten zu beurteilen ist oft schwierig,
selbst wenn Maße wie Median, Mittelwert oder Standardabweichung zur Verfügung stehen.
Natürlich sind Grafiken auch ein essentieller Bestandteil der Präsentation der Ergebnisse.
Hier ist es üblich, Grafiken unten und Tabellen oben zu beschriften.
Kategoriale DatenFür die Darstellung von kategorialen Daten nur einer Stichprobe werden meist Tortendiagramme (Pie Charts), einfache Balkendiagramme (Bar Charts) oder Stapelbalken verwendet. Allen drei Darstellungsformen gemeinsam ist, daß sich die Prozentangaben unbedingt immer zu 100% addieren müssen. Sinnvoll ist deren Verwendung allerdings nur, wenn die Zahl der Kategorien für eine übersichtliche Darstellung nicht zu groß ist. In diesem Fall empfiehlt sich eine tabellarische Aufbereitung. Eine Alternative ist die Zusammenfassung mehrerer Kategorien. Bei ordinalen Daten kann u.U. auch auf Boxplots zurückgegriffen werden, wenn nicht jeder einzelne Wert von Bedeutung ist.
Einfache Balkendiagramme sind die übersichtlichste Darstellungsform für die meisten Anwendungsfälle. Unterschiede zwischen den einzelnen Häufigkeiten lassen sich hiermit besonders deutlich darstellen. Torten- oder Kreisdiagramme haben den Vorteil, daß der Beitrag der einzelnen Kategorien am gesamten "Kuchen" deutlich wird. Dafür sind bei vielen Kategorien Unterschiede zwischen den einzelnen Häufigkeiten oft kaum zu erkennen. Für das menschliche Auge sind Winkel von mehr als 180 Grad oder 90 Grad besonders gut zu erkennen. Deshalb eignen sich Tortendiagramme vor allem zur Darstellung von Mehrheiten (d.h. mehr als die Hälfte) oder von Beiträgen von mindestens einem Viertel. Von manchen werden auch Stapelbalken verwendet, wobei deren Aussagekraft jedoch gering ist. Die Animation zeigt identische Daten mit den drei genannten Darstellungsformen:
MehrfachantwortenWenn Mehrfachantworten vorliegen, ergeben sich einige Besonderheiten: Dies betrifft zum einen die Prozentuierung und zum anderen die Darstellungsform. Für eine Frage, die mit mehr als einer Nennung beantwortet werden konnte, kommen drei Arten der Darstellung in Frage. Diese geben Antwort auf die folgenden Fragen:
Bewährt ist die Darstellung der Häufigkeit der Antwortmöglichkeiten
in Form von Balkendiagrammen, die sich hier zu mehr als 100% addieren. Dies muß
in der Grafik unbedingt deutlich gemacht werden, z. B. durch den Hinweis auf Mehrfachnennungen
und durch die Angabe, daß sich die Prozentzahlen auf die Befragten beziehen.
Kreisdiagramme und Stapelbalken-Diagramme sind meist nicht geeignet.
Verteilung stetiger VariablenBevor stetige Daten weiter analysiert werden, ist es immer zu empfehlen,
sich die Verteilung der Werte mit Hilfe eines Histogramms zu visualisieren. Beim Histogramm wird die Streubreite
eines Merkmals, also der Bereich zwischen dem kleinsten und größten Wert, in Teilintervalle aufgeteilt
und die Häufigkeit des Auftretens der so entstehenden Teilintervalle graphisch darstellt.
Eine Alternative für Histogramme sind u.U. Boxplots, die allerdings meist für den Vergleich von Teilstichproben, also Untergruppen, eingesetzt werden. Grobe Hinweise auf die Verteilung ist aber auch diesem Grafiktyp zu entnehmen.
Gegenüberstellung kategorialer Daten
Für die Darstellung von kategorialen (d.h. nominalen oder ordinalen) Daten von zwei oder mehr Teilstichproben sind
einfache Balken oder Stapelbalken hervorragend geeignet. Prozentangaben für die Teilstichproben
müssen sich jeweils immer zu 100% addieren. Auf die Gegenüberstellung von zwei oder gar mehreren Tortendiagrammen
sollte verzichtetet werden, da dies in den meisten Fällen zu unübersichtlich ist.
Gegenüberstellung stetiger DatenBei der Gegenüberstellung stetiger (d.h. ordinaler oder metrischer) Daten in zwei oder mehr Teilstichproben werden häufig Balkendiagramme benutzt. Mit diesen werden dann häufig lediglich die Mittelwerte in den Teilstichproben dargestellt. Dies mag zwar häufig gut aussehen, widerspricht aber dem Anliegen einer Grafik, Daten übersichtlich darzustellen. Zum anderen muß man Mittelwerte immer gemeinsam mit einem Streuungsmaß wie z.B. der Standardabweichung wiedergeben, da der Mittelwert allein eine recht geringe Aussagekraft hat. Daher sind Boxplots oder Fehlerbalken deutlich besser zur Gegenüberstellung von stetigen Daten geeignet. 1. Boxplot
Für den Vergleich mehrerer Teilgruppen stellt der Boxplot (Box-and-Whiskers Plot)
eine ideale Möglichkeit dar. Auf einen Blick können hiermit wichtige Merkmale einer Verteilung visuell erfaßt werden.
Boxplots werden auch als "5-Zahlen-Zusammenfassung" bezeichnet, was sich auf die fünf Merkmale Minimum,
unteres und oberes Quartil, Median und Maximum bezieht. Mit einem Boxplot ist es elegant möglich, einen ersten Gesamteindruck
über die Daten und Hinweise über die wichtigsten Eigenschaften einer Verteilung wie Zentrum, Streuung, Symmetrie, Schiefe zu vermitteln.
Die Form eines Boxplots gibt Hinweise auf die Verteilung in den gegenübergestellten
Teilstichproben, u.a. auf Abweichungen von der Normalverteilung.
Diese Charakteristika sind wesentlich für die weitere Verfahrensweise bei der Analyse der Daten, da einige statistische Verfahren
eine Normalverteilung voraussetzen.
2. Fehlerbalken
Eine andere Möglichkeit, stetige Daten in mehreren Teilstichproben gegenüberzustellen, bieten Fehlerbalken.
Anders als Boxplots sind diese (wie der Durchschnitt/das arithmetische Mittelwert auch!) nur vernünftig anwendbar,
wenn die Daten normalverteilt sind.
ZusammenhängeFür die Darstellung des Zusammenhangs zwischen zwei stetigen Variablen sind Streuungsdiagramme (Scatterplot) die wichtigste Möichkeit. Alle Punkte zweier Variablen werden hier in ein zweidimensionales Achsenkreuz eingezeichnet. Falls abhängige und unabhängige Variablen dargestellt werden, sollte darauf geachtet werden, daß die horizontale X-Achse zur Darstellung der unabhängigen Variable und die vertikale Y-Achse zur Darstellung der abhängigen Variable herangezogen wird. Optional kann eine Regressionsgrade eingezeichnet werden. Diese graphische Darstellungsform bietet schnell eine grobe Abschätzung einer eventuell vorhandenen linearen Korrelation wie in der folgenden Beispielgrafik:
|