Wie man die sieben Todsünden der statistischen Fehlinterpretation vermeidet

Statistik ist ein nützliches Werkzeug, um die Muster in der Welt um uns herum zu verstehen. Aber unsere Intuition lässt uns oft im Stich, wenn es darum geht, diese Muster zu interpretieren. In dieser Serie betrachten wir einige der häufigsten Fehler, die wir machen, und wie wir sie vermeiden können, wenn wir über Statistiken, Wahrscheinlichkeit und Risiko nachdenken.Das Gespräch

1. Angenommen kleine Unterschiede sind sinnvoll

Viele der täglichen Schwankungen am Aktienmarkt sind eher Zufall als irgendetwas Bedeutungsvolles. Unterschiede in Umfragen, wenn eine Partei um einen oder zwei Punkte voraus ist, sind oft nur statistisches Rauschen.

Sie können vermeiden, falsche Rückschlüsse auf die Ursachen solcher Schwankungen zu ziehen, indem Sie fordern, die "Fehlermarge" in Bezug auf die Zahlen zu sehen.

Wenn die Differenz kleiner als die Fehlermarge ist, gibt es wahrscheinlich keinen bedeutungsvollen Unterschied, und die Variation ist wahrscheinlich nur auf zufällige Fluktuationen zurückzuführen.

Wie man die sieben Todsünden der statistischen Fehlinterpretation vermeidetFehlerbalken veranschaulichen den Grad der Unsicherheit in einer Punktzahl. Wenn sich solche Fehlergrenzen überschneiden, ist der Unterschied wahrscheinlich auf statistisches Rauschen zurückzuführen.


Innerself-Abonnieren-Grafik



2. Gleichsetzen der statistischen Signifikanz mit der realen Signifikanz

Wir hören oft Verallgemeinerungen darüber, wie sich zwei Gruppen in irgendeiner Weise unterscheiden, zum Beispiel, dass Frauen nährender sind, während Männer körperlich stärker sind.

Diese Unterschiede beruhen häufig auf Stereotypen und Volksweisheit, ignorieren jedoch häufig die Ähnlichkeiten zwischen den Menschen zwischen den beiden Gruppen und die Unterschiede in den Menschen innerhalb der Gruppen.

Wenn du zufällig zwei Männer auswählst, wird es wahrscheinlich ziemlich viel Unterschied in ihrer körperlichen Stärke geben. Und wenn Sie sich für einen Mann und eine Frau entscheiden, könnten sie sich in Bezug auf die Pflege sehr ähneln, oder der Mann könnte nährender sein als die Frau.

Sie können diesen Fehler vermeiden, indem Sie nach der "Effektgröße" der Unterschiede zwischen den Gruppen fragen. Dies ist ein Maß dafür, wie sehr sich der Durchschnitt einer Gruppe vom Durchschnitt einer anderen Gruppe unterscheidet.

Wenn die Effektgröße klein ist, sind die beiden Gruppen sehr ähnlich. Selbst wenn die Effektgröße groß ist, haben die beiden Gruppen immer noch eine große Variationsbreite in ihnen, so dass sich nicht alle Mitglieder einer Gruppe von allen Mitgliedern einer anderen Gruppe unterscheiden.


3. Vernachlässigung, um Extreme zu betrachten

Die Kehrseite der Effektgröße ist relevant, wenn das Objekt, auf das du dich konzentrierst, einem "Normalverteilung"(Manchmal als" Glockenkurve "bezeichnet). Hier sind die meisten Menschen in der Nähe der durchschnittlichen Punktzahl und nur eine kleine Gruppe ist weit über oder deutlich unter dem Durchschnitt.

Wenn das passiert, erzeugt eine kleine Veränderung der Leistung für die Gruppe einen Unterschied, der für die durchschnittliche Person nichts bedeutet (siehe Punkt 2), aber das ändert den Charakter der Extreme radikaler.

Vermeiden Sie diesen Fehler, indem Sie darüber nachdenken, ob Sie mit Extremwerten zu tun haben oder nicht. Wenn Sie mit durchschnittlichen Personen zu tun haben, spielen kleine Gruppenunterschiede oft keine Rolle. Wenn Sie sich für die Extreme interessieren, können kleine Gruppenunterschiede von Bedeutung sein.

Wie man die sieben Todsünden der statistischen Fehlinterpretation vermeidetWenn zwei Populationen einer Normalverteilung folgen, werden die Unterschiede zwischen ihnen in den Extremen deutlicher als in den Durchschnittswerten.


4. Vertrauender Zufall

Wusstest du, dass da eine ist? Korrelation zwischen der Anzahl der Menschen, die jedes Jahr in den Vereinigten Staaten ertranken, indem sie in ein Schwimmbad fielen, und Anzahl der Filme, in denen Nicholas Cage auftrat?

Wie man die sieben Todsünden der statistischen Fehlinterpretation vermeidetAber gibt es einen Kausalzusammenhang? tylervigen.com

Wenn Sie hart genug suchen, können Sie interessante Muster und Korrelationen finden, die nur auf Zufall zurückzuführen sind.

Nur weil sich zwei Dinge gleichzeitig oder in ähnlichen Mustern ändern, heißt das nicht, dass sie miteinander verwandt sind.

Vermeiden Sie diesen Fehler, indem Sie fragen, wie zuverlässig die beobachtete Assoziation ist. Ist es einmalig oder ist es mehrmals passiert? Können zukünftige Assoziationen vorhergesagt werden? Wenn Sie es nur einmal gesehen haben, liegt es wahrscheinlich an zufälligen Chancen.


5. Kausalität rückwärts bekommen

Wenn zwei Dinge zusammenhängen - zum Beispiel Arbeitslosigkeit und psychische Probleme -, könnte es verlockend sein, einen "offensichtlichen" Kausalpfad zu sehen - sagen wir, dass psychische Probleme zu Arbeitslosigkeit führen.

Aber manchmal geht der Kausalpfad in die andere Richtung, wie beispielsweise Arbeitslosigkeit, die psychische Probleme verursacht.

Sie können diesen Fehler vermeiden, indem Sie daran denken, über umgekehrte Kausalität nachzudenken, wenn Sie eine Assoziation sehen. Könnte der Einfluss in die andere Richtung gehen? Oder könnte es in beide Richtungen gehen und eine Rückkopplungsschleife schaffen?


6. Vergessen, äußere Ursachen zu berücksichtigen

Menschen versäumen es oft, mögliche "dritte Faktoren" oder äußere Ursachen zu bewerten, die einen Zusammenhang zwischen zwei Dingen schaffen könnten, weil beides tatsächlich Ergebnisse des dritten Faktors sind.

Zum Beispiel könnte es einen Zusammenhang zwischen Essen in Restaurants und besserer kardiovaskulärer Gesundheit geben. Das könnte zu der Annahme führen, dass zwischen beiden eine kausale Verbindung besteht.

Es könnte sich jedoch herausstellen, dass diejenigen, die es sich leisten können, regelmäßig in Restaurants zu essen, in einem hohen sozioökonomischen Bereich sind und sich auch eine bessere Gesundheitsversorgung leisten können, und dass die Gesundheitsfürsorge eine bessere kardiovaskuläre Gesundheit bietet.

Sie können diesen Fehler vermeiden, indem Sie daran denken, über dritte Faktoren nachzudenken, wenn Sie eine Korrelation sehen. Wenn Sie eine Sache als mögliche Ursache verfolgen, fragen Sie sich, was wiederum das Ding verursacht? Könnte dieser dritte Faktor beide beobachteten Ergebnisse verursachen?


7. Trügerische Graphen

Bei der Skalierung und Beschriftung der vertikalen Achse auf Graphen tritt viel Unfug auf. Die Etiketten sollten den vollen sinnvollen Bereich von allem zeigen, was Sie sehen.

Aber manchmal wählt der Graphenhersteller einen engeren Bereich, um einen kleinen Unterschied oder eine Assoziation wirkungsvoller zu machen. Auf einer Skala von 0 bis 100 können zwei Spalten die gleiche Höhe haben. Aber wenn Sie die gleichen Daten nur von 52.5 zu 56.5 darstellen, sehen sie möglicherweise drastisch anders aus.

Sie können diesen Fehler vermeiden, indem Sie die Beschriftungen des Diagramms entlang der Achsen beachten. Seien Sie besonders skeptisch gegenüber unmarkierten Graphen.

Wie man die sieben Todsünden der statistischen Fehlinterpretation vermeidetGraphen können eine Geschichte erzählen - Unterschiede werden je nach Maßstab größer oder kleiner.

Über den Autor

Winnifred Louis, Associate Professor, Sozialpsychologie, Die Universität von Queensland und Cassandra Chapman, Doktorandin in Sozialpsychologie, Die Universität von Queensland

Dieser Artikel wurde ursprünglich veröffentlicht am Das Gespräch.. Lies das Original Artikel.

Bücher zum Thema:

at InnerSelf Market und Amazon