Aufräumen Verwechslung zwischen Korrelation und Kausalität

Aufräumen Verwechslung zwischen Korrelation und Kausalität

Hier ist ein historischer Leckerbissen, den Sie vielleicht nicht kennen. Zwischen den Jahren 1860 und 1940, als die Zahl der in New England lebenden Methodisten-Minister zunahm, stieg auch die Menge des in Boston importierten kubanischen Rums - und beide stiegen in sehr ähnlicher Weise. Deshalb müssen Methodisten-Minister in dieser Zeit viel Rum gekauft haben!

Eigentlich nein, das ist eine dumme Schlussfolgerung. Was wirklich vor sich geht, ist, dass beide Quantitäten - methodistische Minister und kubanischer Rum - durch andere Faktoren, wie Bevölkerungswachstum, nach oben getrieben wurden.

Bei dieser falschen Schlussfolgerung haben wir den viel zu häufigen Fehler gemacht: verwirrende Korrelation mit Kausalität.

Was ist der Unterschied?

Zwei Mengen sollen gesagt sein korreliert wenn beide zusammen zunehmen und abnehmen ("positiv korreliert"), oder wenn einer zunimmt, wenn der andere abnimmt und umgekehrt ("negativ korreliert").

Korrelation wird leicht durch statistische Messungen der detektierten Pearsons Korrelationskoeffizient, die anzeigt, wie eng die beiden Größen zusammengeschlossen sind, die von -1 (perfekt negativ korreliert) über 0 (überhaupt nicht korreliert) und bis zu 1 (perfekt positiv korreliert) reichen.

causation1tylervigen.com

Aber nur weil zwei Größen korreliert sind, heißt das nicht notwendigerweise, dass man direkt ist verursacht der andere zu ändern. Korrelation bedeutet keine Kausalität, so wie wolkiges Wetter keinen Niederschlag bedeutet, obwohl das Gegenteil der Fall ist.


Holen Sie sich das Neueste von InnerSelf


Wenn zwei Größen korreliert sind, kann es durchaus eine echte Ursache-Wirkungs-Beziehung geben (wie Niederschlagsmengen und Regenschirmverkäufe), aber möglicherweise sind andere Variablen beides (wie z Piratenzahlen und globale Erwärmung), oder vielleicht ist es nur Zufall (wie US-Käsekonsum und Strangulations-by-Bedsheet).

Selbst dort, wo Verursachung vorhanden ist, müssen wir darauf achten, nicht die Ursache mit der Wirkung zu verwechseln, sonst könnten wir schließen, zum Beispiel, dass ein vermehrter Einsatz von Heizungen kälteren Wetter verursacht.

Um Ursache und Wirkung zu schaffen, müssen wir über die Statistiken zu gehen und suchen Sie nach gesonderten Nachweises (einer wissenschaftlichen oder historischen Charakter) und logisches Denken. Die Korrelation kann uns auffordern, für solche Beweise in erster Linie zu gehen auf der Suche, aber es ist auf keinen Fall ein Beweis in seinem eigenen Recht bedeutet.

Subtile Probleme

Obwohl die obigen Beispiele offensichtlich dumm waren, ist Korrelation sehr oft fälschlicherweise für Verursachung in einer Weise, die nicht sofort ersichtlich, in der realen Welt sind. Beim Lesen und Statistiken zu interpretieren, muss man sehr darauf achten, genau zu verstehen, was die Daten und ihre Statistiken impliziert - und was noch wichtiger ist, was sie sind nicht implizierend.

causation2

Ein aktuelles Beispiel für die Notwendigkeit zur Vorsicht bei der Interpretation von Daten ist die Aufregung zu Beginn dieses Jahres die scheinbare wegweisende Umgebung Detektion von Gravitationswellen - eine offenbar offenbar gemachte Ankündigung vorzeitig, bevor alle Variablen berücksichtigt wurden, die die Daten beeinflusst haben.

Leider Statistiken, Wahrscheinlichkeiten und Risiken, die Analyse ist keine Fähigkeiten verdrahtet in unsere menschliche Intuitionund so ist es allzu leicht, in die Irre geführt zu werden. Ganze Bücher wurden auf die subtilen Weisen geschrieben, in denen Statistiken falsch interpretiert werden können (oder zur Irreführung benutzt werden). Um zu helfen, wachsam zu bleiben, hier sind einige allgemeine rutschige statistische Probleme, die Sie beachten sollten:

1) Der Healthy-Worker-Effekt, bei dem manchmal zwei Gruppen nicht direkt auf einem Level-Playing-Field verglichen werden können.

Betrachten Sie eine hypothetische Studie, die den Gesundheitszustand einer Gruppe von Büroangestellten mit der Gesundheit einer Gruppe von Astronauten vergleicht. Wenn die Studie keinen signifikanten Unterschied zwischen den beiden - keine Korrelation zwischen Gesundheit und Arbeitsumgebung - zeigt, können wir schlussfolgern, dass das Leben und Arbeiten im Weltraum keine langfristigen Gesundheitsrisiken für Astronauten birgt?

Nein! Die Gruppen sind nicht gleichgestellt: Die Astronautenkorps überprüfen Bewerber auf gesunde Kandidaten, die dann ein umfassendes Fitness-Regime pflegen, um die Auswirkungen des Lebens in "Mikrogravitation" proaktiv zu bekämpfen.

Wir erwarten daher, dass sie im Durchschnitt wesentlich gesünder sind als Büroangestellte und zu Recht betroffen sein sollten, wenn dies nicht der Fall wäre.

2) Kategorisierung und der Phasenmigrationseffekt - das Mischen von Personen zwischen Gruppen kann dramatische Auswirkungen auf statistische Ergebnisse haben.

Dies ist auch bekannt als die Will Rogers Effekt, nach dem US-Komiker, der angeblich witzelte:

Wenn die Okies Oklahoma verlassen und zog nach Kalifornien, hob sie den durchschnittlichen Intelligenzniveau in beiden Staaten.

Stellen Sie sich zum Beispiel vor, eine große Gruppe von Freunden in eine "kurze" Gruppe und eine "große" Gruppe zu unterteilen (vielleicht, um sie für ein Foto zu arrangieren). Nachdem dies geschehen ist, ist es überraschend einfach, die durchschnittliche Höhe beider Gruppen auf einmal zu erhöhen.

Fragen Sie einfach die kürzeste Person in der Gruppe "groß", um zur Gruppe "kurz" zu wechseln. Die "große" Gruppe verliert ihr kürzestes Glied und stößt dadurch ihre durchschnittliche Höhe auf - aber die "kleine" Gruppe gewinnt ihr höchstes Glied und gewinnt dadurch auch an durchschnittlicher Höhe.

Dies hat große Auswirkungen auf medizinische Studien, bei denen Patienten im Verlauf einer neuen Behandlung häufig in "gesunde" oder "ungesunde" Gruppen eingeteilt werden. Wenn sich die Diagnosemethoden verbessern, können einige sehr ungesunde Patienten neu kategorisiert werden, was dazu führt, dass sich die Gesundheitsergebnisse beider Gruppen verbessern, unabhängig davon, wie effektiv (oder nicht) die Behandlung ist.

causation3Die Auswahl und Auswahl unter den Daten kann zu falschen Schlussfolgerungen führen. Die Skeptiker sehen die Abkühlphase (blau), wenn die Daten tatsächlich eine langfristige Erwärmung zeigen (grün). skepticalscience.com

3) Data Mining - wenn eine Fülle von Daten vorhanden sind, Bits und Stücke können Kirsche gepflückt werden jeden gewünschten Ergebnis zu gelangen.

Das ist eine schlechte statistische Praxis, aber wenn es absichtlich gemacht wird kann ohne Kenntnis des ursprünglichen, vollständigen Datensatzes schwer zu erkennen sein.

Betrachten Sie das obige Diagramm, das beispielsweise zwei Interpretationen von Daten zur globalen Erwärmung zeigt. Oder Fluorid - in kleinen Mengen ist es eines der wirksamsten Präventivmittel in der Geschichte, aber der positive Effekt verschwindet ganz, wenn man nur toxische Mengen an Fluorid betrachtet.

Aus ähnlichen Gründen ist es wichtig, dass die Prozeduren für ein gegebenes statistisches Experiment vor Beginn des Experiments festgelegt werden und dann bis zum Ende des Experiments unverändert bleiben.

4) Clustering - was auch in völlig zufälligen Daten zu erwarten ist.

Betrachten Sie eine medizinische Studie, die untersucht, wie eine bestimmte Krankheit, wie Krebs oder Multiple Sklerose, ist geografisch verteilt. Wenn die Krankheit zufällig auftritt (und die Umwelt keine Wirkung hat), würden wir erwarten, dass zahlreiche Gruppen von Patienten als selbstverständlich betrachtet werden. Wenn die Patienten vollkommen gleichmäßig verteilt sind, wäre die Verteilung höchst zufällig.

Daher ist die Anwesenheit eines einzelnen Clusters oder einer Anzahl kleiner Cluster von Fällen völlig normal. Ausgefeilte statistische Methoden werden benötigt, um zu bestimmen, wie viel Clusterbildung erforderlich ist, um daraus abzuleiten, dass etwas in diesem Bereich die Krankheit verursachen könnte.

Leider macht jeder Cluster - auch wenn er nicht wichtig ist - eine einfache (und auf den ersten Blick überzeugende) Schlagzeile.

causation4

Die statistische Analyse muss wie jedes andere mächtige Werkzeug sehr sorgfältig angewendet werden - und insbesondere muss man immer vorsichtig sein, wenn man Schlussfolgerungen daraus zieht, dass zwei Größen korreliert sind.

Stattdessen müssen wir immer auf separaten Beweisen bestehen, um für Ursache-und-Wirkung zu argumentieren - und diese Beweise werden nicht in Form einer einzigen statistischen Zahl vorliegen.

Scheinbar zwingende Korrelationen, sagen wir zwischen bestimmten Genen und Schizophrenie oder zwischen einem fettreiche Ernährung und Herzkrankheiten, könnte sich herausstellen, dass sie auf sehr zweifelhaften Methoden beruhen.

Wir sind vielleicht als Spezies kognitiv schlecht darauf vorbereitet, mit diesen Fragen umzugehen. Als kanadischer Pädagoge Kieran Egan lege es in sein Buch Von Anfang an falsch handeln:

Die schlechte Nachricht ist, dass unsere Evolution uns in kleine, stabile Jäger-Sammler-Gesellschaften einwies. Wir sind pleistozäne Menschen, aber unsere sprachlichen Gehirne haben massive, multikulturelle, technologisch anspruchsvolle und sich schnell verändernde Gesellschaften geschaffen, in denen wir leben können.

Folglich müssen wir beständig der Versuchung widerstehen, Bedeutung im Zufall zu sehen und Korrelation und Verursachung zu verwechseln.Das Gespräch

Dieser Artikel wurde ursprünglich veröffentlicht am Das Gespräch
Lesen Sie die Original Artikel.


Über die Autoren

Borwein jonathanJonathan Borwein (Jon) ist Laureate Professor für Mathematik an der Universität von Newcastle. Er ist Preisträger Professor für Mathematik an der Universität Newcastle und Direktor des Zentrums für Computergestützte Forschung Mathematik und ihre Anwendungen (CARMA). Er hat an den Universitäten Carnegie-Melon, Dalhousie, Simon Fraser und Waterloo gearbeitet und zwei Canada Research Chairs im Bereich Computing inne.

Rose MichaelMichael Rose ist Doktorand, School of Mathematical and Physical Sciences an der University of Newcastle.Mathematics Doktorand unter der Leitung von Laureate Prof. Jon Borwein an der Universität von Newcastle, Australien. Momentan Unterstützung bei der Erforschung der Fraktalen Mathematik zur Modellierung von Gehirn-Synapsenverteilungen.

Disclosure Statement: Die Autoren arbeiten nicht für Anteile an anderen Unternehmen oder Organisationen, die von diesem Artikel profitieren würden. Sie haben auch keine relevanten Zugehörigkeiten.


Buchtipp:

Geld, Sex, Krieg, Karma: Hinweise für eine buddhistische Revolution
von David R. Loy.

Geld, Sex, Krieg, Karma: Hinweise für eine buddhistische Revolution von David R. Loy.David Loy ist zu einem der mächtigsten Verfechter der buddhistischen Weltanschauung geworden und hat wie kein anderer seine Fähigkeit erklärt, die soziopolitische Landschaft der modernen Welt zu verändern. Im Geld, Sex, Krieg, KarmaEr bietet scharfe und sogar erschreckend klare Darstellungen häufig missverstandener buddhistischer Grundpfeiler - das Wirken von Karma, die Natur des Selbst, die Ursachen von Ärger sowohl auf individueller als auch auf gesellschaftlicher Ebene - und die wahren Gründe unseres kollektiven Gefühls "nie genug "ob es Zeit ist, Geld, Sex, Sicherheit ... sogar Krieg. Davids "Buddhistische Revolution" ist nichts anderes als ein radikaler Wandel in der Art, wie wir uns unserem Leben, unserem Planeten, den kollektiven Wahnvorstellungen nähern können, die unsere Sprache, Kultur und sogar unsere Spiritualität durchdringen.

Klicken Sie hier für weitere Informationen und / oder dieses Buch auf Amazon bestellen.


enafarzh-CNzh-TWnltlfifrdehiiditjakomsnofaptruessvtrvi

Folge InnerSelf weiter

facebook-icontwitter-iconRSS-Symbol

Holen Sie sich das Neueste per E-Mail

{Emailcloak = off}