Regenschirme erzeugen Regen?

Nein, tun sie nicht. Unmöglich wäre es jedoch nicht. Schließlich ist das Wetter ein chaotisches System - umgangssprachlich: Der Flügelschlag eines Schmetterlings kann einen Orkan auslösen. Aber darum soll es hier nicht gehen. Für die meisten Leser hier wird es aus ihrer persönlichen Erfahrung heraus möglich sein einzusehen, dass Regenwetter die Anzahl der Regenschirme, die man auf den Bürgersteigen sieht, ansteigen lässt. Der Regen umgekehrt aber nicht entsteht, weil so viele Regenschirme aufgespannt sind.

Ein etwas naiver und rein objektiver Beobachter der Situation könnte diesen Kausalzusammenhang unter Umständen übersehen. Er sieht nur, dass (Regen, Schirme), sowie (kein Regen, keine Schirme) als Kombinationen jeweils häufig auftreten. Für ihn ist überhaupt nicht klar, was nun durch was herbeigeführt wurde. Es könnte auch gar keinen Kausalzusammenhang geben. Es könnte ja beides - unabhängig - durch eine dritte Sache impliziert werden. Oder das Auftreten kann sogar rein zufällig sein. Dies ist ein Artikel über Kausalität, Korrelation sowie falsche Interpretationen.

Korrelation. 
Beginnen wir mit Korrelation. Zwei Ereignisse nenne ich positiv korreliert, wenn die Wahrscheinlichkeit, dass sie zusammen auftreten höher ist, als das Produkt der Wahrscheinlichkeiten das jeweils eins der Ereignisse auftritt. Ich nenne die Ereignisse mal A und B und ihre Wahrscheinlichkeiten P(A), P(B). Positiv korreliert heißt:

P(A)P(B) < P(A und B),

wobei P(A und B) die Wahrscheinlichkeit des Ereignisses ist, das A und B gleichzeitig auftreten. Negativ korreliert hießen die Ereignisse, wenn hingegen:

P(A)P(B) > P(A und B).

In diesem Fall wäre das gemeinsame Auftreten von A und B weniger wahrscheinlich als das "unabhängige" Auftreten der Wahrscheinlichkeiten der einzelnen Ereignisse - also deren Produkt.

Unkorreliert oder nicht korreliert sind die Ereignisse, falls

P(A)P(B) = P(A und B).

Den Begriff "Wahrscheinlichkeit" habe ich hier jetzt weder definiert, noch motiviert. Es soll hier nun vor allem um Statistik gehen und damit um empirische Wahrscheinlichkeiten. Das heißt die Wahrscheinlichkeit von A und B sind die relative Häufigkeiten des Eintretens dieser Ereignisse.

Wir haben zum Beispiel 100-mal gewürfelt und dabei folgende Häufigkeiten der Augenzahlen beobachtet:

Augenzahl     Häufigkeit     Relative Häufigkeit/
Wahrscheinlichkeit    
1 12 0.12
2 21 0.21
3 7 0.07
4 19 0.19
5 23 0.23
6 18 0.18
Summe 100 1.00

Anhand dieser Daten betrachten wir nun einige Rechenbeispiele.

Beispiel 1. Wir betrachten die folgenden Ereignisse:

A = {Der Würfel zeigt 1, 2 oder 3}, B = {Der Würfel zeigt 3, 4, oder 5}, A und B = {Der Würfel zeigt 3}.

und erhalten die folgenden Wahrscheinlichkeiten:

P(A) = 0.40, P(B) = 0.49, P(A und B) = 0.07.

Nun ist P(A und B) = 0.07 < 0.196 = P(A)P(B). Damit sind A und B negativ korreliert. A und B sind zusammen nur sehr selten aufgetreten, einzeln jedoch sehr häufig.

Beispiel 2. Wir betrachten die folgenden Ereignisse:

A = {Der Würfel zeigt 1, 2 oder 3}, B = {Der Würfel zeigt 1, 2 oder 4}, A und B = {Der Würfel zeigt 1 oder 2}.

und erhalten die folgenden Wahrscheinlichkeiten:

P(A) = 0.40, P(B) = 0.52, P(A und B) = 0.33.

Nun ist P(A und B) = 0.33 > 0.208 = P(A)P(B). Damit sind A und B positiv korreliert. A und B sind sehr häufig zusammen aufgetreten.

Diese Ergebnisse aus einem einfachen Zufallsexperiment sind in gewisser Weise sehr stereotyp, aber ich denke es hilft dem geneigten Leser beim Verständnis des Begriffes "Korrelation". 

Kausalität. 
Ein Ereignis A nenne ich (oder z.B. die Wikipedia) kausal für ein Ereignis B, wenn es von A herbeigeführt wurde. Das heißt, A bietet einen Anlass dafür, dass B geschieht und das Geschehen von B kann exakt auf den Anlass A zurückgeführt werden. 

Beispiel 3. Dieses Beispiel für einen Kausalzusammenhang habe ich bereits am Anfang des Textes erwähnt: Regen und Regenschirme. Wenn es regnet, spannen Leute ihren Regenschirm auf, da sie nicht nass werden möchten. Damit haben wir hier eine klare Kausalität von A nach B, wobei

A = {Es regnet}, B = {Leute spannen einen Regenschirm auf}.

Wie hängen Korrelation und Kausalität zusammen? Wenn ich weiß, ich habe eins der beiden, kann ich dann auch das andere sehen?

Korrelation impliziert Kausalität?
Dies ist wohl der feuchte Traum eines jeden Statistiker. Er beobachtet ständig Korrelationen und hofft natürlich, dass es bei diesen Ereignissen einen Kausalzusammenhang gibt. 

Verschiedene Probleme:
  1. Korrelation sagt nichts über die Wirkungsreihenfolge aus. Also wenn A und B positiv korreliert sind, könnte B kausal für A oder aber A kausal für B sein
  2. Ein Ereignis C könnte kausal für A und B sein
  3. A und B könnten nur zufälligerweise korreliert sein.
Betrachten wir wieder einige Beispiele:

Beispiel 4. Der Gefahr den werten Leser zu langweilen ins Auge blickend, schauen wir uns doch wieder den Regen und die Regenschirme an. Wir beobachten eine positive Korrelation dieser beiden Ereignisse. Der Statistiker, der auf Kausalität hofft, kann hier schon nicht entscheiden, welches für welches Ereignis verantwortlich sein soll. Werden die Regenschirme aufgespannt um den Regen abzuwehren oder fängt es an zu regnen, weil viele Leute den Regenschirm aufgespannt haben?

Beispiel 5. Es ist schönes Wetter an einem Wochenende in Bayern. In Augsburg beobachtet der Statistiker eine hohe Anzahl an Freibadbesuchern, in München sieht er gleichzeitig einen Anstieg des Speiseeisverkaufes. Damit sind Eisverkäufe in München und Freibadbesuche in Augsburg positiv korreliert. Nun essen Freibadbesucher in Augsburg sicherlich gerne mal ein Eis, dafür fahren sie aber nicht extra nach München. Kausal für beide Ereignisse und damit auch für deren Korrelation ist jedoch einfach das schöne Wetter an beiden Orten.

Beispiel 6. Zum 3. oben genannten Fall gibt es gleich eine ganze Sammlung von nicht-konstruierten Beispielen. Unter http://www.tylervigen.com/spurious-correlations findet man diverse - durchaus witzige - Korrelationen, die sicherlich ausschließlich zufällig aufgetreten sind. Zum Beispiel ist die Anzahl der Leute, die in einem Swimming Pools ertrunken sind, sowie die Anzahl der Filme in denen Nicholas Cage auftrat, positiv korreliert. Ein kausaler Zusammenhang ist hier völlig ausgeschlossen.

Ein weiteres Beispiel für Korrelation und Kausalität liefern die Zeichner von xkcd. Die haben den Unterschied verstanden, siehe Abb. 1.

Abb 1. Zwei Studenten unterhalten sich über Korrelation und Kausalität, der eine versteht es, der andere nicht. (Quelle: https://www.xkcd.com/552/)


Kausalität impliziert Korrelation? 
Doch die umgekehrte Richtung scheint zu funktionieren, oder? Wenn es einen Kausalzusammenhang gibt, sollte man eine positive Korrelation sehen. Problematisch könnte sein, dass der Kausalzusammenhang natürlich beliebig kompliziert sein kann. Bei Multikausalität, also mehrere Ereignisse zusammen ein Ereignis bewirken, könnte es sein, dass die einzelnen Ereignisse mit dem Ergebnis nicht korreliert sind.

Beispiel 7. Ein Haus fällt zusammen, nachdem ein Baum auf das Haus fällt und es gleichzeitig Steinschlag gibt. Wenn es in der Vergangenheit nur entweder Steinschlag oder den Baum, der auf das Haus kracht, gegeben hätte, und das Haus dabei nicht zerstört wurde, würde es keine Korrelation oder negative Korrelation geben zwischen (Steinschlag, Haus zerstört) bzw. (Baum fällt, Haus zerstört) geben, also

P(A1)P(B) > P(A1 und B) = 0 und P(A2)P(B) > P(A2 und B) = 0,

wobei: A1 = {Steinschlag}, A2 = {Baum fällt} und B = {Haus zerstört}.

Falsche Interpretation.
Schauen wir uns nun vielleicht noch einen Fall aus der Praxis an, bei dem Korrelation und Kausalität oft verwechselt werden.

Beispiel 8. Warum ist Homöopathie so beliebt, obwohl sich die Wirksamkeit wissenschaftlich nicht nachweisen lässt - bzw. die wissenschaftlichen Nachweise keine Reproduktionsstudie durchstehen? Sie ist beliebt, weil viele Menschen glauben die Wirksamkeit zu spüren. Sie sind krank, nehmen ein Homöopathikum und es geht ihnen wenig später tatsächlich besser. Dies ist jedoch nur eine Korrelation. Was dort (im Gegensatz zu dem Homöopathikum) gewirkt hat - also was kausal ist -, ist schwer festzustellen: Die Einnahme von Tabletten, das Gespräch mit dem Homöopath, die Selbstheilungskräfte des Körpers, die Story vom besten Kumpel, der auf die Homöopathie schwört,...
Wertet man die Heilung unreflektiert zu Gunsten der Globuli, so wird man in Zukunft wohl auch wieder zu diesen greifen.

Fazit. 
Korrelation und Kausalität müssen getrennt betrachtet werden. Die Korrelation ist ein rein statistisches Maß, das sicherlich zum groben Aufspüren etwaiger Kausalitäten verwendet werden kann. Kausalitäten erfordern jedoch ein tieferes Studium der Objekte und des Zusammenhangs derer . Reine Korrelationsinformation kann nicht verwendet werden.

Kommentare

Beliebte Posts aus diesem Blog

Quantenphysik in der Homöopathie?

Lernen auf mehreren Levels