Trickreiche Statistik

Um mithilfe der herkömmlichen („frequentistischen“) Statistik eine Hypothese zu testen, betrachtet man als Alternative die sogenannte Nullhypothese. Soll die Hypothese einen bestimmten Einfluss oder einen bestimmten Zusammenhang nachweisen, dann drückt die Nullhypothese aus, dass Einfluss oder Zusammenhang nicht bestehen. Sagt die Hypothese etwa aus, dass ein bestimmtes Medikament zur Behandlung der Krankheit X wirksam ist, dann wäre die Nullhypothese, dass das Medikament nicht besser wirkt als eine Placebobehandlung.

Anhand der verfügbaren Daten lässt sich nun die folgende Frage beantworten: Angenommen, die Nullhypothese treffe zu. Wie wahrscheinlich wäre es dann, bei einer Beobachtung oder Messung die tatsächlich gemessenen Daten zu erhalten? Ist die Wahrscheinlichkeit zu gering (fünf und ein Prozent sind typische Schwellenwerte), so wird die Nullhypothese verworfen; im Gegenzug akzeptiert man dann die Gültigkeit der ursprünglichen Hypothese.

Allerdings gibt es Möglichkeiten, wie die ursprüngliche Hypothese die Berechnung der Wahrscheinlichkeit der Nullhypothese subtil beeinflussen kann. Konkret für das hier behandelte Beispiel: Sucht man in den Einschlagkrater-Daten nach Periodizitäten, dann muss man angemessen berücksichtigen, dass jede konkrete Periodizität (etwa 13 oder 50 Millionen Jahre), die man als Hypothese aufstellt, bereits aus den Daten abgeleitet ist und daher nicht wie eine unabhängige Annahme behandelt werden darf. Vernachlässigt man diese Unterscheidung, dann beeinflusst das die statistische Analyse in unzulässiger Weise und verschafft der Nullhypothese einen unfairen Nachteil.

Außerdem weist die Zeitentwicklung der Einschlagwahrscheinlichkeit den oben erwähnten Trend auf: Sie nimmt über die vergangenen 250 Millionen Jahre hinweg zu. Sobald eine solche Tendenz vorliegt, ist die übliche Nullhypothese (zeitlich konstante Wahrscheinlichkeit) auf der Suche nach periodischen Veränderungen eine ungeeignete Vergleichshypothese.

Für die Bayes'sche Statistik benötigt man gleich mehrere alternative Hypothesen, die nach Möglichkeit alle infrage kommenden Fälle abdecken sollten. Für die Kraterdaten wählte Coryn Bailer-Jones die folgenden Vergleichshypothesen: konstante Einschlagwahrscheinlichkeit, einfache periodische Variation (Sinuskurve), periodische Variation überlagert konstante Wahrscheinlichkeit, Trend und periodische Variationen überlagern sich.

Ohne Beobachtungs- oder Messdaten, so die Annahme, gibt es keinen Grund, eine Hypothese den anderen vorzuziehen. In dieser Situation weist man daher jeder der Hypothesen die gleiche Ausgangswahrscheinlichkeit (A-priori-Wahrscheinlichkeit) zu.

Sobald man Messdaten hinzuzieht, ändert sich die Situation. Angesichts der gegebenen Messdaten mag sich eine Situation nun als recht unwahrscheinlich herausstellen, eine andere dagegen als recht wahrscheinlich. Die Bayes'sche Statistik erlaubt es, dies zu quantifizieren und die Ausgangswahrscheinlichkeiten mithilfe der Daten – in diesem Falle sind das die Altersabschätzungen für die verschiedenen Krater – anzupassen. Dabei lässt sich für jede der Hypothesen angeben, wie wahrscheinlich es bei Vorliegen der verfügbaren Messdaten ist, dass diese Hypothese zutrifft. Vergleicht man die Wahrscheinlichkeiten der Vergleichshypothesen, lässt sich entscheiden, welche davon am wahrscheinlichsten ist und auch, welchen „Wahrscheinlichkeitsvorsprung“ diese Hypothese vor den anderen hat.

Bayes'sche Statistik ist kein Patentrezept für alle statistischen Probleme. Auch bei diesem Verfahren gibt es einige Subtilitäten, insbesondere bei der Wahl der Ausgangswahrscheinlichkeiten. Für das hier vorliegende Problem, nämlich für die Analyse einer Reihe von Altersangaben, die mit Unsicherheiten behaftet sind (und bei der in einigen Fällen nur Altersobergrenzen bekannt sind), ist die Bayes'sche Statistik aber ein höchst nützliches Werkzeug, mit dessen Hilfe sich belastbare Schlüsse ziehen lassen.

Die Bayes'sche Analyse zeigt, dass die Daten entschieden gegen einfache periodische Variationen der Einschlagwahrscheinlichkeit sprechen und dass sie keinerlei Anhaltspunkte für eine Kombination aus periodischer Variation und allgemeinem Trend liefern. Diese Ergebnisse werden auch durch die verbliebenen Freiheiten, Ausgangswahrscheinlichkeiten zu wählen, nicht beeinflusst.

 

MP

Zur Redakteursansicht