Zum Hauptinhalt springen

Einführung

Entscheidungen mit einem kontrollierten Risikoniveau zu treffen, ist das Herzstück von A/B-Tests. Statistische Methoden wie „Frequentist” oder „Bayesian” können jedoch verwirrend sein. Dieser Artikel hilft Ihnen, das richtige Werkzeug für Ihre A/B-Tests auszuwählen.

Wichtigste verfügbare Wege

Bei der Interpretation Ihrer A/B-Testergebnisse können Sie die Ansätze Frequentist, Bayesian und sequenziell verwenden. Jeder Ansatz hat seine eigenen Vor- und Nachteile und verwendet unterschiedliche Methodiken.

Fixed Sample Frequentist

Die Methode Fixed Sample Frequentist schafft einen starren Rahmen, der es Ihnen ermöglicht, sicherzustellen, dass Sie Ihre Hypothese vor dem Start eines Tests klar umreißen. Wenn Sie sich an die Einschränkungen halten, die Sie erstellt haben, ohne Änderungen aufgrund anfänglicher Ergebnisse vorzunehmen, erhalten Sie eine optimale Kontrolle über das statistische Risiko.

Vorteile

  • Maximale statistische Aussagekraft.
  • Die am weitesten verbreitete Methode bei randomisierten kontrollierten Studien.

Nachteile

  • Sehr starr.

Zielgruppe

Reife Experimentier-Teams, die das Risiko verstehen, das sie eingehen, wenn sie die Methode nicht buchstabengetreu befolgen.

Bayesian

Die Bayesian-Methode bietet mehr Flexibilität, indem sie vorhandenes Wissen über A-priori-Wahrscheinlichkeiten in die Analyse einbezieht. Dieser Ansatz ist am besten, wenn reichlich vorherige Daten verfügbar sind, um die A-posteriori-Wahrscheinlichkeit zu berechnen.

Vorteile

  • Ermöglicht es Ihnen, Ihr Wissen zu nutzen.
  • Bietet Ihnen Zugriff auf wichtige Daten basierend auf der geschätzten Verteilung.

Nachteile

  • Kann Sie in die falsche Richtung lenken, wenn die A-priori-Daten falsch sind.

Zielgruppe

Experimentier-Teams, die es gewohnt sind, mit Bayesian-Techniken zu arbeiten. Diese Methode richtet sich an fortgeschrittene Benutzer, die ein Verständnis für Bayesian-Methoden und Wahrscheinlichkeitsverteilungen haben.

Sequential

Sequential testing geht das Problem der vorzeitigen Beendigung von Experimenten aufgrund von Zwischenergebnissen an, die von den Erwartungen abweichen. Im Gegensatz zu traditionellen Tests mit fester Stichprobengröße ermöglicht Sequential testing eine dynamische Entscheidungsfindung basierend auf der Anhäufung von Daten. Diese Flexibilität bietet zwar den Vorteil, möglicherweise früher zu Schlussfolgerungen zu gelangen, kann jedoch zu einer weniger präzisen Schätzung der Effektgröße führen.

Vorteile

  • Sehr flexibel, ohne dass die Stichprobengröße geschätzt werden muss.
  • Bietet zu jedem Zeitpunkt während der Laufzeit des Experiments ein gültiges Konfidenzintervall.

Nachteile

  • Geringere statistische Aussagekraft.

Zielgruppe

Schnelle Teams, die sich durch die Starrheit des Rahmens mit fester Stichprobengröße unter Druck gesetzt fühlen und bereit sind, etwas statistische Aussagekraft gegen mehr Flexibilität einzutauschen.
Um die Experimentierung zu optimieren, sollten Sie die Kombination von Sequential testing und Methodologien mit fester Stichprobengröße in Betracht ziehen. Die Verwendung von Sequential testing ermöglicht eine vorzeitige Beendigung basierend auf signifikanten Ergebnissen, während feste Stichprobengrößen statistische Strenge bieten. Indem Sie Schwellenwerte für einen vorzeitigen Stopp festlegen und Erkenntnisse mit traditionellen Methoden validieren, können Sie Erkenntnisse beschleunigen, ohne die Zuverlässigkeit zu beeinträchtigen.

Weitere Werkzeuge

Multiple testing correction

Um die Effizienz des Experimentierens zu maximieren, sollten Sie in Betracht ziehen, mehrere Variationen gleichzeitig zu testen. Dieser Ansatz kann das Gesamttempo des Experimentierens beschleunigen. Um jedoch die statistische Integrität aufrechtzuerhalten, implementieren Sie geeignete Korrekturmethoden, um das Risiko falsch positiver Ergebnisse zu mindern.

CUPED

CUPED ist eine bewährte Methode zur Reduzierung der erforderlichen Stichprobengröße in Experimenten. Durch die Nutzung von Daten vor dem Experiment verbessert CUPED die statistische Aussagekraft und beschleunigt das Experimentieren. Um seine Vorteile zu maximieren, sollten Sie die Kombination von CUPED mit traditionellen Methodologien mit fester Stichprobengröße in Betracht ziehen. Dieser hybride Ansatz ermöglicht eine frühzeitige Erkennung signifikanter Ergebnisse bei gleichzeitiger Aufrechterhaltung der statistischen Aussagekraft. CUPED ist unter folgenden Umständen am effektivsten:
  • Ihr Experiment umfasst wiederkehrende Besucher.
  • Sie haben viele Experimente in Kameleoon durchgeführt
  • Es besteht eine Korrelation zwischen den Zielkonvertierungen vor dem Start des Experiments und während des Live-Experiments.

Weiterführende Literatur

Wenn Sie weitere Details darüber wünschen, wie die Statistik-Engine von Kameleoon funktioniert, können Sie unser Statistik-Dokument lesen.