Ist A/B Test Calculator kostenlos?

Ja. [A/B Test Calculator](/de/ab-test-calculator) ist komplett kostenlos und ohne Registrierung nutzbar. Alles wird direkt im Browser verarbeitet.

Muss ich etwas installieren, um A/B Test Calculator zu nutzen?

Nein. [A/B Test Calculator](/de/ab-test-calculator) funktioniert direkt im Browser — keine Downloads, Plugins oder Anmeldung noetig.

Sind meine Daten bei A/B Test Calculator sicher?

Ja. Alle Daten bleiben in Ihrem Browser und werden nie an unsere Server gesendet.

Sequentielles Testen spähen ab-Test Statistiken Voreingenommenheit

Sequentielles Testen und die Peeking-Falle

Praxisleitfaden zu „Sequentielles Testen und die Peeking-Falle“: zentrale Schritte, typische Fehler und Umsetzung mit A/B-Rechner.

Autor Tools Hub Redaktion·Veröffentlicht 11. Februar 2026·Zeit zum Lesen: 8 min

Gehen Sie zu Werkzeug

A/B-Rechner

Statistische Signifikanz (Z-Test) und Konfidenzintervalle.

Marketing

Gehen Sie zu Werkzeug →Alle Artikel

Die Falle des vorzeitigen Blickens in Zahlen

Sie setzen alpha = 0,05 (5% falsch positive Rate) und planen, einen Test für 4 Wochen durchzuführen. Aber Sie überprüfen die Ergebnisse jeden Tag. Nach 28 Überprüfungen von Daten, die zufällig schwanken, beträgt die Wahrscheinlichkeit eines *mindestens einmaligen* falsch signifikanten Ergebnisses nicht 5% — sie steigt auf etwa 25-30%.

Der Grund: Jede Überprüfung ist ein Hypothesentest. Selbst wenn es keinen realen Effekt gibt, sehen zufällig generierte Daten gelegentlich signifikant aus. Mehr Überprüfungen = mehr Chancen für einen falschen Alarm. Formal gesehen erhöht sich die Fehlerquote, weil die Teststatistik unter der Null einem Random Walk folgt und jede feste Grenze mit zunehmender Wahrscheinlichkeit über die Zeit überschreitet.

Alpha-Ausgaben: Die Lösung

Sequenzielle Testmethoden steuern die gesamte falsch positive Rate über mehrere Überprüfungen hinweg, indem sie alpha allmählich "ausgeben". Anstatt bei jeder Überprüfung alpha = 0,05 zu verwenden, verwendet jede Zwischenanalyse eine kleinere Schwelle, sodass die Gesamtschwelle über alle Überprüfungen hinweg bei 0,05 bleibt.

Zwei klassische Ansätze:

O'Brien-Fleming — sehr konservativ früh, nachsichtig spät. Die erste Überprüfung könnte ein p < 0,0001 erfordern, um zu stoppen. Die endgültige Überprüfung verwendet ungefähr die ursprüngliche alpha. Am besten geeignet, wenn Sie den vollständigen Test durchführen möchten, es sei denn, der Effekt ist enorm.

Überprüfung	Alpha-Ausgaben (kumuliert)	Grenz-p-Wert
1 von 4	0,0001	0,0001
2 von 4	0,0054	0,0049
3 von 4	0,0221	0,0184
4 von 4	0,0500	0,0429

Pocock — gibt alpha gleichmäßig aus. Jede Überprüfung verwendet ungefähr die gleiche Schwelle (~0,016 für 4 Überprüfungen). Einfacher zu erklären, aber erfordert eine größere Gesamtstichprobengröße, weil Sie alpha frühzeitig "aufbrauchen".

So richten Sie ein gruppensequenzielles Testen ein

1.Vor dem Test: Definieren Sie die maximale Anzahl von Überprüfungen (z. B. 4 Zwischenanalysen = Überprüfungen bei 25%, 50%, 75% und 100% der Zielstichprobe).

2.Wählen Sie eine Ausgabenfunktion (O'Brien-Fleming wird normalerweise bevorzugt).

3.Berechnen Sie die angepasste Stichprobengröße — fügen Sie ~15-20% zu Ihrer Schätzung für die feste Horizontlinie hinzu, um die sequenzielle Flexibilität zu berücksichtigen.

4.Bei jeder Zwischenüberprüfung: Vergleichen Sie die Teststatistik mit der Grenze für diese Überprüfung. Wenn sie diese überschreitet, stoppen Sie und erklären Sie die Signifikanz. Wenn nicht, fahren Sie fort.

5.Bei der endgültigen Überprüfung: Wenden Sie die endgültige Grenze an. Wenn immer noch nicht signifikant, schlussfolgern Sie, dass kein nachweisbarer Effekt vorliegt.

Praktisches Beispiel

Baseline: 5% Conversion, MDE: 2 pp, alpha: 0,05, Power: 80%.

•Stichprobengröße für feste Horizonte: ~1.300 pro Variante.

•Mit 4 Zwischenüberprüfungen (O'Brien-Fleming): ~1.500 pro Variante.

•Bei 300 Besuchern/Tag pro Variante, Überprüfungsplan: Tag 5, Tag 10, Tag 15, Tag 20.

Berechnen Sie Ihre erforderliche Stichprobe und Ihren Zeitplan mit A/B-Test-Rechner.

Wann Sie kein sequenzielles Testen verwenden sollten

•Wenn Sie genug Traffic haben, um die volle Stichprobengröße in weniger als einer Woche zu erreichen, verwenden Sie einfach die feste Horizontlinie — die Komplexität lohnt sich nicht.

•Wenn Stakeholder die Grenzen ignorieren und trotzdem vorbeischauen, hilft ein sequenzielles Design nicht.

Nächster Schritt

Entscheiden Sie sich für 3-5 Zwischenüberprüfungen, wählen Sie O'Brien-Fleming-Grenzen und berechnen Sie Ihre angepasste Stichprobengröße mit A/B-Test-Rechner.

Redaktionelle Standards

Dieser Artikel wird von der Tools Hub Redaktion auf fachliche Genauigkeit, praktische Relevanz und Konsistenz mit aktuellen Produkt-Workflows geprüft.

Zuletzt geprüft: 11. Februar 2026

Über uns Kontakt Datenschutz

Artikelnavigation

Alle Artikel

Neuerer Artikel

Bayesian vs. Frequentist A/B-Tests für Produktteams

Älterer Artikel

Stichprobengröße für Anmeldeflussexperimente

A/B-Rechner

Redaktionelle Standards

Artikelnavigation

Sequentielles Testen und die Peeking-Falle

A/B-Rechner

Die Falle des vorzeitigen Blickens in Zahlen

Alpha-Ausgaben: Die Lösung

So richten Sie ein gruppensequenzielles Testen ein

Praktisches Beispiel

Wann Sie kein sequenzielles Testen verwenden sollten

Verwandte Ressourcen

Nächster Schritt

Redaktionelle Standards

Artikelnavigation

Verwandte Artikel