A/B Test Calculator — это бесплатно?

Да. [A/B Test Calculator](/ru/ab-test-calculator) полностью бесплатный, без регистрации. Вся обработка происходит в вашем браузере.

Нужно что-то устанавливать для A/B Test Calculator?

Нет. [A/B Test Calculator](/ru/ab-test-calculator) работает прямо в браузере — без скачиваний, плагинов и регистрации.

Мои данные в безопасности при использовании A/B Test Calculator?

Да. Все данные остаются в вашем браузере и не отправляются на сервер. Ничего не сохраняется и не отслеживается.

sequential testing peeking ab test stats bias

Последовательное тестирование и ловушка для подглядывания

Практический гайд по теме «Последовательное тестирование и ловушка для подглядывания»: ключевые шаги, типичные ошибки и внедрение через Калькулятор A/B.

Автор Редакция Tools Hub·Опубликовано 11 февраля 2026 г.·Время чтения: 8 мин

Перейти к инструменту

Калькулятор A/B

Статистическая значимость (Z-test) и доверительные интервалы.

Маркетинг

Перейти к инструменту →Все статьи

Ловушка подглядывания в цифрах

Вы установили alpha = 0,05 (5% ложноположительных) и планируете 4 недели теста. Но проверяете результаты каждый день. После 28 проверок на случайно колеблющихся данных вероятность хотя бы одного ложного «значимого» результата — не 5%, а около 25-30%.

Причина: каждая проверка — это проверка гипотезы. Даже без реального эффекта случайные данные иногда выглядят значимыми. Больше проверок = больше шансов на ложную тревогу. Формально тестовая статистика под нулевой гипотезой следует случайному блужданию и с нарастающей вероятностью пересекает любую фиксированную границу.

Alpha spending: решение

Методы последовательного тестирования контролируют суммарную частоту ложных срабатываний по всем промежуточным анализам, «расходуя» alpha постепенно. Вместо alpha = 0,05 на каждом взгляде каждый промежуточный анализ использует меньший порог, а суммарный уровень по всем проверкам остаётся 0,05.

Два классических подхода:

O'Brien-Fleming — очень консервативный в начале, мягкий в конце. Первый анализ может потребовать p < 0,0001 для остановки. Финальный — примерно исходный alpha. Лучший выбор, когда нужно дойти до конца, если эффект не огромен.

Анализ	Накопленный alpha	Граничное p-value
1 из 4	0,0001	0,0001
2 из 4	0,0054	0,0049
3 из 4	0,0221	0,0184
4 из 4	0,0500	0,0429

Pocock — расходует alpha равномерно. Каждый анализ использует примерно одинаковый порог (~0,016 при 4 анализах). Проще объяснять, но требует большего размера выборки, потому что alpha тратится рано.

Как настроить групповой последовательный дизайн

1.До теста: определите максимальное число промежуточных анализов (например, 4 — на 25%, 50%, 75% и 100% целевой выборки).

2.Выберите функцию расходования alpha (обычно O'Brien-Fleming).

3.Рассчитайте скорректированный размер выборки — добавьте ~15-20% к оценке фиксированного горизонта.

4.На каждом промежуточном анализе: сравните тестовую статистику с границей для этого анализа. Если пересекает — останавливайте и фиксируйте значимость. Если нет — продолжайте.

5.На финальном анализе: примените конечную границу. Если незначимо — заключите, что обнаруживаемого эффекта нет.

Практический пример

База: конверсия 5%, MDE: 2 пп, alpha: 0,05, мощность: 80%.

•Фиксированный горизонт: ~1 300 на вариант.

•С 4 промежуточными анализами (O'Brien-Fleming): ~1 500 на вариант.

•При 300 визитах/день на вариант расписание: день 5, день 10, день 15, день 20.

Рассчитайте размер выборки и расписание в A/B-тест калькуляторе.

Когда НЕ использовать последовательное тестирование

•Если трафика хватает, чтобы набрать полную выборку за неделю, используйте фиксированный горизонт — сложность не оправдана.

•Если стейкхолдеры всё равно будут подглядывать, игнорируя границы, последовательный дизайн не поможет.

Связанные материалы

•Когда останавливать A/B-тест при низком трафике

•Как избежать ложноположительных результатов

•MDE в A/B-тестировании

Следующий шаг

Определите 3-5 промежуточных анализов, выберите границы O'Brien-Fleming и рассчитайте скорректированный размер выборки в A/B-тест калькуляторе.

Редакционные стандарты

Материал проверен редакцией Tools Hub на точность формулировок, практическую применимость и соответствие актуальным сценариям использования инструментов.

Проверено: 11 февраля 2026 г.

О проекте Контакты Политика конфиденциальности

Навигация по статьям

Все статьи

Более новая статья

Байесовское и частое A/B-тестирование для продуктовых команд

Более старая статья

Размер выборки для экспериментов с процессом регистрации

Калькулятор A/B

Ловушка подглядывания в цифрах

Alpha spending: решение

Как настроить групповой последовательный дизайн

Практический пример

Когда НЕ использовать последовательное тестирование

Связанные материалы

Следующий шаг

Редакционные стандарты

Навигация по статьям

Похожие статьи

Калькулятор A/B

Ловушка подглядывания в цифрах

Alpha spending: решение

Как настроить групповой последовательный дизайн

Практический пример

Когда НЕ использовать последовательное тестирование

Связанные материалы

Следующий шаг

Редакционные стандарты

Навигация по статьям

Похожие статьи