AB-тесты и подглядывание: введение в последовательное тестирование

info@vsetut.pro

Стать автором

Вернуться

25.01.2026 17:49:11 | Хабр

Хабы: Аналитика мобильных приложений, Статистика в IT, Python

В AB-тестах нередко возникает желание смотреть на результат по ходу эксперимента: метрики обновляются, решения ждать долго, а если эффект уже очевиден, то зачем тянуть до конца. Но в этом месте легко допустить серьезную ошибку: регулярно пересчитывать обычное p-значение и завершать тест при первом p < 0.05. Такой подход повышает долю ложных срабатываний: иногда статистическая значимость появляется просто из-за случайных колебаний данных, даже когда реального эффекта нет.

В этой статье разбираем, почему так происходит, и что с этим делают в прикладной аналитике. Покажу, как устроено групповое последовательное тестирование (group sequential): вы заранее задаете несколько контрольных точек для подглядывания, а пороги принятия решения подбираются так, чтобы общий уровень ошибки первого рода по всему процессу оставался на заданном уровне alpha.

На простых формулах и наглядных графиках из симуляций сравним наивное подглядывание с корректной процедурой. А затем разберем два самых популярных набора порогов - Pocock и OBrien-Fleming: чем они отличаются, почему один вариант чаще завершает эксперимент раньше, а другой почти не дает принимать решения в начале, и как выбрать подходящий вариант под продуктовый процесс.

Подробнее

Читайте также

Open source-экосистемы: как развивается GitFlic в Группе Астра — рассказывает Максим Козлов, основатель и CTO площадки
25.01.2026 17:26:42 | Хабр

Banana Pi BPI-R3 #2
25.01.2026 16:56:39 | Хабр

О пользе ИИ и нюансах его использования
25.01.2026 16:49:38 | Хабр

Как я собрал свою собственную умную колонку и Wi-Fi mesh-роутер в одном флаконе или конкурент для Яндекс станции
25.01.2026 16:28:44 | Хабр

Автопродление TLS тоже ломается
25.01.2026 16:22:15 | Хабр

Автор крупнейшего аккаунта в TikTok Хаби Лейм продаст права на свой бренд примерно за $900 млн — соглашение предусматривает создание его «цифрового двойника»
25.01.2026 16:12:21 | vc.ru

Что, если вы уже решаете не ту проблему?
25.01.2026 15:38:52 | Хабр

7 pet-проектов с LLM: приватность, скорость и безопасность своими руками
25.01.2026 14:00:36 | Хабр

ОСИНТ для ленивых. Часть 1: Как не вляпаться в непонятное, когда и так все понятно
25.01.2026 13:29:35 | Хабр

Requiem по Амбрелле: Грандиозная история Resident Evil от особняка до деревни (вот как бывает)
25.01.2026 13:03:27 | Хабр

«Yo-Kai Watch 2»: Покемоноклон, который (не) смог
25.01.2026 13:01:24 | Хабр

Группа истцов подала в суд на Meta*, утверждая, что у компании есть доступ к перепискам пользователей в WhatsApp*
25.01.2026 12:45:45 | vc.ru

Аудит доступности Wildberries. Может ли незрячий пользователь купить Бэтмобиль?
25.01.2026 12:31:57 | Хабр

Почему финтеху нужен капитальный ремонт: Манифест инженерной честности
25.01.2026 12:25:29 | Хабр

Карточки с Пикачу за миллионы долларов и свадьбы в стиле Disney: почему производители игрушек всё чаще ориентируются на взрослых
25.01.2026 12:02:05 | vc.ru

[Перевод] Гигабитный Ethernet через телефонную проводку
25.01.2026 11:56:27 | Хабр

Обзор книги «Атомные привычки. Как приобрести хорошие привычки и избавиться от плохих», Джеймс Клир
25.01.2026 11:35:17 | Хабр

«Бурлаки» на Каме
25.01.2026 11:30:14 | Хабр

Компрессор для данных или как я написал свой первый custom transformer
25.01.2026 11:16:06 | Хабр

День 1432: универсальный платежный QR-код станет обязательным для банков с 1 сентября 2026 года
25.01.2026 11:15:37 | vc.ru

Спасаем Бингус, и как я поправил ИИ помощника. Мануал для новичков
25.01.2026 11:09:16 | Хабр

Навангуют на миллиарды: история Polymarket
25.01.2026 10:41:03 | Хабр

Multi-Agent Systems в LegalTech: как симуляция судебного процесса повышает точность предсказаний (разбор SimCourt)
25.01.2026 10:18:16 | Хабр

Cryanide как альтернативная ветвь развития web-технологий
25.01.2026 10:15:57 | Хабр

Туда и обратно <—> как компании мигрировали в публичное облако, а теперь возвращаются к частному
25.01.2026 10:13:14 | Хабр

Особенности совещаний на проектах внедрения ERP-систем
25.01.2026 09:37:56 | Хабр

[Перевод] Частная компания раскрыла планы по созданию большого космического телескопа
25.01.2026 09:32:52 | Хабр

Cloud-9 — реликтовая беззвёздная протогалактика
25.01.2026 09:24:01 | Хабр

Стресс-тест функций активации: GELU vs Tanh
25.01.2026 09:17:55 | Хабр

За пределами LLM: детерминированный движок рассуждения на конечном алфавите
25.01.2026 09:15:50 | Хабр

Оптимизация рендера 2D-персонажей в MonoGame: Прагматичный подход слоёв и инстансинга
25.01.2026 09:15:17 | Хабр

На стыке AI и науки: Летняя школа Veai для студентов
25.01.2026 09:07:47 | Хабр

[Перевод] Второй отец MP3
25.01.2026 09:01:46 | Хабр

Второй уровень автономности ИИ: агент сам управляет облаком и администрирует ВМ по SSH
25.01.2026 08:58:44 | Хабр

[Перевод] OpenCode + Docker Model Runner для локальной разработки с ИИ
25.01.2026 08:49:09 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Израиль начал новую волну атак по военным объектам в Тегеране
07.03.2026 22:09:00 | Lenta.ru

Fars: Израиль и США ударили по районам Тегерана, где находятся нефтехранилища
07.03.2026 22:08:37 | ТАСС

Дрон врезался в небоскреб 23-Marina в Дубае, пожар сняли на видео
07.03.2026 22:08:00 | Российская Газета

Россиянка Валентина Алексеева стала первой «Мисс БРИКС»
07.03.2026 22:07:40 | Life.ru

Al Hadath: по району у посольства США в Багдаде выпущены четыре ракеты
07.03.2026 22:06:14 | ТАСС

В НЦ "Россия" показали мультижанровый спектакль в честь Международного женского дня
07.03.2026 22:05:55 | ТАСС

Дмитриев сообщил о начале масштабного инфляционного ценового шока в мире
07.03.2026 22:05:25 | Life.ru

Хоккеисты СКА во второй раз в сезоне обыграли московское "Динамо"
07.03.2026 22:03:51 | ТАСС

Водитель погиб в Дубае при падении обломков дрона на автомобиль
07.03.2026 22:03:36 | Life.ru

В Богородске три ученика школы находятся в стационаре после вспышки инфекции
07.03.2026 22:03:15 | ТАСС

Вяльбе высказалась о критике Губерниева
07.03.2026 22:01:47 | Lenta.ru

Иран нанес удары по Хайфе и по штабу американской армии в ОАЭ
07.03.2026 21:57:50 | ТАСС

Непомнящий оценил шансы шахматиста Есипенко выиграть турнир претендентов
07.03.2026 21:57:08 | ТАСС

В США вспомнили заявления Трампа на одну тему на фоне конфликта с Ираном
07.03.2026 21:57:05 | Lenta.ru

В Болгарии из-за фотографа-любителя закрыли аэропорт София
07.03.2026 21:57:01 | Life.ru

СКА второй раз в сезоне КХЛ обыграл московское «Динамо»
07.03.2026 21:56:49 | РБК

Российские силовики раскрыли, зачем Зеленский пиарит скелетониста-скандалиста
07.03.2026 21:54:59 | Life.ru

В Михайловском округе Запорожской области прервано электроснабжение
07.03.2026 21:54:53 | ТАСС

Турция обратилась к Ирану с предупреждением
07.03.2026 21:53:02 | Lenta.ru

Jony, Клава Кока и Дима Билан своим выступлением закрыли конкурс красоты БРИКС
07.03.2026 21:52:26 | ТАСС

Skoda Auto зарегистрировала новый товарный знак в России
07.03.2026 21:52:25 | Life.ru

Президент Израиля рассказал, направят ли войска в Иран для наземной операции
07.03.2026 21:51:10 | Life.ru

Из-за падения обломков на автомобиль в районе Дубай Марина погиб человек
07.03.2026 21:50:35 | ТАСС

Из-за падения обломков на автомобиль в районе Аль-Барша погиб человек
07.03.2026 21:50:35 | ТАСС

Три ребенка попали в больницу после отравления в российском регионе
07.03.2026 21:50:00 | Lenta.ru

В Москве завершили работы по восстановлению выхода №9 станции метро "Пражская"
07.03.2026 21:49:59 | ТАСС

ЦАХАЛ начал новую масштабную волну ударов по Тегерану
07.03.2026 21:49:12 | ТАСС

Трамп объявил о создании военной коалиции по борьбе с наркокартелями
07.03.2026 21:45:00 | Российская Газета

Турист рассказал о ситуации на борту застрявшего в Дохе лайнера с россиянами
07.03.2026 21:44:00 | Российская Газета

КСИР провел 27-й этап операции против Израиля и США
07.03.2026 21:43:44 | ТАСС

Президент Израиля высказался о наземной операции в Иране
07.03.2026 21:42:32 | Lenta.ru

Иран снова обстрелял центр Израиля
07.03.2026 21:42:31 | ТАСС

ЦАХАЛ атаковал два ключевых объектов по производству ракет в Иране
07.03.2026 21:40:39 | ТАСС

Дмитриев: в мире начинается масштабный инфляционный ценовой шок
07.03.2026 21:39:03 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro