AB-тестирование: на что следует обратить внимание / Артур Маликов (Яндекс)

АБТ: на что следует
обратить внимание?
Маликов Артур, руководитель группы, Яндекс
v7

•Как оценить влияние запуска?
•Как избежать типичных ошибок?

Kindle Is Oprah’s «New Favorite Thing in the World»

Проведение AB-экспериментов в вебе
•Контроль и эксперимент идут одновременно
•Пользователь не знает, что находится в
эксперименте
•Нет непосредственного контакта

Сравнить две версии между собой

Реализация
•Разбиение на группы
• Составление и выкладка конфигурации
экспериментов
• Логирование факта попадания в эксперимент
•Обработка логов, расчет метрик и
значимости изменений
• Анализ результатов и принятие решения.

Разбиение на группы
•Случайное разбиение
•Варианты разбиения:
• По пользователям (куки)
• По запросам
•Минимальный размер выборки (слот)
• Репрезентативность
•Как часто перемешивать группы?
• Каждые N часов
• По окончании эксперимента

Метрики
•Типы метрик
•Примеры метрик
• Число запросов
• Время до первого клика
• Доля запросов без кликов
• Число сессий на пользователя
•Границы применимости

Матчасть
•A vs B (“контроль” и “эксперимент”)
•M(X) – случайная величина
•diff = M(A)-M(B)
•diff значима?
•diff = эффект воздействия изменения +
случайность
•Для измерения эффекта используем
статистические тесты

Анализ результатов

Метрики
•Валидация метрик
•Регламент приемки

АБТ: Важные моменты

До запуска эксперимента
•Длительность задается
заранее
•Выписать ожидания и
критерий приемки

Контрольная группа
•Каждому эксперименту свой контроль?
• Для серии экспериментов – нет
• Для разных экспериментов – да
•Контроль и эксперимент равных
объемов?

Некоторые особенности интерфейсных
экспериментов
•Пользователь должен привыкнуть
•Расчет результатов по определенным
пользователям
•Изменение поведенческих привычек

Поисковая выдача

Сколько экспериментов может видеть
пользователь?
Control1 EXP1
EXP2
Control2
salt2
Попадает в EXP2 и Control 1
Попадает в EXP2 и EXP 1
salt1

Полезности
•Мониторинги и возможность быстро
отключить эксперименты
•Считать метрики только на том потоке,
где были изменения
•Обратные эксперименты
•Длительность эксперимента (7N)

АБТ: Инструменты и анализ
результатов

Анализ результатов
•Сопоставлять план и факт
•Неожиданное улучшение – всё равно надо
разобраться
•Смотрим на метрики для контроля
•Помним о границах применимости метрик

Инструменты
•Хранить историю проведения экспериментов и логи(!)
•Анализ поведения отдельного пользователя
•Возможность считать метрики по срезам и быстро
переключаться между ними
• Яркий пример среза – браузеры

Статистика
Яндекс.Поиск @ 2014:
• ~1000 экспериментов за год
• ~100 экспериментов одновременно
• 21% выкатывается в продакшн
Бинг @ 2013:
• 1 пользователь видит до 15 экспериментов одновременно
Информация из открытых источников:
http://www.exp-platform.com

Email: phtc@ya.ru
Вопросы?

АБТ: Бонус про матчасть

Матчасть
•Формулировка основной гипотезы H0
(метрики равны) конкурирующей
гипотезы H1 (метрик не равны)
•Задание уровеня значимости α (ошибка
первого рода)
•Расчет p-value
•Принятие решения
• P-value > α – тогда принимаем основную гипотезу
• P-value <= α – конкурирующую гипотезу

AB-тестирование: на что следует обратить внимание / Артур Маликов (Яндекс)

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (15)

Destacado

Destacado (16)

Similar a AB-тестирование: на что следует обратить внимание / Артур Маликов (Яндекс)

Similar a AB-тестирование: на что следует обратить внимание / Артур Маликов (Яндекс) (20)

Más de Ontico

Más de Ontico (20)

AB-тестирование: на что следует обратить внимание / Артур Маликов (Яндекс)

Notas del editor