SlideShare a Scribd company logo
Малоизвестные
грабли А/Б-тестинга
Роман Поборчий
v1.1
График целевой метрики
График целевой метрики
Миллион раз по сто попыток
0 1 2 3 4 5 6 7 8 9
366K 369K
185K
61K
15K 2.8K 456 54 4 1
Всё бесполезно?..
A/B тестинг в одном слайде
Разбить
юзеров
Показать
каждому
своё
Обсчитать
результат
Разбить юзеров
Система бакетов
Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Роман Поборчий (self-employed)
??
Система бакетов
??
?? ?? K
?? ?? ??
Легенда: exp vs. prod
Хуже
Не отличается
Лучше
Хуже Лучше
Система бакетов
??
K
?? ?? ??
??
Система бакетов
?? ?? K
Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Роман Поборчий (self-employed)
Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Роман Поборчий (self-employed)
Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Роман Поборчий (self-employed)
??
Вред от обиженного бакета
??
?? ?? K
?? ??
??
Вред от обиженного бакета
??
?? ?? K
?? ??
??
Вред от обиженного бакета
??
?? ?? ??
K ?? ??
Вред от обиженного бакета
K
Память поколений
Источник: http://www.exp-platform.com/documents/puzzlingoutcomesincontrolledexperiments.pdf
Помешивайте кашу
Помешивайте кашу
Помешивайте кашу
Помешивайте кашу
Помешивайте кашу
Все животные равны…
Показать каждому своё
Юзеры
Два ДЦ
Амазон:
100мс стоят 1% продаж
Обсчитать результат
Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Роман Поборчий (self-employed)
Распределение цвета глаз
Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Роман Поборчий (self-employed)
Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Роман Поборчий (self-employed)
Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Роман Поборчий (self-employed)
Зависимые действия в жизни
автомат калашникова купить
автомат калашникова настоящий купить
автомат калашникова не макет купить
Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Роман Поборчий (self-employed)
Зависимые действия в жизни
автомат калашникова купить
автомат калашникова настоящий купить
автомат калашникова не макет купить
нанять киллера
Teh drama
K
50 оттенков серого
K
Оффлайновый А/А тест
Оффлайновый А/А тест
Оффлайновый А/А тест
Так делать не надо
Бакет # 1 2 3 4 5 6 7 8 9 10
1 X
2 X
3 X
4 X
5 X
6 X
7 X
8 X
9 X
10 X
Так делать не надо
Бакет # 1 2 3 4 5 6 7 8 9 10
1 X
2 X
3 X
4 X
5 X
6 X
7 X
8 X
9 X
10 X
Так делать не надо
Бакет # 1 2 3 4 5 6 7 8 9 10
1 X
2 X
3 X
4 X
5 X
6 X
7 X
8 X
9 X
10 X
В реальности будет иначе
Бакет # 1 2 3 4 5 6 7 8 9 10
1 X
2 X
3 X
4 X
5 X
6 X
7 X
8 X
9 X
10 X
В реальности будет иначе
Бакет # 1 2 3 4 5 6 7 8 9 10
1 X
2 X
3 X
4 X
5 X
6 X
7 X
8 X
9 X
10 X
Silver bullet…
…it is not
Проводите A/A тесты, следите за
Целевой метрикой
Количеством пользователей
Временем ответа (хотя бы на сервере)
Долей несовпадающих метрик
Количеством успешных экспериментов
Ну вы держи́тесь там
Роман Поборчий
prs@poborchy.ru
http://poborchy.ru/
https://www.facebook.com/roman.poborchy

More Related Content

PPTX
A1QA Summer 2014 - Alien bugs
PPTX
Тестирование веба без тестировщиков — успех или провал – Татьяна Рыженкова и ...
PDF
Heavy metal testing Part 3
PDF
GithubFlow. Тестировщики против тестирования.
PPTX
Построение моделей на примере продаж рекламы / Алексей Праслов
PDF
Artsofte telecom competences (ru)
PPTX
Zone to Win – организация в борьбе за лучшие кадры в эпоху разрушительных инн...
PDF
UX-дизайнер, ты ли это. Навыки проектировщика в стилизации интерфейсов / Илья...
A1QA Summer 2014 - Alien bugs
Тестирование веба без тестировщиков — успех или провал – Татьяна Рыженкова и ...
Heavy metal testing Part 3
GithubFlow. Тестировщики против тестирования.
Построение моделей на примере продаж рекламы / Алексей Праслов
Artsofte telecom competences (ru)
Zone to Win – организация в борьбе за лучшие кадры в эпоху разрушительных инн...
UX-дизайнер, ты ли это. Навыки проектировщика в стилизации интерфейсов / Илья...

Similar to Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Роман Поборчий (self-employed) (7)

PPTX
Тестирование в изоляции: Играем в драконий покер
PPTX
Работа с требованиями в Интернет-стартапе / Александр Байкин (UML2.ru)
PPTX
Работа с требованиями в Интернет стартапе
PPT
Вавилонское тестировтворение - Алекскей Лупан
PDF
Функциональное тестирование высоконагруженных проектов / Илья Пастушков (2ГИС)
PPTX
Экономически эффективный процесс тестирования (Codefest 2015)
PPTX
Game design analytics: case studies
Тестирование в изоляции: Играем в драконий покер
Работа с требованиями в Интернет-стартапе / Александр Байкин (UML2.ru)
Работа с требованиями в Интернет стартапе
Вавилонское тестировтворение - Алекскей Лупан
Функциональное тестирование высоконагруженных проектов / Илья Пастушков (2ГИС)
Экономически эффективный процесс тестирования (Codefest 2015)
Game design analytics: case studies
Ad

More from Ontico (20)

PDF
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
PDF
Масштабируя DNS / Артем Гавриченков (Qrator Labs)
PPTX
Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)
PDF
Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...
PDF
Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...
PDF
PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)
PDF
Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...
PDF
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
PPTX
ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)
PPTX
MySQL Replication — Advanced Features / Петр Зайцев (Percona)
PDF
Внутренний open-source. Как разрабатывать мобильное приложение большим количе...
PPTX
Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...
PPTX
Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...
PDF
Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)
PPT
И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)
PPTX
Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)
PPTX
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
PPTX
100500 способов кэширования в Oracle Database или как достичь максимальной ск...
PPTX
Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...
PDF
Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
Масштабируя DNS / Артем Гавриченков (Qrator Labs)
Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)
Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...
Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...
PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)
Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)
MySQL Replication — Advanced Features / Петр Зайцев (Percona)
Внутренний open-source. Как разрабатывать мобильное приложение большим количе...
Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...
Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...
Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)
И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)
Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
100500 способов кэширования в Oracle Database или как достичь максимальной ск...
Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...
Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...
Ad

Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Роман Поборчий (self-employed)