Смотрите видео http://roma.net.ua/internet-marketing/video-veb-analitika-pri-poseshhaemosti-ot-100-000-do-2-mln-v-sutki/
Как анализировать сайт с большой посещаемостью?
С какими проблемами сталкивается веб-аналитик на сайтах с высокой посещаемостью? Семплирование, неправильное отслеживание кода, A/B тестирование. Качественная настройка веб-аналитики для сайта при посещаемости от 100 000 до 2 млн. в сутки.
Роман Рыбальченко на конференции NaZapad
2. Эксперт в интернет-маркетинге (8 лет опыта).
— Основатель проекта Roma.net.ua
— Директор по маркетингу интернет-магазина Intimo
— Тренер по веб-аналитике и e-mail маркетингу
— Со-основатель Клуба Интернет-Маркетологов.
Роман Рыбальченко
Яндекс
Эксперт
Сертифицированный
КОНСУЛЬТАНТ
Google Adwords
с 2011 по 2013
2
3. Клиенты
И ещё 79: e-commerce, рекламные агентства, услуги,
продуктовые компании.
3
12. • Всё проверять: коды, сервера, доступы
• Вешать несколько систем аналитики
(можно потестировать синхронный код,
чтобы понять % недотрека)
• Клиент-сайд оптимизацию никто не
отменял
• И все равно данные не сойдутся :(
(но % недотрека снизится)
12
17. Когда возникает
семплирование?
• Нестандартный отчёт (Custom Reports,
Advanced Segments, Secondary Dimensions)
• Если в отчёте за период:
• 1 000 000+ уникальных параметров
(dimensions), например реффералов
или ключевых слов
• 500 000+ сессий пользователей на
уровне ресурса (property)
17
https://developers.google.com/analytics/resources/concepts/gaConceptsSampling
18. Что ещё можно сделать?
• Уменьшить диапазон по времени
• Увеличить размер выборки
• Создать представления (Views) заранее
• Воспользоваться решениями на основе API
• Упростить запрос (Exact, фильтрация в Excel)
18
20. • Информацию по 2+ размерностям
• Данные сразу из нескольких профилей
• Подключение данных из других
источников или экспорт в CRM
20
21. Ограничения
• Все API
• 50 000 для проекта в день
• 10 запросов в секунду (QPS) на IP
• Core Reporting API
• 10 показателей
• 7 параметров
• 10 000 строк данных как результат запроса
• 10 000 запросов для профиля в день
• 10 параллельных запросов для профиля
• o Google Docs Spreadsheets
• 400 000 ячеек в таблице
21
23. Язык «R» + RGA
• Windows, Mac
• Источник: Google Analytics
• семплирование уменьшается или нету
• бесплатно
23
24. • Интерпретатор языка R:
http://cran.r-project.org/
• Rtools (для работы dev tools):
http://cran.r-project.org/bin/windows/
Rtools/
http://cran.r-project.org/bin/macosx/tools/
• Rstudio - для упрощения работы с R:
http://www.rstudio.com/
24
26. Видео-инструкция по установке R и RGA
Примеры сводных таблиц в рекламе
Сводные таблицы: автоматизация рутины,
расширенный функционал
Визуализация таблиц с данными
Работа с «грязными» данными
Работа с «нечётким» соответствием
roma.net.ua/analyze
26
27. Что ещё делать?
• Яндекс.Метрика 2.0
• Готовить view заранее, выгружать оттуда
всё, и анализировать в Excel
(Microsoft Azure D4: 64-bit и ~7 гб ОЗУ +
PowerQuery + Power Pivot)
• Сохранять на сервере и дальше
анализировать (grep, SQL)
27
30. Что делать?
• Интеграция с Google Webmaster Tools
• Гадание на основе ранжирования,
частоты и лендингов
(например, Moz Analytics)
• Фильтры и полу-хаки notprovidedkit.com
• Google Analytics Content Grouping
30
35. Проблемы с тестами
• Равномерные сегменты без всплесков
• Не все инструменты проходят A/A тесты
• Правильные цели (не конверсия, а
прибыль; не click rate, а net profit)
• Непонятно, как учитывать
персонализацию
35