6. Посмотрим подробнее
• Где ехала машина?
• Машина ли? J
• Как ехали другие?
• Что же здесь на самом деле?
• И всё это в реальном времени
на потоке от сотен тысяч машин
8. Посчитаем ручные затраты
Только в Москве длина дорог
>4000 км
Если закрашивать грубо, участками длиной
1 км
И тратить на изучение ситуации
и изменение статуса участка
10 секунд
На обновление всей карты потребуется
40 000 секунд
т.е. >10 час
Чтобы обновлять карту каждые 4 минут нужно > 150 человек
9. Как сделать лучше?
• Где ехала машина?
• Машина ли?
• Что же здесь на самом деле?
• Ваши идеи…
10. Как проверить, что стало лучше?
Чтобы проверить, что стало лучше,
нужно научиться измерять это «лучше».
Как измерить качество пробок?
Нужно сравниться с действительностью.
14. Статистика. Бросили монетку 3 раза.
I
II
III
Σ
0
0
0
0
0
0
0
Суммарно
выпало
раз
Вероятность
1
1
0
1
0,125
1
0
1
1
3
0,375
0
1
1
2
2
3
0,375
1
0
0
1
3
1
0,125
1
0
1
2
Сумма
8
1
1
1
0
2
2N
Всегда
1
1
1
1
3
Формула
для
суммы
N – число бросков,
в нашем случае 3
15. Статистика. Случайные значения
Пример. Сколько раз выпал «орёл»
при N-кратном броске монеты.
Любая комбинация равновероятна,
всего 2N различных комбинаций,
а значит вероятность любой комбинации
1 раз на 2N случаев.
Получить в сумме 0 можно только одним
способом.
Получить в сумме 1 можно N способами.
Получить в сумме k можно CNk способами
17. Статистика. Вероятность отклонения
Чтобы оценить, насколько вероятно
такое отклонение, нужно посчитать
сумму всех вероятностей в «хвосте».
Например, здесь нужно посчитать сумму
вероятностей выпадения 0, 1, 2, 3 раза.
18. Уверены, что лучше?
Новый
алгоритм
1
Число
раз
%
от
всех
Лучше
Хуже
54
13
81%
19%
Новый
алгоритм
2
Число
раз
%
от
всех
Лучше
Хуже
5
1
83%
17%
19. Статистика
• Случайные значения
• Среднее и наблюдаемое среднее
• Правильная (репрезентативная) выборка
• Причинно-следственные связи
20. Итого
• Как работают Яндекс.Пробки
GPS данные от водителей + алгоритмы
• Как сделать лучше
Измеряем качество,
сравнивая с действительностью
• Статистика
Чем меньше измерений,
тем больше случайная ошибка