SlideShare una empresa de Scribd logo
1 de 54
Descargar para leer sin conexión
Данила Байгушев,
Александр Сноркин
Мир глазами
нейросетей
Распространение ML
Данные: Google trends, 2019
Необходимость интерпретации
ML для credit scoring ML в медицине
Сложность интерпретации
vs
Ягуар?
Ягуар!
Style transfer
Данные: A Neural Algorithm of Artistic Style, 2015
Выученная текстура
Слон БутылкаЧасы
Данные: ImageNet-trained CNNs are biased towards texture; increasing shape bias improves accuracy and robustness, 2018
Выученная текстура
Данные: ImageNet-trained CNNs are biased towards texture; increasing shape bias improves accuracy and robustness, 2018
Внутреннее устройство нейросети
Данные: Carter, et al., "Activation Atlas", Distill, 2019
Атласы активации
Данные: Carter, et al., "Activation Atlas", Distill, 2019
Атласы активации
Данные: Carter, et al., "Activation Atlas", Distill, 2019
Данные: Carter, et al., "Activation Atlas", Distill, 2019
Атласы активации
Данные: Carter, et al., "Activation Atlas", Distill, 2019
Большая
Белая Акула
Серый кит
Атласы активации
Данные: Carter, et al., "Activation Atlas", Distill, 2019
Серый кит
Атласы активации
Данные: Carter, et al., "Activation Atlas", Distill, 2019
Серый кит Большая белая акула
Атласы активации
Mail.ru Поиск
Данные: Deep Cross-Modal Projection Learning for Image-Text Matching, 2018
Нейросети в поиске картинок
Нейросети в поиске картинок
Данные: Mail.ru poisk, 2019
Нейросети в поиске картинок
Данные: Mail.ru poisk, 2019
собачка 0.171
собака 0.170
овчарка 0.152
щенок 0.140
бинокль 0.118
питомник 0.116
копье 0.113
лошадка 0.111
щека 0.105
порода 0.103
самолет 0.095
авиация 0.093
авиакомпания 0.087
вертолет 0.078
истребитель 0.074
аэродром 0.071
аэропорт 0.069
ракета 0.069
воздух 0.062
обстрел 0.062
Близкие слова
Данные: Mail.ru poisk, 2019
цветок 1.00
растение 0.70
уход 0.66
роза 0.61
расти 0.59
бабочка 0.57
листок 0.56
прекрасно 0.56
кошка 1.00
кот 0.74
котенок 0.71
котелок 0.62
котел 0.57
живот 0.56
британский 0.55
порода 0.54
собака 1.00
собачий 0.80
щенок 0.50
лошадь 0.41
рот 0.33
порода 0.33
волк 0.33
щека 0.33
Атласы активации
Данные: Carter, et al., "Activation Atlas", Distill, 2019
Атласы активации
Данные: Mail.ru poisk, 2019
«Наивный подход»
Атласы активации
Возможные проблемы:
1. Недообучение
2. Распределение данных
3. «Отбеливание»
Данные: Mail.ru poisk, 2019
Атласы активации
Данные: Mail.ru poisk, 2019
Недообучение
20 эпох
Атласы активации
Данные: Mail.ru poisk, 2019
Недообучение
100 эпох
Атласы активации: недообучение
100
20
Недообучение!
Данные: Mail.ru poisk, 2019
Атласы активации
Данные: Mail.ru poisk, 2019
Распределение данных
Атласы активации
Данные: Mail.ru poisk, 2019
Распределение данных
Атласы активации
Данные: Mail.ru poisk, 2019
Распределение данных
ndcg@1 +1.2%
Атласы активации
Данные: Mail.ru poisk, 2019
«Отбеливание»
Атласы активации
Данные: Mail.ru poisk, 2019
«Отбеливание»
Атласы активации
Данные: Mail.ru poisk, 2019
Распределение данных
+
«Отбеливание»
Нейросети в поиске
Данные: Mail.ru poisk, 2019
Особенности задачи:
● Большие ограничения по скорости,
поэтому не так много операций, и вектора
для тайтлов предпросчитываются
● Много опечаток, поэтому слова
представляются в виде триграмм
● Запросы сформулированы на не совсем
естественном языке, поэтому мы можем, в
первом приближении, не учитывать
порядок слов
Близкие запросы и тайтлы
Данные: Mail.ru poisk, 2019
Запрос: вычислите синус 7п 3
0.97 ВЫЧИСЛИТЬ И НАЙТИ СИНУС ОНЛАЙН
0.89 ВЫЧИСЛИТЕ SIN 7 П 3 2 СОS 5 П 4 3 TG 13 П 6
0.88 ОТВЕТЫ MAIL RU ВЫЧИСЛИТЬ SIN 7П 3
0.88 ТАБЛИЦА СИНУСОВ
0.87 ТАБЛИЦА СИНУСОВ 2MB RU
0.87 ВЫЧИСЛИТЕ SIN 7П 6 5CTG 3П 2 TG 3П 4 TG 2П 3
0.86 ВЫЧИСЛИТЬ SIN 7П 3 СОS 5П 4 TG 13А 6 CTG 13 5П ШКОЛЬНЫЕ ЗНАНИЯ COM
0.85 ВЫЧИСЛИТЬ SIN 7П 3 СОS 5П 4 TG 13А 6 CTG 13 5П ЧЕМ ЗАНЯТЬСЯ
0.85 СИНУС УГЛА SIN A ФОРМУЛЫ И РАСЧЕТЫ ОНЛАЙН FXYZ RU
0.85 ВЫЧИСЛИТЕ SIN 7П 3 2 СОS 5П 4 3 TG 13П 6 ШКОЛЬНИКУ COM
Пример проблемы
Данные: Mail.ru poisk, 2019
Запрос: 1050ти купить
0.27
КУПИТЬ ВИДЕОКАРТЫ В
ИНТЕРНЕТ МАГАЗИНЕ 05 RU
Запрос: 400 в корне
0.08
КАЛЬКУЛЯТОР СТЕПЕНЕЙ
ВОЗВЕСТИ В СТЕПЕНЬ
ОНЛАЙН
Пример проблемы
Данные: Mail.ru poisk, 2019
Запрос: 1050ти купить
0.79
КУПИТЬ ВИДЕОКАРТЫ В
ИНТЕРНЕТ МАГАЗИНЕ 05 RU
Запрос: 400 в корне
0.70
КАЛЬКУЛЯТОР СТЕПЕНЕЙ
ВОЗВЕСТИ В СТЕПЕНЬ
ОНЛАЙН
Запрос: 1050ти купить
0.27
КУПИТЬ ВИДЕОКАРТЫ В
ИНТЕРНЕТ МАГАЗИНЕ 05 RU
Запрос: 400 в корне
0.08
КАЛЬКУЛЯТОР СТЕПЕНЕЙ
ВОЗВЕСТИ В СТЕПЕНЬ
ОНЛАЙН
Архитектура
Данные: Mail.ru poisk, 2019
Триграммы
Данные: Mail.ru poisk, 2019
Триграммы
Данные: Mail.ru poisk, 2019
БИО 1.00
БІО 0.60
BIO 0.47
ОЯД 0.41
КМЦ 0.40
ЭКО 0.39
СПБ 1.00
SPB 0.68
ЮАО 0.63
CG# 0.61
ОАО 0.60
СКК 0.59
ВВЦ 0.59
...
МСК 0.43
Триграммы
Данные: Mail.ru poisk, 2019
Триграммы
Данные: Mail.ru poisk, 2019
Триграммы
Данные: Mail.ru poisk, 2019
Слова
Данные: Mail.ru poisk, 2019
Слова
Данные: Mail.ru poisk, 2019
купить 1.00
цена 0.76
продажа 0.73
магазин 0.71
стоить 0.69
стоимость 0.68
объявление 0.66
продать 0.66
еда 1.00
пища 0.78
блюдо 0.71
питание 0.69
продукт 0.68
кофе 0.58
Сравнение со второй моделью
Данные: Mail.ru poisk, 2019
1.00 дом
0.75 домой
0.59 домашний
0.58 здание
0.57 домик
0.54 дача
0.51 семья
0.48 где
дом 1.00
домик 0.69
здание 0.61
квартира 0.61
усадьба 0.59
гостиница 0.59
гараж 0.53
сарай 0.52
природа 1.00
пейзаж 0.72
озеро 0.66
природный 0.65
лесной 0.62
лес 0.61
расти 0.58
лето 0.57
1.00 природа
0.84 природный
0.41 пляж
0.38 борода
0.38 озеро
0.38 бывать
0.37 лесной
0.36 животный
Слова
Данные: Mail.ru poisk, 2019
Важность слов в запросе
Данные: Mail.ru poisk, 2019
Важность слов в запросе
Данные: Mail.ru poisk, 2019
-0,67 -0,06 0,67 0,17 0,69 -0,54
Важность слов в запросе
Данные: Mail.ru poisk, 2019
Проблемы текущей модели
Данные: Mail.ru poisk, 2019
Запрос: когда выход фильма мстители 5война бесконечности
Тайтл:
МСТИТЕЛИ ФИНАЛ 2019 ФИЛЬМ СМОТРЕТЬ ОНЛАЙН БЕСПЛАТНО
НА РУССКОМ ЯЗЫКЕ
Оценка: 0.7791402
Заключение
● Анализ ошибок
● Новые идеи для улучшений
● Изучение данных с помощью модели
Мир глазами нейросетей, Данила Байгушев, Александр Сноркин ()

Más contenido relacionado

Más de Mail.ru Group

Почему вам стоит использовать свой велосипед и почему не стоит Александр Бел...
Почему вам стоит использовать свой велосипед и почему не стоит  Александр Бел...Почему вам стоит использовать свой велосипед и почему не стоит  Александр Бел...
Почему вам стоит использовать свой велосипед и почему не стоит Александр Бел...Mail.ru Group
 
CV в пайплайне распознавания ценников товаров: трюки и хитрости Николай Масл...
CV в пайплайне распознавания ценников товаров: трюки и хитрости  Николай Масл...CV в пайплайне распознавания ценников товаров: трюки и хитрости  Николай Масл...
CV в пайплайне распознавания ценников товаров: трюки и хитрости Николай Масл...Mail.ru Group
 
RAPIDS: ускоряем Pandas и scikit-learn на GPU Павел Клеменков, NVidia
RAPIDS: ускоряем Pandas и scikit-learn на GPU  Павел Клеменков, NVidiaRAPIDS: ускоряем Pandas и scikit-learn на GPU  Павел Клеменков, NVidia
RAPIDS: ускоряем Pandas и scikit-learn на GPU Павел Клеменков, NVidiaMail.ru Group
 
WebAuthn в реальной жизни, Анатолий Остапенко
WebAuthn в реальной жизни, Анатолий ОстапенкоWebAuthn в реальной жизни, Анатолий Остапенко
WebAuthn в реальной жизни, Анатолий ОстапенкоMail.ru Group
 
AMP для электронной почты, Сергей Пешков
AMP для электронной почты, Сергей ПешковAMP для электронной почты, Сергей Пешков
AMP для электронной почты, Сергей ПешковMail.ru Group
 
Как мы захотели TWA и сделали его без мобильных разработчиков, Данила Стрелков
Как мы захотели TWA и сделали его без мобильных разработчиков, Данила СтрелковКак мы захотели TWA и сделали его без мобильных разработчиков, Данила Стрелков
Как мы захотели TWA и сделали его без мобильных разработчиков, Данила СтрелковMail.ru Group
 
Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...
Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...
Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...Mail.ru Group
 
Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.Такси
Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.ТаксиМетапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.Такси
Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.ТаксиMail.ru Group
 
Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru Group
Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru GroupКак не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru Group
Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru GroupMail.ru Group
 
Этика искусственного интеллекта, Александр Кармаев (AI Journey)
Этика искусственного интеллекта, Александр Кармаев (AI Journey)Этика искусственного интеллекта, Александр Кармаев (AI Journey)
Этика искусственного интеллекта, Александр Кармаев (AI Journey)Mail.ru Group
 
Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...
Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...
Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...Mail.ru Group
 
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...Конвергенция технологий как тренд развития искусственного интеллекта, Владими...
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...Mail.ru Group
 
Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey)
Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey)Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey)
Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey)Mail.ru Group
 
Learning from Swift sources, Иван Сметанин
Learning from Swift sources, Иван СметанинLearning from Swift sources, Иван Сметанин
Learning from Swift sources, Иван СметанинMail.ru Group
 
Будни с (R)Lottie, Антон Сергеев
Будни с (R)Lottie, Антон СергеевБудни с (R)Lottie, Антон Сергеев
Будни с (R)Lottie, Антон СергеевMail.ru Group
 
TestOps или QA 2.0, Андрей Ю
TestOps или QA 2.0, Андрей ЮTestOps или QA 2.0, Андрей Ю
TestOps или QA 2.0, Андрей ЮMail.ru Group
 
Полный цикл тестирования React-приложений, Алексей Андросов и Наталья Стусь
Полный цикл тестирования React-приложений, Алексей Андросов и Наталья СтусьПолный цикл тестирования React-приложений, Алексей Андросов и Наталья Стусь
Полный цикл тестирования React-приложений, Алексей Андросов и Наталья СтусьMail.ru Group
 
Организация работы с API на Vue.js, Виталий Копачёв
Организация работы с API на Vue.js, Виталий КопачёвОрганизация работы с API на Vue.js, Виталий Копачёв
Организация работы с API на Vue.js, Виталий КопачёвMail.ru Group
 
Специфика рендеринга vue.js-приложений на сервере, Алексей Клюев
Специфика рендеринга vue.js-приложений на сервере, Алексей КлюевСпецифика рендеринга vue.js-приложений на сервере, Алексей Клюев
Специфика рендеринга vue.js-приложений на сервере, Алексей КлюевMail.ru Group
 
«Продакшн в Kotlin DSL» Сергей Рыбалкин
«Продакшн в Kotlin DSL» Сергей Рыбалкин«Продакшн в Kotlin DSL» Сергей Рыбалкин
«Продакшн в Kotlin DSL» Сергей РыбалкинMail.ru Group
 

Más de Mail.ru Group (20)

Почему вам стоит использовать свой велосипед и почему не стоит Александр Бел...
Почему вам стоит использовать свой велосипед и почему не стоит  Александр Бел...Почему вам стоит использовать свой велосипед и почему не стоит  Александр Бел...
Почему вам стоит использовать свой велосипед и почему не стоит Александр Бел...
 
CV в пайплайне распознавания ценников товаров: трюки и хитрости Николай Масл...
CV в пайплайне распознавания ценников товаров: трюки и хитрости  Николай Масл...CV в пайплайне распознавания ценников товаров: трюки и хитрости  Николай Масл...
CV в пайплайне распознавания ценников товаров: трюки и хитрости Николай Масл...
 
RAPIDS: ускоряем Pandas и scikit-learn на GPU Павел Клеменков, NVidia
RAPIDS: ускоряем Pandas и scikit-learn на GPU  Павел Клеменков, NVidiaRAPIDS: ускоряем Pandas и scikit-learn на GPU  Павел Клеменков, NVidia
RAPIDS: ускоряем Pandas и scikit-learn на GPU Павел Клеменков, NVidia
 
WebAuthn в реальной жизни, Анатолий Остапенко
WebAuthn в реальной жизни, Анатолий ОстапенкоWebAuthn в реальной жизни, Анатолий Остапенко
WebAuthn в реальной жизни, Анатолий Остапенко
 
AMP для электронной почты, Сергей Пешков
AMP для электронной почты, Сергей ПешковAMP для электронной почты, Сергей Пешков
AMP для электронной почты, Сергей Пешков
 
Как мы захотели TWA и сделали его без мобильных разработчиков, Данила Стрелков
Как мы захотели TWA и сделали его без мобильных разработчиков, Данила СтрелковКак мы захотели TWA и сделали его без мобильных разработчиков, Данила Стрелков
Как мы захотели TWA и сделали его без мобильных разработчиков, Данила Стрелков
 
Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...
Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...
Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...
 
Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.Такси
Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.ТаксиМетапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.Такси
Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.Такси
 
Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru Group
Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru GroupКак не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru Group
Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru Group
 
Этика искусственного интеллекта, Александр Кармаев (AI Journey)
Этика искусственного интеллекта, Александр Кармаев (AI Journey)Этика искусственного интеллекта, Александр Кармаев (AI Journey)
Этика искусственного интеллекта, Александр Кармаев (AI Journey)
 
Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...
Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...
Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...
 
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...Конвергенция технологий как тренд развития искусственного интеллекта, Владими...
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...
 
Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey)
Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey)Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey)
Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey)
 
Learning from Swift sources, Иван Сметанин
Learning from Swift sources, Иван СметанинLearning from Swift sources, Иван Сметанин
Learning from Swift sources, Иван Сметанин
 
Будни с (R)Lottie, Антон Сергеев
Будни с (R)Lottie, Антон СергеевБудни с (R)Lottie, Антон Сергеев
Будни с (R)Lottie, Антон Сергеев
 
TestOps или QA 2.0, Андрей Ю
TestOps или QA 2.0, Андрей ЮTestOps или QA 2.0, Андрей Ю
TestOps или QA 2.0, Андрей Ю
 
Полный цикл тестирования React-приложений, Алексей Андросов и Наталья Стусь
Полный цикл тестирования React-приложений, Алексей Андросов и Наталья СтусьПолный цикл тестирования React-приложений, Алексей Андросов и Наталья Стусь
Полный цикл тестирования React-приложений, Алексей Андросов и Наталья Стусь
 
Организация работы с API на Vue.js, Виталий Копачёв
Организация работы с API на Vue.js, Виталий КопачёвОрганизация работы с API на Vue.js, Виталий Копачёв
Организация работы с API на Vue.js, Виталий Копачёв
 
Специфика рендеринга vue.js-приложений на сервере, Алексей Клюев
Специфика рендеринга vue.js-приложений на сервере, Алексей КлюевСпецифика рендеринга vue.js-приложений на сервере, Алексей Клюев
Специфика рендеринга vue.js-приложений на сервере, Алексей Клюев
 
«Продакшн в Kotlin DSL» Сергей Рыбалкин
«Продакшн в Kotlin DSL» Сергей Рыбалкин«Продакшн в Kotlin DSL» Сергей Рыбалкин
«Продакшн в Kotlin DSL» Сергей Рыбалкин
 

Мир глазами нейросетей, Данила Байгушев, Александр Сноркин ()