РИТ++ 2017, секция ML + IoT + ИБ
Зал Белу-Оризонти, 5 июня, 18:00
Тезисы:
http://ritfest.ru/2017/abstracts/2800.html
В число задач страховых компаний (авто, страхование имущества, медицинское страхование) входит проверка оказанных (или запрашиваемых) убытков на соответствие условиям страхования. Зачастую данная задача выполняется в ручном режиме с привлечение экспертов. Данная работа неизбежно влечет издержки, а с ростом количества данных становится и вовсе невозможным проверять все убытки.
Среди российских компаний давно предпринимались попытки алгоритмизировать проверку убытков, но эффект от этого, как правило, не оправдывал ожиданий. Особенно трудно анализировать убытки в области добровольного медицинского страхования из-за сложности и нестандартизованности данной предметной области.
Страховая компания Allianz первой в России решила применить для этой цели технологии машинного обучения. На сегодняшний день создана пилотная версия системы автоматического поиска аномалий, обученная на результатах проверки экспертами за несколько последних лет. Результаты пилотных тестов показали перспективность дальнейших разработок.
2. План доклада
§ Что такое «медицинский фрод» и зачем его искать
§ Развития автоматизации проверки медицинских счетов
§ Machine Learning для проверки статистики
§ Заключение, вопросы
3. Примеры «медицинского фрода»
и зачем его искать?
§ Несоответствие количества / перечня услуг стандартам медпомощи и сложившимся
практикам
§ Необоснованное перенаправление по цепочке разных врачей, с избыточными, зачастую
дублирующимися назначениями
§ Замена базовых услуг на более дорогие аналоги,
§ Включение «услуг-наполнителей», различных дополнительных услуг из прейскуранта
§ Приписки
§ Оказание услуг по нестраховым событиям под видом страховых
По экспертных оценкам, доля подобных выплат в ДМС составляет 10-15%
Все описанные выше ситуации не входят в программы медицинского страхования,
а потому не должны оплачиваться СК
4. Автоматизация медицинских проверок позволяет
существенно изменить подход к управлению убытками
§Каждый год мы получаем 45 тыс. счетов от 3,5
тыс. клиник состоящие из 6 млн услуг
§Проверка счетов происходит вручную, что
очень ресурсоемко
§Выделение подозрительных кейсов / услуг
является один из наиболее трудоемких шагов
§Мониторинг показателей эффективности
(Средняя выплата на обратившегося, кол-во
услуг за визит, и др.) позволяет сузить список
счетов для проверки на 60%
§Медицинский аудит прямо и косвенно
уменьшает выплаты на 3-6%, в то время как
потенциал оценивается в 10-15%
Автоматические
выделение
подозрительных кейсов
увеличивает
эффективность и
уменьшает убытки
5. Структурный
анализ
Выбросы
Традиционные
Алгоритмы
Машинное
обучение
•Цель – поиск
подозрительных единиц
(unit) в клинике
•Ограничения – только
Московские клиники
•Цель – поиск
подозрительных услуг
•Покрытие – все
клиники
•На современном этапе
основные завышения
находятся как раз в
«средних» случаях
•Цель – поиск
подозрительных кейсов
•Покрытие – все
клиники
•Ограничения –
небольшую долю
экспертных критериев
можно
алгоритмизировать
Уровень
автоматизации
2008-2015 2016 2017
Время
•Цель– поиск
подозрительных кейсов/
услуг
•Покрытие – все
клиники
•Ограничения –
появляются новые
вызовы (следующий
слайд)
Машинное обучение оказалось наиболее эффективным
способ поиска подозрительных кейсов
6. НО..
..новые трудностиПреимущества ML..
§ Новые компетенции
Это не то, что можно настроить за один
месяц
§ Качество данных
”Garbage in, garbage out “ – ключевой
принцип
§ Внедрение ML в бизнес
Полное изменение текущих процессов
управления убытками
§ Проверяется каждый счет
Даже небольшие, ранее не
привлекавшие внимание
§ Учет множества факторов
Даже тех, которые ранее не считались
важными
§ Быстрота
Дни превращаются в секунды
§ Постоянное
совершенствование
Чем больше накапливается данных,
тем точнее становится алгоритм
Являясь самым эффективным подходом ML бросает
новые вызовы
7. Пациент Услуга Диагноз Клиника
Внешние
факторы
§ Пол
§ Возраст
§ Прочие
обращения
§ Тип полиса
§ Период от начала
/ до конца действия
полиса
§ Текстовое
описание
§ Цена
§ Кратность
§ Последовательность
§ Сотни диагнозов
(МКБ-10)
§ Шаблоны
характерные для
данной клиники
§ Склонность
клиники к
завышениям
§Расстояние до
работы/места
жительства
§ Погода
§ Дата
§ Город
Примеры признаков:
Machine Learning: данные
Ок.неот.м.п.бр.НМП пац.,нах.в сос.ал.и нар.оп.(за перв.30 мин.
Пример описания услуги:
8. Кейсы с
завышениями
Кейсы без
завышений
KFold с учетом даты, пациента,
баланса классов
«Прием
врча
амб.»
Опечатки, сокращения, лемматизация
2. Препроцессинг 3. Эмбеддинги и признаки
4. Агрегация в кейсы
1. Чистка данных
5. Правильная валидация
t
Стоимость
Пример: удаление
некорректной разметки
Machine Learning: процесс анализа
Исходные
описания
услуг
Классификаци
я
Эмбеддинги
P1
P2
P3
..
Pk
Fasttext, тематическое моделирование,
word2vec, deep learning
«Прием
врач
амбулаторный»
A1
A2
A3
..
Am
6. Проверка экспертом
…
û
ü
û
ü
ü
ü
ü
û
û
ü
ML Эксперт
! False positive
! False negative
Ok
Ok
Ok
9. Выводы
§ ML максимально подходит для предварительного отбора
подозрительных случаев
§ Он не заменяет квалифицированных врачей-экспертов, но
позволяет в разы повысить эффективность их работы.
§ Позволяет перейти от ретроспективного контроля убытков к
задержке оплаты подозрительных случаев для дальнейшей
экспертизы
§ Внедрение машинного обучения требует перестроение бизнес-
процессов
§ Множество трудностей при подготовке и анализе данных