Ось кілька деталей про цей проект та машинне навчання за ним. Клієнт – це велика і добре відома система охорони здоров’я на Середньому Заході, яка в цій статті називається Alignment Health.
Це друга в серії віньєток, якими я поділюсь про нашу роботу з машинного навчання в Health Catalyst. Звичайно, я євангелізую нашу роботу, але принаймні на 50% моїм мотивом є просто підвищити рівень обізнаності про те, що можливо завдяки машинному навчанню та AI в охороні здоров’я, та створити більш обізнаного споживача. Я хочу, щоб усі, особливо керівники, були здатні відокремити справжнє від галасу. І зараз на ринку існує величезна кількість останніх, коли мова йде про машинне навчання та AI. Наш девіз Health Catalyst – #novaporware.
Alignment Health намагається щомісяця збирати непогашені залишки для 200 000 пацієнтів, але робити це з поінформованим і доброзичливим підходом – тобто уникати служб збору та не турбувати пацієнтів, які будуть платити, але, можливо, знадобиться більше часу або допомоги. Команда Health Catalyst співпрацювала з командою з управління фінансами Alignment Health, щоб розробити модель ризику, яка може допомогти краще розподілити персонал та ресурси у процесі оплати праці пацієнтів. Розроблена нами прогнозна модель допомагає визначити ймовірність виплати пацієнком непогашеного залишку. Результат? Alignment Health може зосередити свої зусилля на збиранні на пацієнтах, які найімовірніше платять. Ресурси не розподіляються на колекції для пацієнтів, які або сплатять залишки коштів без втручання, або не оплатять рахунки незалежно від втручання.
Визначення моделі
Питання: Яка ймовірність того, що цей пацієнт заплатить рахунок цього місяця?
Використані дані про стан здоров’я
= Загальна кількість навчальних справ: 500 000
= Загальна кількість вхідних змінних: 68
= Остаточна кількість використаних вхідних змінних: 48
= Кількість щоденних прогнозів: 200 000
Змінна важливість
Індекс домішок Джіні у випадковому лісі був використаний для визначення, які змінні включити в остаточну модель. Остаточний вибір змінної забезпечив баланс між точністю моделі та кількістю часу, необхідного для запуску моделі. Остаточні змінні детально описані нижче.
Оцінюються змінні та особливості
Функції, виділені жирним шрифтом, НЕ були включені в модель; вони не підвищили точність моделі. Я вважаю ці опущені функції цікавими, якщо не більше, ніж включеними. Опущені риси, як правило, розвінчують те, що багато людей вважали б домінуючими змінними; машинне навчання розвіює стереотипи.
= Місяць старіння
= Рік старіння
= Усі рахунки за планом оплати
= Середній щорічний внесок із кишень
= Безнадійний борг: рахунки за 12 місяців як відсоток рахунків
= Безнадійний борг: загальний залишок
= Безнадійний борг: загальна кількість рахунків як відсоток рахунків
= Безнадійна заборгованість: загальна сума виплат пацієнтам
= Нижче федерального рівня бідності: сім’я
= Нижче федерального рівня бідності: особи
= Грошовий дохід від державної допомоги
= Заробіток
= Вік гаранта
= Статус гаранта працевлаштування
= Фінансовий клас гаранта
= Стать гаранта
= Ідентифікатор гаранта
= Високий баланс
= Пропущений платіж: до 1 місяця
= Пропущений платіж: за 2 місяці2
= Пропущений платіж: за 3 місяці
= Пропущений платіж: за 4 місяці
= Пропущений платіж: за 5 місяців
= Рахунки за державною допомогою до 36 місяців
= Рахунки з коригуванням благодійної допомоги за останні 36 місяців
= Рахунки з недострахованими коригуваннями за попередні 36 місяців
= Рахунки з незастрахованими коригуваннями за останні 36 місяців
= Кількість останніх 5 місяців пропущених платежів1
= Немає рахунків на платіжному платіжі
= Не у робочій силі
= Відкрити рахунок: рахунки з планом виплат
= Відкрити рахунок: загальне коригування
= Відкрити рахунок: загальна кількість рахунків
= Відкрити рахунок: загальна сума виплат пацієнтам
= Відкриті рахунки: загальна сума виплат пацієнтам • Відкриті рахунки: загальна сума виплат
= Баланс пацієнта до середнього співвідношення не з кишені3
= Виплати пацієнтам: минулого місяця
= Виплати пацієнтам: за 1 місяць до цього
= Попередній план державного страхування
= Пенсійний дохід
= Код самооплати: до 1 місяця
= Код самооплати: попередні 2 місяці
= Код самооплати: попередні 3 місяці
= Код самооплати: попередні 4 місяці
= Код самооплати: до 5 місяців
= Соціальна безпека
= Деякі облікові записи, позначені планом оплати
= Додатковий дохід від забезпечення
= Загальна сума залишку
= Загальна сума виставленого рахунку із самооплатою4 • Загальна сума залишку страхування
= Загальна сума залишку самооплати5
= Загальний дохід домогосподарства (використано 10 окремих діапазонів доходів)
= Статус безробітного
= Рахунки з нульовим балансом: попередні 12 місяців
= Рахунки з нульовим балансом: попередні 12 місяців як відсоток рахунків
= Рахунки з нульовим балансом: загальна сума виплат пацієнтам
Вибір моделі
Для розрахунку відносного впливу вищезазначених змінних щодо ймовірності того, що пацієнт пропустить свою оплату, була використана випадкова лісова модель. Ефективність у розробці була наступною:
= Ефективність моделі: AUROC (c-статистика): 0,88; AUPR: 0,70
= Приклад точки вирізання: Справжньо-позитивний коефіцієнт (чутливість): 0,73; Помилково позитивний показник (1-чутливість): 0,78; Поріг: 0,80
Впровадження моделі в епічний робочий процес EMR
У грудні 2016 року ця модель була розгорнута безпосередньо в додатку Health Catalyst Propensity to Pay, вбудованому в робочий процес команд дохідного циклу за допомогою Epic.
Список літератури
Експерти з питань охорони здоров’я Catalyst відібрали наведені вище змінні на основі нашого медичного, фінансового та аналітичного досвіду та у партнерстві з Alignment Health – а через інноваційний характер проекту не вдалося знайти літературних посилань.
Спочатку ця публікація була опублікована за адресою https://www.linkedin.com/pulse/outstanding-balances-machine-learning-rev-cycle-dale-sanders/.
Dale Sanders люб’язно дозволив нам перекласти і опублікувати цю статтю.