Что такое uplift-моделирование и какие основные гипотезы используются в uplift-моделях?

Question

ENIGMA AI · Accepted Answer

Uplift-моделирование — это техника в машинном обучении, которая оценивает причинно-следственный эффект воздействия (например, рекламной кампании или лечения) на конкретного пользователя. В отличие от классических моделей, предсказывающих вероятность целевого действия (например, покупки), uplift-модель отвечает на вопрос: «Насколько изменится вероятность события, если мы применим воздействие?». Основная цель — выделить подмножество пользователей, на которых воздействие даёт наибольший прирост, и не тратить ресурсы на тех, кто среагирует без воздействия или, наоборот, отреагирует негативно.

В uplift-моделировании используются несколько ключевых гипотез, которые определяют, как модель разделяет аудиторию на четыре группы:

Persuadables (убеждаемые) — пользователи, которые совершат целевое действие только при воздействии. Это основная целевая группа.
Sure things (уверенные) — пользователи, которые совершат действие в любом случае. Воздействие на них излишне.
Lost causes (безнадёжные) — пользователи, которые не совершат действие независимо от воздействия. Ресурсы на них тратить не стоит.
Do-not-disturb (не беспокоить) — пользователи, у которых воздействие снижает вероятность действия (обратный эффект).

Основные гипотезы, которые закладываются в uplift-модели:

Гипотеза о независимости воздействия (Unconfoundedness) — предполагается, что распределение пользователей по группам воздействия и контроля не зависит от их потенциальных исходов после учёта наблюдаемых признаков. На практике это означает, что мы должны случайным образом разделить выборку на две части: тех, кто получает воздействие (treatment group), и тех, кто не получает (control group). Без случайного разделения оценка uplift будет смещённой.
Гипотеза о стабильности единиц (SUTVA — Stable Unit Treatment Value Assumption) — предполагается, что воздействие на одного пользователя не влияет на других пользователей. Например, если мы отправляем промокод одному клиенту, это не должно влиять на покупки его друзей. В реальных задачах (например, в социальных сетях) эта гипотеза часто нарушается, и приходится использовать более сложные модели.
Гипотеза о монотонности воздействия — предполагается, что воздействие не может ухудшить результат для всех пользователей. То есть для каждого пользователя uplift ≥ -1 (вероятность не может упасть более чем на 100%). На практике это упрощение, но оно помогает при построении некоторых моделей (например, модели на основе деревьев решений).

Для оценки uplift-моделей используются метрики, такие как Qini-кривая или AUUC (Area Under the Uplift Curve). Они показывают, насколько хорошо модель выделяет persuadables по сравнению со случайным выбором. Например, если модель даёт AUUC = 0.15, это означает, что при охвате 10% пользователей с наибольшим uplift мы получаем на 15% больше целевых действий, чем при случайном охвате 10% аудитории.

На практике uplift-модели часто строятся с помощью двухмодельного подхода (две отдельные модели для treatment и control) или с помощью одной модели, где uplift предсказывается напрямую (например, через деревья решений с модифицированным критерием разделения).

Что такое uplift-моделирование и какие основные гипотезы используются в uplift-моделях?

Как ответить

Ключевые тезисы

Что спросят дальше

Похожие вопросы — ML-инженер

Готовьтесь к собеседованию с ENIGMA AI

Навигация

Поддержка

Правовое