ENIGMA AI
ENIGMA AI

Какими метриками обычно пользуются для оценки качества модели детекции объектов?

встречается 1× Machine Learning middle algorithms

Как ответить

Основные метрики качества для детекции объектов делятся на три группы: метрики локализации (насколько точно предсказана рамка), метрики классификации/детекции (найдены ли объекты и правильно ли распознаны), и агрегированные метрики, которые их комбинируют. Стандартом де-факто в задачах детекции является mAP (mean Average Precision).

1. IoU (Intersection over Union)
Показывает перекрытие между предсказанной рамкой и ground truth. Значение от 0 до 1. Обычно считают детекцию корректной, если IoU >= 0.5 (Pascal VOC) или используют диапазон 0.5–0.95 с шагом 0.05 (COCO). Это базовая метрика локализации, именно она определяет, считать ли предсказание истинно-положительным (TP).

2. Precision и Recall
Считаются для каждого класса при фиксированном пороге уверенности модели (confidence threshold). Precision = TP / (TP + FP), Recall = TP / (TP + FN). TP — число верно найденных объектов (IoU >= порога), FP — ложные срабатывания (дублирующиеся рамки или неверные классы), FN — пропущенные объекты. Обычно строят PR-кривую, варьируя порог уверенности, и берут площадь под ней как Average Precision (AP).

3. mAP — mean Average Precision
Сначала вычисляется AP для каждого класса: это средняя точность на 11 или 101 точках равномерно расположенных на recall (Pascal VOC) или интерполяция по всей кривой (COCO). Затем AP усредняется по всем классам. В COCO стандарт — mAP@[0.5:0.95] (среднее по 10 порогам IoU от 0.5 до 0.95). Это даёт более строгую оценку — модель должна не только найти объект, но и точно его локализовать.

4. Дополнительные метрики
F1-score — гармоническое среднее precision и recall при конкретном пороге. Полезен, когда важен баланс.
Log-Average Miss Rate (для детекции пешеходов) — взвешенная метрика, чувствительная к пропускам.
mAP для разных размеров объектов (small/medium/large) — помогает выявить слабые места модели.

Пример расчёта mAP в коде (Python + pycocotools):

from pycocotools.coco import COCO
from pycocotools.cocoeval import COCOeval

coco_gt = COCO(annotations_file)
coco_dt = coco_gt.loadRes(predictions)
coco_eval = COCOeval(coco_gt, coco_dt, 'bbox')
coco_eval.params.iouThrs = np.linspace(0.5, 0.95, 10)
coco_eval.evaluate()
coco_eval.accumulate()
coco_eval.summarize()
print('mAP @[0.5:0.95]:', coco_eval.stats[0])

Для реального продакшна помимо mAP смотрят на FPS и задержку (latency), а также на размер модели (параметры, FLOPs), потому что топовая mAP не означает, что модель можно поставить на мобильное устройство или edge-плату.

Ключевые тезисы

  • IoU — метрика совпадения предсказанной рамки с истинной; от неё зависит, считать детекцию TP или нет.
  • Precision и Recall — метрики точности и полноты при заданном пороге уверенности; их комбинация даёт AP.
  • mAP — mean Average Precision — главная агрегированная метрика: сначала AP для каждого класса, затем среднее. Стандартные варианты: mAP@0.5 (Pascal VOC) и mAP@[0.5:0.95] (COCO).
  • Диапазон порогов IoU в метрике mAP@[0.5:0.95] жёстче оценивает качество локализации — модель должна не только найти объект, но и точно его обвести.
  • Для продакшна к mAP добавляют метрики скорости (FPS, latency) и ресурсоёмкости (параметры, FLOPs), так как высокая точность не гарантирует применимость в условиях ограниченных ресурсов.

Что спросят дальше

  • — Почему в COCO используется диапазон IoU от 0.5 до 0.95, а не фиксированный порог, как в Pascal VOC? Какой вариант предпочтительнее при оценке реального проекта с высокими требованиями к локализации?
  • — Как вы будете выбирать порог уверенности для модели детекции в продакшне? Какие метрики (кроме mAP) помогут принять решение?
  • — Что делать, если в данных сильный дисбаланс классов (например, один класс составляет 90% объектов)? Как это влияет на mAP и какие метрики использовать для более адекватной оценки?

Готовьтесь к собеседованию с ENIGMA AI

AI-суфлёр подсказывает ответы прямо на собеседовании в реальном времени — незаметно для интервьюера.

Скачать приложение