ENIGMA AI
ENIGMA AI

Как рассчитывается метрика Precision (точность) — по какой формуле и как она вычисляется, это отношение чего к чему?

встречается 1× Machine Learning junior algorithms

Как ответить

Precision (точность) — это доля истинно положительных объектов среди всех объектов, которые модель отнесла к положительному классу. Формула:

Precision = TP / (TP + FP)
, где TP (True Positives) — верно предсказанные положительные примеры, FP (False Positives) — ложные срабатывания (отрицательные примеры, ошибочно принятые за положительные).

Проще говоря, precision отвечает на вопрос: «Из всех предсказаний положительного класса сколько действительно верны?»

Пример из задачи классификации спама:
Пусть у нас 100 писем, из них 30 — реальный спам, 70 — не спам. Модель предсказала 25 писем как спам. Из этих 25 реально спамом оказались 20 (TP), а 5 были не спамом (FP). Тогда precision = 20 / (20 + 5) = 0.8 (80%). Это значит, что из 25 писем, помеченных как спам, 80% действительно спам, а 20% — ложные срабатывания.

Как вычисляется на практике: после обучения модели на тестовой выборке мы получаем матрицу ошибок (confusion matrix). Из неё берём TP и FP и подставляем в формулу. Если модель выдаёт вероятности, то precision зависит от порога классификации: чем выше порог, тем меньше FP, но может упасть recall.

Когда precision особенно важна: в задачах, где цена ложного срабатывания (FP) высока. Например, в медицинской диагностике: если модель ошибочно ставит диагноз «рак» здоровому человеку, это ведёт к ненужным стрессам и дополнительным обследованиям. В таких случаях стараются максимизировать precision, даже если recall немного страдает.

Для junior-разработчика важно понимать, что precision — это одна из базовых метрик бинарной классификации, и её нужно рассматривать в паре с recall (полнотой). Компромисс между ними описывает F1-мера.

Ключевые тезисы

  • Формула: Precision = TP / (TP + FP).
  • Precision показывает, насколько модель «уверена» в своих положительных предсказаниях — доля верных среди них.
  • Пример: в задаче классификации спама precision = 80% означает, что 4 из 5 помеченных как спам писем действительно спам.
  • Высокая precision важна, когда ложные срабатывания дороги (медицина, антифрод).
  • Precision зависит от порога классификации и обычно находится в обратной зависимости с recall.

Что спросят дальше

  • — Как precision связана с recall? Что такое F1-score и зачем он нужен?
  • — Если мы повысим порог классификации для положительного класса, как изменятся precision и recall?
  • — Приведите пример задачи, где precision важнее recall, и наоборот — где recall важнее precision.

Готовьтесь к собеседованию с ENIGMA AI

AI-суфлёр подсказывает ответы прямо на собеседовании в реальном времени — незаметно для интервьюера.

Скачать приложение