LINUX.ORG.RU

Вопрос по терминологии из матстатов

 ,


0

1

Джентельмены!

Есть у меня двуклассовый классификатор, который выдаёт решения в виде некоторой чиселки. Я знаю, что чем больше чиселка, тем больше вероятность, что данные, скормленные классификатору, относятся к классу 1, а не к классу 0.

Я хочу построить функцию, которая будет принимать решение классификатора и выдавать вероятность принадлежности к классу 1. Для этого делаем кросс-валидацию обучающего множества и получаем значения-решения для каждого его элемента.

После этого строим эмпирическую функцию вероятности как P[prior emp 1] (x)= Num(class 1 with dec value <= x), как-то её сглаживаем и дифференцируем, чтобы получить плотность вероятности. Так получаем f0(x) и f1(x) для классов 0 и 1.

Апстериорную вероятность считаем как P1[posterior] (x) := |class 1| * f1(x) / (|class 0| * f0(x) + |class 1| * f1(x) )

Как правильно называется такой тип оценки вероятности, когда мы строим априорные вероятности для классов непосредственно из данных?


Советую поискать по терминам logistic regression, classification problem, regression analysis.

dave ★★★★★
()

Еще термин: analysis of variance

dave ★★★★★
()

как-то её сглаживаем и дифференцируем

Без этого — Байесовский классификатор, «Наивный Байес».

soomrack ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.