LINUX.ORG.RU

Есть в природе cli-инструменты для работы с фильтрами Байеса?

 bayesian, фильтр байеса


0

1

Задача — есть ряд текстов для обучения. Хочется скормить (в консоли) тексты фильтру Байеса с привязкой текстов и ключевых слов (категорий текста). И запомнил.

Потом подать на вход утилите неизвестный текст и чтобы она выдала список подходящих категорий (ключевых слов) с указанием коэффициента соответствия.

В spamassasin была такая штука, sa-learn, но там только бинарный подход спам/не спам.

Есть много библиотек под разные языки, но очень низкоуровневых. Надо много геморроиться и разбираться с созданием хранилища. Либо вообще обучение перед каждым использованием...

Должно же быть что-то уже готовое к использованию, нет?

★★★★★

В питоне pandas для I/O и sk-learn для работы, сейчас на курсере курс от МИФИ и яндекса по этому делу идёт. Программа будет строчек десять.

dn2010 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.