LINUX.ORG.RU

ЧЯДНТ, или есть ли более вменяемый стеммер русского языка?

 ,


0

1

Из примеров работы mystem на моих данных:

кристалинской
{кристалинский?=A=род,ед,полн,жен|?=A=дат,ед,полн,жен|?=A=твор,ед,полн,жен|?=A=пр,ед,полн,жен}
Но ведь из правил склонения следует, что это слово может быть образовано от слова «кристалинская» при сколнении в творительный падеж (а еще в родовой, предложный и дательный), которое, согласно окончанию, может быть то ли прилагательным женского рода, то ли женской фамилией (мой случай). Почему оно предлагает только «кристалинский», да еще и считает, что это слово женского рода?
На многих других подобных фамилиях работает совершенно правильно:
белинской
{белинская=S,фам,жен,од=род,ед|=S,фам,жен,од=дат,ед|=S,фам,жен,од=твор,ед|=S,фам,жен,од=пр,ед}
В данном случае, зная, что нам дана фамилия в творительном падеже, можно однозначно нормализовать.
Но почему настолько ненадежно?

★★
Ответ на: комментарий от StephenElop

Посмотрев на его демо с таблицами, понял, почему mystem давал именно такой результат. Не зная, что это фамилия, он воспринимает слово как прилагательное, а прилагательное возвращает в мужской род. Вот бы найти такой инструмент, который только с падежами работает... Мне нужно преобразовывать из заданного в именительный.

shatsky ★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.