Для одного наколенного проекта мне понадобилась база текстов, размеченных смысловыми словами. Тобеш для каждого текста указывается, какие слова из этого текста его семантически характеризуют и являются в нем “главными”. Никаких отношений и связей, просто смысловые токены. найти ничего готового не смог, так что за вечер набросал удобный интерфейс (предлагает рандомный текст из базы имеющихся, понимает морфологию, автоматом выделяет для выбранного слова другие словоформы этого слова). Сели с друзьями под пивко, разметили две сотни текстов. Для начала мне хватит, но хотелось бы больше.
Возникла мысля - выкатить интерфейс в открытый доступ, исходники, простой апи для доступа к размеченной базе. С одной стороны я не жадный, вдруг кому оно нужно. С другой - хотелось бы, чтобы добровольцы также внесли свою лепту.
Что скажете господа и дамы, нужно кому такое? Будет ли кто участвовать? Я впринципе готов потратить время и сервер на этот проект, если сообщество заинтересуется...
Ответ на:
комментарий
от srj
Ответ на:
комментарий
от srj
Ответ на:
комментарий
от pacify
Ответ на:
комментарий
от pacify
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.
Похожие темы
- Форум Корпуса текстов для классификации по тематикам (2012)
- Форум Корпус (2009)
- Форум Корпус. (2006)
- Форум Семантический десктоп (2012)
- Форум Атака на основе открытых текстов (2014)
- Форум Открытые движки для индексирования текста (2006)
- Новости Запланировано открытие исходных текстов CuneiForm (2007)
- Форум Корпус miniITX (2016)
- Форум Выбор корпуса (2014)
- Форум Выбор корпуса (2021)