Анализ и сравнение текстов.

0

0

По каким алгоритмам обычно проводится сабж? Собственно, вопрос:)

Ссылка

←	nginx: модули: модуль, меняющий входящие URL.

mysq, два подключения, выборка и изменение на лету

→

Показаны ответы на комментарий. Показать все комментарии.

Ответ на: комментарий от arsi 11.03.2010 16:59:56 +00:00

я так понял, что нужно в первую очередь семантическое сравнение - поиск общих подпоследовательностей здесь не катит

jtootf ★★★★★
(11.03.2010 17:02:01 +00:00)

Ответ на: комментарий от jtootf 11.03.2010 17:02:01 +00:00

> я так понял, что нужно в первую очередь семантическое сравнение - поиск общих подпоследовательностей здесь не катит

Есть что разжеванное по семантическому сравнению? Для рефератов я бы эту неведомую херню не стал городить.

~~Pavel_7c0~~
(11.03.2010 17:05:50 +00:00)

Ссылка

Ответ на: комментарий от jtootf 11.03.2010 17:02:01 +00:00

почему же?.. если элементами массивов считать не символы, а слова, то при при длине LCS > 80% длины входного текста можно почти с уверенностью сказать, что кто-то у кого-то содрал ;)

arsi ★★★★★
(11.03.2010 17:12:25 +00:00)

Ответ на: комментарий от arsi 11.03.2010 17:12:25 +00:00

> почему же?.. если элементами массивов считать не символы, а слова, то при при длине LCS > 80% длины входного текста можно почти с уверенностью сказать, что кто-то у кого-то содрал ;)

Да, только нужен ведь мгновенный поиск. Не будете же каждый раз делать сравнение со всеми остальными тысячами? Шинглы как раз и будут это решать.

~~Pavel_7c0~~
(11.03.2010 17:19:46 +00:00)

Ссылка

Ответ на: комментарий от arsi 11.03.2010 17:12:25 +00:00

такие проверки рефератов легко взломать. достаточно хорошенько переставить местами слова в тексте.

anonymous
(11.03.2010 17:21:12 +00:00)

Ответ на: комментарий от anonymous 11.03.2010 17:21:12 +00:00

> такие проверки рефератов легко взломать. достаточно хорошенько переставить местами слова в тексте.

если после такой (хорошенькой) перестановки реферат будет читаем, то можно и 5 поставить, фигня вопрос :) (ведь по сути реферат это и есть «перестановка слов» из первоисточников + немножко «клея».) а если его никто читать не будет, и нечто вроде cat /dev/random >~/referat.txt сойдёт, то смысл в самой проверке на плагиат?

arsi ★★★★★
(11.03.2010 17:33:04 +00:00)

Ответ на: комментарий от arsi 11.03.2010 17:33:04 +00:00

>из первоисточников + немножко «клея».

а как же выводы?

dimon555 ★★★★★
(11.03.2010 18:57:24 +00:00)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	nginx: модули: модуль, меняющий входящие URL.

Development

mysq, два подключения, выборка и изменение на лету

→

Похожие темы