LINUX.ORG.RU
Ответ на: комментарий от arsi

я так понял, что нужно в первую очередь семантическое сравнение - поиск общих подпоследовательностей здесь не катит

jtootf ★★★★★
()
Ответ на: комментарий от jtootf

> я так понял, что нужно в первую очередь семантическое сравнение - поиск общих подпоследовательностей здесь не катит

Есть что разжеванное по семантическому сравнению? Для рефератов я бы эту неведомую херню не стал городить.

Pavel_7c0
()
Ответ на: комментарий от jtootf

почему же?.. если элементами массивов считать не символы, а слова, то при при длине LCS > 80% длины входного текста можно почти с уверенностью сказать, что кто-то у кого-то содрал ;)

arsi ★★★★★
()
Ответ на: комментарий от arsi

> почему же?.. если элементами массивов считать не символы, а слова, то при при длине LCS > 80% длины входного текста можно почти с уверенностью сказать, что кто-то у кого-то содрал ;)

Да, только нужен ведь мгновенный поиск. Не будете же каждый раз делать сравнение со всеми остальными тысячами? Шинглы как раз и будут это решать.

Pavel_7c0
()
Ответ на: комментарий от arsi

такие проверки рефератов легко взломать. достаточно хорошенько переставить местами слова в тексте.

anonymous
()
Ответ на: комментарий от anonymous

> такие проверки рефератов легко взломать. достаточно хорошенько переставить местами слова в тексте.

если после такой (хорошенькой) перестановки реферат будет читаем, то можно и 5 поставить, фигня вопрос :) (ведь по сути реферат это и есть «перестановка слов» из первоисточников + немножко «клея».) а если его никто читать не будет, и нечто вроде cat /dev/random >~/referat.txt сойдёт, то смысл в самой проверке на плагиат?

arsi ★★★★★
()
Ответ на: комментарий от arsi

>из первоисточников + немножко «клея».

а как же выводы?

dimon555 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.