В интернетах иногда встречаются свалки текcтов книг. Так, владелец одной из таких свалок утверждает, что в ней 700 тысяч неповторяющихся текстов.
Совершенно очевидно, что 80% этих текстов, это бред идиотов про несуществующие сущности (эльфов, вампиров, НЛО, шаровые молнии и высадку на луну). Я наверняка в этом уверен, так как сам из ЭТИХ.
Вопрос - каким образом автоматизированно составить каталог, которым можно было бы в последствии пользоваться для поиска книг? Автоматизированное составление нужно так как иначе «это большая работа».