Имеется довольно большое количество довольно мелких разрозненных файлов на разных языках (человеческих, не ЯП) в формате m$ word (*.doc), созданных в OpenOffice и m$ office. Все свалено в несколько папок, но никак не упорядочено. А хотелось бы как-то классифицировать тексты, с возможностью раскидать их по датам, жанрам, языкам, а также по изданиям, в которых тексты публиковались. Вопрос очевиден: как это лучше осуществить. Необходимо, чтобы решение было лёгким в реализации, кроссплатформеным (win/linux) и основанным на распространённых технологиях.
Что приходит в голову:
1. Просто рассортировать всё по папкам и сделать директории типа «2005 год», «2008 год», «Опубликовано в газете N», «На ... языке», в которые покидать линки на файлы. Но это не слишком удобно и непроизводительно, придётся создавать по несколько линков на одни и те же файлы.
2. Водрузить на домашнюю машину PHP+Apache+MySQL и поставить на localhost какую-нибудь Joomla. Заполнить текстами из файлов и разбросать по категориям. Способ не самый простой и быстрый, хотя если все сделать «по уму», будет удобно.
3. Перегнать тексты из .doc в .fb2, заполнить для каждого текста данные о языке, публикациях и т.п., а потом воспользоваться любой готовой программой-каталогизатором fb2, коих сейчас много под разные системы.
Может быть, еще какие-то варианты есть? Буду признателен за идеи.