LINUX.ORG.RU

Поиск среди забэкапенных сайтов

 , ,


0

1

Всем привет. Так как я относительно часто бываю в дороге без инета, имею несколько сайтов забэкапенных на устройство. Очень удобно, но иногда нужно найти какую то инфу, о которой забыл где она. Есть ли в наличии какие нибудь тулзы, которые умеют в javascript и в которые можно вбить текст и они покажут местоположение инфы, желательно ее при этом показав в виде сайта (например если там рядом картинко)? Желательно чтобы тулза была на линукс или на андроид.



Последнее исправление: Pups (всего исправлений: 1)

апач же для этого придумали. lucene, например. Парсер - headless хромиум. Генеришь карту переходов, затем обходишь хоромиумом и результат в апач. И затем по вебинтерфейсу ишешь стандартными средствами поисковика. Там тебе и морфология будет и все что угодно.

Как вариант, хромиумом генеришь пдфки всех страниц и скармливаешь поисковику их. Тогда предпросмотр будет приличный и картинки можно распознавать.

AVL
()
Ответ на: комментарий от Pups

по скриптам

Дарю, не жалко:

$ cat cleanerhtmlre-js.py
#!/usr/bin/python

import sys
import re

def clear_html_code(text):
    text = re.sub(r'<script.*?>','',text).replace('</script>','')
    text = re.sub(r'<iframe.*?>','',text).replace('</iframe>','')
    return text

if __name__ == '__main__':
    with open(sys.argv[1], 'r') as fin, open(sys.argv[2], 'w') as out:
        out.write(clear_html_code(fin.read()))
anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.