Друзья, всем привет! Мне необходимо извлекать информацию из 20-25 сайтов компаний партнеров, каждый имеет свою структуру. В вопросах парсинга я имею поверхностные знания, но регулярки немного знаю, собираюсь заказать разработку у специалистов-фрилансеров.
Мой вопрос: что выбрать? Регулярки типа sed или perl и т.п. или использовать соответствующие фреймворки для python, java и др. языков? Конечно, хотелось бы, чтобы это можно было как-то поддерживать потом, экстренно вносить минимальные изменения, т.е. немного не хочется иметь дело с нечитаемыми регулярками, которые можно только переписывать. Какой сейчас вообще мейнстрим в этой сфере, что использует прогрессивное человечество? Спасибо!!!)))