Всем привет!
Хочу написать парсер HTML файлов (ну, вставлять, удалять, изменять определенные части файла). Использование: как утилитка коммандной строки, но в будущем надеюсь оснастить web интерфейсом и выложить в интернет (скажем, apache).
Пока что пишу на bash с использованием sed . Функционала хватает, хотя немного неудобно (все-таки bash не для этого). Выучить любой другой язык - не проблема (не шучу).
Отсюда два вопроса:
1. На каком языке лучше такие фишки писать? Perl? Python? Как народ смотрит на что-то типа tcl?
2. С HTML лучше работать как с текстовым файлом, или какой-то xml парсер может облегчить жизнь? (под bash нашел xmlstarlet, под всякие perl'ы и другие языки, полагаю, есть соответствующие классы).