История изменений
Исправление invy, (текущая версия) :
1. Не stackoverflow, а вуз и информатика. (нельзя парсить контекстно-свободные языки конечными автоматами). На стэковерфлоу просто красиво написано.
2. «вытащить <body>уныло</body>» имеет мало общего с «парсить». И да, regex и для вытащить плохо подходит. Для того, чтобы работало гарантировано нужен нормальный парсер, dom и xpath.
Исходная версия invy, :
1. Не stackoverflow, а вуз и информатика. На стэковерфлоу просто красиво написано.
2. «вытащить <body>уныло</body>» имеет мало общего с «парсить». И да, regex и для вытащить плохо подходит. Для того, чтобы работало гарантировано нужен нормальный парсер, dom и xpath.