Есть многострочный HTML-текст (по сути, валидный XML), в котором могут встречаться такие конструкции:
<span разные_атрибуты> </span>
<span разные_атрибуты> </span>
<span разные_атрибуты> </span>
Да, это именно «пробельный» текст с разным количеством пробелов.
Задача: заменить все такие вхождения на такие:
<span разные_атрибуты>��</span>
<span разные_атрибуты>����</span>
<span разные_атрибуты>�</span>
В других местах заменять пробелы на «�» не требуется.
Обрабатывать нужно именно регулярными выражениями. Потому что, например, парсинг в DOM (с последующим обратным преобразованием) не сделает текстовую ноду из одних пробелов внутри ноды span.
Вопрос: как это сделать регулярками? Вот заготовка:
QRegExp replaceSpaceTagsEx("<span.*>(\\s*)</span>");
replaceSpaceTagsEx.setMinimal(true);
htmlCode.replace(replaceSpaceTagsEx, "?????");
Что надо прописать вместо знаков вопроса? Или надо делать как-то по-другому?