Как правильно указывать множества "[А-Яа-я]" и т.д. при работе с сабжем (уникод)? Биндинги типа r"\w" ОК, интервалы не работают. Workaround приблизительно такой: buffer = unicode(open("file.txt", "r").read(), "cp1251") pattern = re.compile(r"[А-Яа-я]", re.UNICODE) print pattern.findall(buffer) Причем ur"[А-Яа-я] не помогает. Коды символов? А какие и как их вводить?
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.
Похожие темы
- Форум Disjoint regular expressions. (2008)
- Форум mastering regular expressions (2006)
- Форум Зацените скрипт на питоне, по перекодировке mp3 тэгов. (2006)
- Форум [C++0x] regular expressions (2011)
- Форум adblock plus + Regular Expressions (2018)
- Форум JSON schema: regular expression (2018)
- Форум regular expression с рускими буквами (2003)
- Форум Open Office, page breaks, regular expressions (2009)
- Форум Alt Regular (2022)
- Форум Nodejs (express) или python(django) (2019)