Доброго дня.
у меня есть строка такого вида:
«test тест ÄäÖöÅå тест täällä и здесь тест». Строка UTF-8
Мне нужно вытащить из нее все русские слова питоном.
То есть должно получиться что-то типа
'тест', 'тест', 'и здесь тест'
Уже второй день сижу ничего не могу сделать.
пробовал выражение re.compile(ur'([^a-zA-zÄäÖöÅå]+)', re.U).
findall вытаскивает все ÄäÖöÅå наружу вместе с русскими символами.
То есть
' тест ÄäÖöÅå тест ', 'ää', 'ä и здесь тест'
Такое вообще возможно сделать питоном?
Ответ на:
комментарий
от tanenn
Ответ на:
комментарий
от ossa
Ответ на:
комментарий
от tanenn
Ответ на:
комментарий
от ossa
Ответ на:
комментарий
от tanenn
Ответ на:
комментарий
от ossa
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.
Похожие темы
- Форум [python][cgi] Проблемы с utf-8 (2010)
- Форум Регулярное выражение из Perl в Python (2002)
- Форум python && utf-8 (2005)
- Форум [Python] Из UTF-8 в UTF-8 (2009)
- Форум UTF-8 в Python (2014)
- Форум Python: UTF-8 to CP1251 (2011)
- Форум Python декодировать CP1251 -> UTF-8 (2023)
- Форум UTF-8 (2004)
- Форум utf-8 (2004)
- Форум UTF-8 (2007)