<div class="mediawiki ltr ns-0 ns-subject page-xxsfds TOC_hide oasis-breakpoints wikinav2 skin-oasis user-anon wiki-xxsfds">
Как мне удалить все классы кроме mediawiki?
from bs4 import BeautifulSoup, Comment
import sys
import re
import os
with open(sys.argv[1], 'r') as content_file:
data = content_file.read()
soup = BeautifulSoup(data, "lxml")
for div in soup.find_all("div", {'class':'mediawiki'}):
<...>
Ну и чтобы два раза не вставать - когда пытаюсь писать в тот же файл мне prettify орет что файл не ASCII и оно не мочь в UTF-8 (даже если ставить .encode("UTF-8")
. Приходится делать s.py > в отдельный файл, только так работает.