LINUX.ORG.RU
Ответ на: комментарий от Mike_RM

Экстримистским

Экстремистским. Свои сообщения нельзя править?

Mike_RM
()
Ответ на: комментарий от Mike_RM

Ну вот там и приведена ссылка на документ, в котором помимо опечаток в URL, сами URL надо выковыривать как изюм из булки. Надеюсь, не надо объяснять, что машине надо табличку, а не парсить от руки.

Infra_HDC ★★★★★
() автор топика
Ответ на: комментарий от Mike_RM

Это не машиночитаемый источник, и там не только интернет-ресурсы. То есть его нельзя загрузить в конфиг прокси-сервера, например, без предварительной обязательной ручной обработки, и чтобы сразу заработал фильтр.

Infra_HDC ★★★★★
() автор топика
Ответ на: комментарий от Infra_HDC

Блин, я думал, ты хочешь скачать все это и распространять!

А ты, оказывается, хочешь пагубным делом заниматься. И Великую Страну в говно скатывать...

anonymous
()
Ответ на: комментарий от Infra_HDC

Вы с какой целью это реализуете? Если для исполнения законодательства как оператор связи - то так никто не делает, у связистов единый лист блокировок - они его вливают в магистральные маршрутизаторы, и проверяется это всё спецкомплексом, ревизор называется. Если для себя то сами и парсите этот бюрократический опус) ну можете ещё жалобное письмо написать в минюст и в минкомцифру - может лет через 10 вместо ворда эксель начнут выкладывать)

Mike_RM
()
Ответ на: комментарий от Mike_RM

Боюсь, что ответы на ваши вопросы не решат проблему, сформулированную в топикстарте.

Infra_HDC ★★★★★
() автор топика

Отличная тема для Admin.

Deleted
()
Ответ на: комментарий от annulen

Более того, его вполне адекватно, с файловой системы, читает веб-сервер — перед тем, как отдать веб-браузеру интернет-пользователя в момент скачивания. Гы гы.

Infra_HDC ★★★★★
() автор топика
Ответ на: комментарий от Infra_HDC

Вы правы. К сожалению не существует машиночитаемого источника от Минюста. Уже много лет слежу за списком для работы, но только в том виде, в котором он предоставляется Минюстом. В нем не только интернет ресурсы, но и музыкальные материалы, печатные. Пытался я писать парсер и вытягивать ссылки. Но к сожалению, в 50% случаях ссылки написаны с ошибками (htp://, http//www..., http:http://www.... и так далее). Может быть где-то в интернете кто-то в «ручном» режиме и ведет только по интернет ресурсам, но я не встречал.

Для себя я тяну по RSS его и у меня он используется как есть в электронном виде, так как для работы требуется не только интернет ссылки, но и запрещенные печатные материалы.

http://minjust.ru/ru/extremist-materials/rss

smserg
()
Ответ на: комментарий от smserg

Спасибо за информацию! За RSS-ленту — отдельное спасибо! Загрузил себе в Mozilla Thunderbird.

Infra_HDC ★★★★★
() автор топика
Последнее исправление: Infra_HDC (всего исправлений: 1)
29 сентября 2020 г.

UP!

RSS большее не работает: не обновляется и не виден громо-птицей.

Зато есть полный список, https://minjust.gov.ru/uploaded/files/exportfsm.csv, но увы, до сих пор не машиночитаемый, в рассмотренном нами смысле.

Infra_HDC ★★★★★
() автор топика
Ответ на: комментарий от annulen

Допустим. Можно ли найти несложный алгоритм, который выделяет корректного вида URL в отдельное поле, чтобы можно было из него просто скопипастить в адресную строку браузера – для проверки доступности эктремистского ресурса или проверки его фильтруемости провайдером?

Infra_HDC ★★★★★
() автор топика
Последнее исправление: Infra_HDC (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.