LINUX.ORG.RU

Вопрос о URL. (На самом деле я плохо владею терминологией, поэтому этот заголовок заведомо некорректен)

 


0

1

Пожалуйста, ответьте на следующие вопросы:

  • Как наиболее корректно проверить является ли строка (или последовательность байтов?) URL’ом. (Я полез искать стандарты, но похоже я не умею пользоваться ни гуглом ни манами).

  • Как мне это сделать быстро.

Т.е.

$ sudo apt install <что-то>
$ <что-то> <url>

Где <что-то> и <url> - это строки (не уверен что в том же смысле что и выше).


from urlparse import urlparse
import sys

try:
    o = urlparse(sys.argv[1])
    if not o[0]:
        1/0
    print 'eto url, mamoy klyanus!'
except:
    print 'net, eto ne url, urlom ne vishel...'

python2.7 etourl.py <url>

buratino ★★★★★
()

Может это подойдёт?

[8:30] u@notebook:~> cat /usr/ports/www/py-urlwatch/pkg-descr
With urlwatch you can watch changes in webpages and get notified (via e-mail,
in your terminal or through various third party services) of any changes.

The change notification will include the URL that has changed and a unified
diff of what has changed.

WWW: https://github.com/thp/urlwatch
Ну или делать что-нибудь на регулярках и awk'е.

IPR ★★★★★
()
Ответ на: комментарий от buratino
<?php exit((isset($argv[1]) ? ('Это' . (filter_var($argv[1], FILTER_VALIDATE_URL) ? ' ' : ' НЕ ') . 'урл') : 'Введите урл!') . PHP_EOL);
deep-purple ★★★★★
()

Update

Ответы выше мне не помогли, но проблемы свои я решил, так что всем спасибо.

Новые вопросы:

1. Помогите мне найти наиболее актуальный стандарт, определяющий URL.

2. Какому стандарту следовали при реализации urllib.parse в python3 (https://docs.python.org/3/library/urllib.parse.html)

alois
() автор топика
Ответ на: Update от alois

проблемы свои я решил

Выкладывай решение.

deep-purple ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.