LINUX.ORG.RU

Рутрекер база + какой-то cli есть ли в природе?

 


0

1

Видел, что выкладывали базу рутрекера. Где его скачать и есть ли к нему какой-то cli, чтобы можно было искать там без запросов? А то все трекера в моем сегменте залочены

★★★

Последнее исправление: serg002 (всего исправлений: 1)

<torrent id="{ID топика}" registred_at="{Дата регистрации в формате Y.[*]m.d H:i:s}" size="{Размер раздачи в байтах}">
<title><![CDATA[{Название раздач заключенные в CDATA}]]></title>
<magnet><![CDATA[{Магент ссылка}]]></magnet>
<forum id="{ID форума}"><![CDATA[{Название форума}]]></forum>
<content><![CDATA[{Оформление раздачи}]]></content>
</torrent>

Там XML - напиши скрип, который будет обрабатывать XML докумнты, делать поиск по названию.

Можешь перегнать в CSV - тогда делай просто grep, да даже просто grep по XML и далее разбор найденного или загони в базу в любой СУБД, хоть sqlite и далее select.

Всё в твоих руках чего-то готового не нужно.

Ты сам волен написать и обрабатывать.

В раздаче так же есть ссылки на подготовленные утилиты, есть ли там под Linux особо не смотрел, скорее всего нет.

Но ты можешь проверить.

anonymous
()

Вот не думал что когда нибудь это напишу, тем более на лоре, но это же классическая xy проблема.

Зачем тебе дамп рутрекера, если он постоянно обновляется? Это ведь не Флибуста условная.

Зачем тебе вообще база рутрекера, если можно рилтайм парсить магнет или торрент файлы со всех трекеров?

Детский сад. У меня даже на ссаном андроидтв все что нужно тянется с пачки трекеров и/или магнет.

anonymous
()
Ответ на: комментарий от anonymous

Товарищ, если автор не знает каким способом ему решить задачу - он может решить его теми возможностями, что ему предоставляет Linux из коробки.

А уровень колхоза будет зависеть от навыков автора.

Если у него они хорошие - то может даже выложит написанное.

Проще конечно сидеть и ждать, пока скажут, что вот тут уже всё готовое есть.

Имеешь руки, голову - делай.

Но ты видимо следуешь по пути самурая, сидеть ждать на берегу, пока не проплывёт труп твоего врага.

Умного нечего сказать тебе, как я погляжу.

anonymous
()
Ответ на: комментарий от anonymous

Мне лень читать твой комментарий целиком, но рутрекер без авторизации тебе торрент не отдаст.

Про парсинг верстки отдельно проиграл, оптимальное решение написали выше уже.

Но ты колхозник, как и опчик.

anonymous
()
Ответ на: комментарий от anonymous

Автор написал - хочу работать с дампом базы. Понимаешь, такое у него ТЗ. Кто ты такой, чтобы оспаривать его выбор?

В дампе базы есть магнет ссылки, их более чем достаточно, чтобы скачивать торренты.

И никакой авторизации не нужно.

В решение с параметром веб страниц нужно ещё прикручивать решение по доступа в рутрекер и следить за изменениями кода страниц.

Мне очень важно твое мнение, с нетерпением жду ответа. А пока свяжусь со своим психоаналитиком, думаю у меня есть что ему сказать.

anonymous
()
Ответ на: комментарий от anonymous

Видел, что выкладывали базу рутрекера. Где его скачать

Опчик ляпнул бред, ты его поддерживаешь. Покажите базу, тогда посоветуем как парсить. Ты дамп не видел, зато парсер какой-то уже накорячил, стыдоба.

anonymous
()
Ответ на: комментарий от anonymous

Это я так тебе тонко намекнул, что VLC - Г, используй MPV.

Раз имея такой многомегабайтный код в VLC нет нужной тебе функции.

mpv удобно управляется клавишами, мало весит, легко расширяется плагинами, через lua можно писать обработчики.

anonymous
()
Ответ на: комментарий от anonymous

Не уважаемый. Я когда писал ответ - зашёл в гугл, вбил «рутрекер дамп базы», выбрал первую попавшуюся ссылку и перешёл на раздачу на рутрекер, в которой было описание формата и ссылки даже на утилиты под Windows для работы с дампом.

Было сказано, что дамп в формате XML, структура такая.

Что в раздаче я не смотрел, не зачем её скачивать - нужная информация для анализа представлена.

А что сделал ты, кроме непонятных высказываний?

Если автор темы приведёт ссылку на конкретную раздачу - можно говорить более предметно.

Код я не писал и не собираюсь, это дело автора, если представленных утилит под Windows, которые можно попробовать запустить в Wine, ему недостаточно.

Так что закрой рот и иди учи уроки, скоро конец и каникулы, а тебе ещё оценки в четверти подтягивать, а то жопа от отцовского ремня будет гореть.

anonymous
()
Ответ на: комментарий от kirill_rrr

А прикинь, если браузер больше не нужен, а поиск и скачивание/воспроизведение осуществляется посредством bash-скрипта.

Другой вопрос, кому это надо в наш век засилья GUI. )

krasnh ★★★
()
Последнее исправление: krasnh (всего исправлений: 1)
Ответ на: комментарий от krasnh

Прикидывал... На примере Либрусека. Года 3-4 эти 300+ гектар таскал, периодически пробовал копаться, но не зная что именно я хочу оттуда достать всё время выпадала всякий шлак, отстой, говнище и убогая графомания.

Так что без отрендериной страницы с описанием и комментами внизу база рутрекера будет бесполезной.

kirill_rrr ★★★★★
()
Ответ на: комментарий от kirill_rrr

без отрендериной страницы с описанием

Но ведь обычно, если касаемо фильмов, мы знаем, что хотим найти. Да, прошерстив тот же кинопоиск вначале. )
К тому же, в доступе уже есть и API кинопоиска, при желании и умении можно и его прикрутить.

krasnh ★★★
()
Последнее исправление: krasnh (всего исправлений: 1)
Ответ на: комментарий от LamerOk

Я написал граббер торрентов на rutracker.org. Это прототип я его допиливать пока не собираюсь, но любой может принять участие в доработке. Оказалось что он нормально парсится и даже ублюдский клауд капчу не выводит, если не задержку не ставить меньше 0.3 секунд.

Так можно magnet-ссылки собрать из тем определенного форума:

./rutracker_grabber.py -o links.txt "https://rutracker.org/forum/index.php?c=19"

Куда их можно вставить, чтобы по сидам и личам отсортировать и другие данные выдрать?

rtxtxtrx
()
Последнее исправление: rtxtxtrx (всего исправлений: 1)
Ответ на: комментарий от anonymous

Это выхлоп какой-то параши. Та база старая. Эти метаданные из магнет-ссылок можно выдрать (я думаю):

> Object.fromEntries(new URLSearchParams('xt=urn:btih:26ACC7D1A869C6597BD459A76C80FD908355A727&tr=http%3A%2F%2Fbt2.t-ru.org%2Fann%3Fmagnet').entries())

{
    "xt": "urn:btih:26ACC7D1A869C6597BD459A76C80FD908355A727",
    "tr": "http://bt2.t-ru.org/ann?magnet"
}

У них все раздачи тут лежат http://bt2.t-ru.org.

rtxtxtrx
()
Ответ на: комментарий от dmitry237

Звучит так же бредово как фраза «без кекса нет секса». API - это программный интерфейс приложения, это может быть что угодно, оно вообще не привязано к вебне, а CLI - это любая консольная дрисня

rtxtxtrx
()
Последнее исправление: rtxtxtrx (всего исправлений: 1)
Ответ на: комментарий от rtxtxtrx

API - это программный интерфейс приложения

Значит у онлайн-сервисов есть программный интерфейс. А CLI (или GUI) служит для удобной обработки запросов, чтобы пользователь не ковырялся с их синтаксисом, а вводил необходимые данные для получения нужного результата.

dmitry237 ★★★
()