LINUX.ORG.RU
ФорумTalks

А вот подъехала забавная штуковина для отравления LLM и поисковых систем.

 , помножить на ноль


1

3

https://zadzmo.org/code/nepenthes/

В общем, генератор бреда заточенный для LLM poisoning в промышленных масштабах. В принципе сцылочку на него можно оставить в каком-нибудь hidden элементе, посетители сайта не увидят, а crawler непременно туда полезет и начнёт жрать мусор лопатами.

Понятно, что можно сделать намного лучше, gif-бомбы добавить, генератор бреда поприличнее, чтобы crawler принципиально не мог отличить от реального контента, но это же только начало, я надеюсь. :)

Затраты на генерацию бреда, который никакие нейросетки не смогут автоматически отличать от реального контента неизмеримо меньше чем затраты владельцев LLM на тренировку и фильтрацию. Таким образом, можно с минимальными усилиями помножить на ноль все потуги корпораций, несмотря на то, что у корпораций намного больше ресурсов.

Если к этому добавить аналогичные генераторы мусора для социалочек, какой-ниубдь замечательный scigen и т.п. то у корпораций нет шансов.

Интеренет и так уже по самое небалуйся загажен бессмысленным контентом, так что с этической точки зрения здесь нет никаких проблем. Да и нормальный человек всегда сможет отличить мусор от информации, в отличии от тупых нейросеточек.

★★★★★

Последнее исправление: Stanson (всего исправлений: 3)
Ответ на: комментарий от Stanson

Фирмы, распространяющие браузеры, точно узнают, например. А так же, в большинстве случаев, узнают операторы всяких счётчиков посещений. Всё остальные - не всегда, но могут попытаться получить информацию от первых двух, в том числе платно.

firkax ★★★★★
()
Ответ на: комментарий от firkax

Сильно сомневаюсь что телеметрия вплоть до хвостиков URL сливается. Хотя в Хроме наверно уже до такой степени доросло.

Купить конечно можно, но эта информация не будет актуальной.

В любом случае засрать источники бигдаты для нейросеток намного проще, чем владельцам нейросеток от этого защититься.

Stanson ★★★★★
() автор топика

Кажется уже давно эти генераторы работают

bloodmeri
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)