LINUX.ORG.RU

Проект Нейромодератор

 , ,


6

6

Точнее «нейрокрыса»: т.к. модераторских полномочий у меня нет, я лишь могу сделать скрипты, которые будут отписываться в специальный тред

Тема навеяна Бан без причины (комментарий)

Суть такова: буду пилить набор скриптов для «выявления подозрительных сообщений», обучать буду на текстах с LORа, которые были удалены модераторами.

Когда доделаю попрошу модераторов оценить качество работы сабжа.

На данный момент:

  • скачан архив тредов с января по май 2019;
  • идет первичный анализ данных;
  • идет подготовка к разметке данных.

Проблема: модераторы указывают причины вручную (или не указывают совсем), соответственно:

  • есть сомнения в качестве разметки,
  • текстовую разметку придется превращать в разметку для классификации;

Для решения проблемы сформированы:

Да, разделитель в файлах - точка с запятой.

Прошу модераторов поглядеть в файлы по ссылкам и внести свои пожелания по классам для разметки, корректировки таблицы соответствия.

cast @jollheef, @Shaman007, @maxcom

Апдейт 1 (13.06.2019)

По результатам обсуждения тут решил:

  • В качестве положительных примеров брать удаленные модераторам вручную сообщения, для которых указаны нормальные причины а не всякий треш.

  • В качестве отрицательных - оставленные модераторами собщения из тех же топиков, что и удаленные.

  • Если данных хватать не будет - добью неудаленными из других топиков.

Пришлось немного переформатировать датасет (датафрейм pandas), т.к. раннее там не было ссылок сообщение-топик.

В эти выходные сделаю обучающую выборку и попробую сделать бинарный классификатор.

Если получится, - на следующей неделе буду пилить нейромодератора нейроябеду.

Апдейт 2 (16.06.2019)

Апдейт 3 (16.06.2019)

Апдейт 4 (16.06.2019)

Апдейт 5 (17.06.2019)

Апдейт 6 (22.06.2019)

Апдейт 7 (22.06.2019)

Апдейт 8 (27.06.2019)

Апдейт 9 (30.06.2019)

Апдейт 10(05.07.2019)

Апдейт 11(14.09.2019)

Апдейт 12(08.12.2019)

Проект на GitHub

Тестовый тред

★★★★★

Последнее исправление: shkolnick-kun (всего исправлений: 18)
Ответ на: комментарий от BLOBster

дерьм*

Пользователь - Царь Рекомендация - бан

С уважением, Нейромодератор.

anonymous
()
Ответ на: комментарий от shkolnick-kun

Владимир

Имеются «тихие» и «буйные» ...
«Буйных» выявить намного легче «тихих».
Как будете выявлять «тихих»?

anonymous
()
Ответ на: комментарий от Deleted

Владимир

Каждого из нас «нейромодератор» отнесет к какой-либо категории ... /и меня тоже/

anonymous
()
Ответ на: комментарий от ya-betmen

Т.е. ты хочешь чтобы у нейросети сети были не только модераторские, но и твои личные заскоки?

Как-то так:

В лозунге «грабь награбленное» я не могу найти что-нибудь неправильное, если выступает на сцену история. Если мы употребляем слова: экспроприация экспроприаторов, то почему же нельзя обойтись без латинских слов?

Модерация модераторов, – новый уровень вахтёрства!

А если серьёзно, то:

Сообщение съел бобер

, или

абрвалг

, или

ЯННП (-7)

, или скажем

тупой ответ

очень похоже на «заскок»…

shkolnick-kun ★★★★★
() автор топика
Последнее исправление: shkolnick-kun (всего исправлений: 4)
Ответ на: комментарий от anonymous

Каждого из нас «нейромодератор» отнесет к какой-либо категории ... /и меня тоже/

Обученный на «негативной» выборке вряд ли отнесет к «положительному» классу.

anonymous
()
Ответ на: комментарий от Deleted

Идея витает, но я бы выделил ему специальный тестовый тред, чтобы не засорял основной.

peregrine ★★★★★
()
Ответ на: комментарий от anonymous

Владимир

«Буйных» флудеров выявить легко ...

anonymous
()
Ответ на: комментарий от Deleted

Если не написать сетку которая будет это читать - какой толк от этой битвы... Впрочем если первых две напишут, я слабаю скрипт который будет читать.

Suntechnic ★★★★★
()
Ответ на: комментарий от shkolnick-kun

А если серьёзно, то:
очень похоже на «заскок»…

Ты скорее всего научишь определять свое понимание «заскока». Живые модераторы это не оценят.

anonymous
()
Ответ на: комментарий от anonymous

научишь определять свое понимание «заскока»

Наоборот. ТС устраняет данные сообщения из выборки обучения. Сеть будет «не обучена» оценивать «подобным» образом.

Deleted
()

скорее, ты таким образом соберёшь психопрофили модеров. логики там мало, чаще всего.

Iron_Bug ★★★★★
()

Ты ещё анонимусов классифицируй по стилю письма

ZERG ★★★★★
()
Ответ на: комментарий от Iron_Bug

логики там мало, чаще всего

Если логики в работе модераторов мало, то у тебя ведь не составит труда найти достаточно примеров, подтверждающих твой тезис?

Deleted
()
Ответ на: комментарий от Deleted

Владимир

Запросто.
Когда меня «выперли» с форума, то модератор посетовал - «Даже не повеселились».
И затем свой же тред удалил.

anonymous
()
Ответ на: комментарий от hobbit

Владимир

Вы правы.
Мы все немного «поехавшие» ...

anonymous
()
Ответ на: комментарий от shkolnick-kun

В общем то да, но на мой взгляд если уж прикручивать автоматику, то она должна не автоматизировать текущие субъективные оценки, а как раз быть максимально беспристрастной.

ya-betmen ★★★★★
()
Ответ на: комментарий от anonymous

По-первых, я - не модератор и им никогда не был. Во-вторых ты сам попросил, а я тебе подсказал что надо для этого сделать. В-третьих подобные посты в ЛОР - это клоунада, что ты хотел добиться?

crutch_master ★★★★★
()
Ответ на: комментарий от crutch_master

Владимир

К нынешним моим постам вы имеете претензии?
Ранее чаще хамам /кстати не мне хамили/ говорил, что хамство это плохо?
Или в этом форуме хамство это - НОРМА?

anonymous
()
Ответ на: комментарий от crutch_master

Владимир

Таким тоном вы провоцируете другого.
Не хорошо ...

anonymous
()
Ответ на: комментарий от anonymous

У меня претензии к твоим постам. Ты засрал весь Development какой-то меланхоличной бессодержательной мутью. Иногда кажется что ты бот.

anonymous
()
Ответ на: комментарий от anonymous

Владимир

Спасибо за отзыв.
Во многом вы правы.
Много тем, которые нужно было даже не читать ...

anonymous
()
Ответ на: комментарий от crutch_master

Владимир

anonymous СПАСИБО!
Не буду больше сражаться с «ветряными мельницами» ...
Ну вот правда хамство многих сильно «коробит» ...
Видно их «Мама в понедельник родила».

anonymous
()
Ответ на: комментарий от anonymous

Речь не об вас шла ...

Владимир, это суровое русскоязычное линукс-комьюнити без СоС и геев-трансгендеров-инвалидов. Если бы не любовь к жирному троллингу тут бы вообще никто ничего не писал и треды висели бы с 0 ответов.

crutch_master ★★★★★
()
Ответ на: комментарий от anonymous

Не буду больше сражаться с «ветряными мельницами» ...
Ну вот правда хамство многих сильно «коробит» ...

Владимир, надо пытаться возглавить, а не бороться. Вы всё делаете не правильно.

crutch_master ★★★★★
()
Ответ на: комментарий от crutch_master

Владимир

Часто меня посещает помысел - «А не будет ли больше пользы Владимир если ты больше уделишь время работе и не будешь упражняться в „остроумии“ ».
Безусловно мне нужно поубавить «ослоумие».

anonymous
()
Ответ на: комментарий от crutch_master

Палю годноту. Как-то я задумал, а не плохо было бы, если новички в программировании помогли мне написать немного кода за опыт. Я озвучил эту идею и тогда страшные хамы ЛОРа кинулись смешивать меня с говном. Да, я даже не собирался еще ничего делать, а просто озвучил идею. И мне написала куча народа, человек 5, а то и больше. Конечно, ничего из этого не получилось хорошего по многим причинам, хоть и опыт был интересный. Суть не в этом. Не надо бороться, надо понимать суть явления и думать, как можно сделать гешефт. И я таки знал, что они будут смешивать меня с говном, всё именно так и задумывалось.

crutch_master ★★★★★
()
Последнее исправление: crutch_master (всего исправлений: 1)
Ответ на: комментарий от anonymous

См. сообщение выше. А острословие со всякой полемикой, демагогией и клоунадой очень нужна, когда нужно пропихнуть какое-нибудь техническое решение. Да, можно быть класным спецом, но будет очень обидно, если тебя задвинут говнокодеры. ЛОР, это всё-таки и про социум, а не чисто технические вопросы, которые и так можно нагуглить.

crutch_master ★★★★★
()

Кстати, заранее требую открыть исходники нейромодератора, чтобы любой мог его протестить, перед тем, как что-то писать.

crutch_master ★★★★★
()
Последнее исправление: crutch_master (всего исправлений: 1)
Ответ на: комментарий от anonymous

Владимир, письма обычно принято подписывать в конце. Постоянно кажется, что вы обращаетесь к какому-то Владимиру. Алишер.

Thetan ★★★
()
Ответ на: комментарий от crutch_master

требую открыть исходники нейромодератора

Очень смешно. Его «работа» будет сильно зависеть от выборки обучения и длительности обучения. Так что у каждого будет «свой» результат.

Deleted
()
Ответ на: комментарий от crutch_master

Владимир

Наверное форумов в которых профи обмениваются идеями, ... нет и не будет.
Ведь часто годная идея намного ценнее реализации.
Вот к примеру 1С 7.7.
Да устарела, да многое в ней реализовано слабенько, ... но ведь /ИМХНО/ их подход к разработке rapid системы - СУПЕР!

anonymous
()
Ответ на: комментарий от Thetan

Вы правы - исправлюсь.

Владимир

anonymous
()
Ответ на: комментарий от Deleted

Его «работа» будет сильно зависеть от выборки обучения и длительности обучения. Так что у каждого будет «свой» результат.

Ну почему, у него же будет где-то образ обученной нейросетки.

crutch_master ★★★★★
()
Ответ на: комментарий от crutch_master

у него же будет где-то образ обученной нейросетки.

«Память» нейросети не является частью исходников. Это результат её «обучения» (т.е. работы).

Deleted
()
Последнее исправление: Deleted (всего исправлений: 1)
Ответ на: комментарий от anonymous

Наверное форумов в которых профи обмениваются идеями

Так кто не даёт? И, я прошу заметить, если идею начнут смешивать с говном, то это однозначно победа. А если это будут делать на протяжении 10+ тредов по 1000 комментарий, то это - полный триумф. Правда у нас в победителях пока только bolgenos, система охлаждения и metaprog.

crutch_master ★★★★★
()
Последнее исправление: crutch_master (всего исправлений: 1)
Ответ на: комментарий от Deleted

Это результат её «обучения»

Хорошо. Она тоже должна быть или общедоступна, или в качестве сервиса, но первый вариант технически проще.

crutch_master ★★★★★
()
Ответ на: комментарий от Iron_Bug

таких примеров навалом, но мне лень тратить на это время.

Ясно, классическое «я только языком чесать умею».

Deleted
()
Ответ на: комментарий от Deleted

нет. я не делаю себе выписки о наглых удалениях. хотя их навалом. но я не буду сейчас лазить и выискивать что-то. представь себе, я это считаю пустой тратой времени.

Iron_Bug ★★★★★
()
Ответ на: комментарий от crutch_master

это суровое русскоязычное линукс-комьюнити без СоС и геев-трансгендеров-инвалидов. Если бы не любовь к жирному троллингу тут бы вообще никто ничего не писал и треды висели бы с 0 ответов.

Тут главное не перепутать причину и следствие. Потому что, может быть так, что вся эта «суровость» - это повышенное содержание хамства, троллинга, бреда и оффтопика в тематических разделах. Вот в Talks очень широкий круг тем, в т.ч. и с уклоном в конкретную тематику (ну там, всякие религиозные срачи о ЯП) - вот там можно троллить сколько душе угодно. А тематическим разделам эти не к лицу, и думаю, что отпугивает адекватных пользователей.

seiken ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.