LINUX.ORG.RU
ФорумTalks

Реализация широкоформатного скрининга для знакомств

 , ,


0

1

Ранее концепция такого инструмента уже была описана https://www.linux.org.ru/forum/talks/10280719, затем было планирование инструмента, после чего итеративно выполнялись запуски для получения данных, проведения отладок, исправления багов и рассылки. Историю WSS можно прочитать здесь http://pikabu.ru/profile/Widescreen , там-же можно увидеть обзорные статистические данные и почитать Суть, сами коды (но не в самом актуальном состоянии) на GitHub https://github.com/evfratov/widescreen-screening . На данный момент инструмент недалёк до достижения физического проедела платформы vk.com и в нём почти не осталось багов, также достигнута эффективность позитивного ответа на запрос до 50%, хотя таким образом было получено всего 5 кандидаток. В процессе работы мне никто так и не помог и не приводил примеры своих инструментов.


Я ожидал там увидеть R и увидел. Но ты лучше про успехи расскажи!

P.S.: Вопрос, который интересует меня еще больше успехов - какого размера data.frame получается?

ptarh ★★★★★
()
Последнее исправление: ptarh (всего исправлений: 1)
Ответ на: комментарий от ptarh

Успехи - стабильно получаю после всех автоматических фильтров список из 3000 человек (имена-id-цифровые параметры), который весит 400 кб, всё остальное, типа коментов, списков групп и стен, занимает в сжатом виде 630 Мб. Методология состоит в ручной проверке топа списка. На первой итерации вручную просмотрел >200 страниц и сделал >100 запросов и сообщений, получил 1 удачный ответ, но из-за медленной развёртки отношений это дело было прекращено (хотя на корпоратив она может прийти), вторая итерация была прекращена из-за всплывшых лагов, третья итерация из 7 сообщений (ещё 3/4 было отсечено при просмотре) дала 4 положительных ответа, переписка продолжается, ибо они не в ДС. Блин, почему как только появляются результаты - сразу становится интересно и прекращается срач.

EVFR
() автор топика
Ответ на: комментарий от EVFR

Можно поиграться с data.table, любытно, шустрее ли будет data.frame на данной задаче. Впрочем, если тянет...

Как я понял, твоя методика пока дала из результатов только прокачку скиллов в R, а девок цеплять, посмотрев на статистику, всяко проще и быстрее по клубам, барам, да и вообще везде :)

ptarh ★★★★★
()
Ответ на: комментарий от ptarh

Дело не в data.frame, главная табличка вообще летает, все напряги только на выкачке данных и на громадных текстах со стен у полуспамерш.

Формально - да, но тут два огромных НО. Первое НО: для цепляния девок из клубов я вообще-бы не стал это делать, мне даже клубов не надо - два факультета, девок там куча и гораздо лучше, чем в клубах. Второе НО: это кого именно я ищу. Девки, которые из клубов, которых можно зацепить в рандомном месте или даже в институте - они с >99,95% не подходят, поскольку мне нужны технофашистки специфического вида (если такая аналогия будет яснее, чем активные сторонницы трансгуманизма), при этом с невысокой степенью неадекватности, поскольку целевая группа, помимо своей маргинальности (счёт идёт на десятки в лучшем случае), высоко сопряжена с радикальным феминизмом, транссексуальностью, антисексуальностью и агендерностью, а это мне как-то не надо.

EVFR
() автор топика

В процессе работы мне никто так и не помог и не приводил примеры своих инструментов.

Может быть, это потому, что нет никаких «примеров своих инструментов», а ты просто занимаешься никому не нужной фигнёй?

Sadler ★★★
()

1) так ты и ничего не делаешь, просто данные выкачиваешь

2) кроме того ты работаешь только с «целевой группой», а как ты её собрался отличать от «всех остальных» без этих самых «всех остальных»?

psv1967 ★★★★★
()
Ответ на: комментарий от hateyoufeel

Зачем?

Поверь, другие его не осилят.

jcd ★★★★★
()

А я думал, такие упоротые только в асашай есть, которые при помощи дата майнинга ищут бабу. Но в целом, идея интересная, даже более чем. Думаю, в будущем это будет стандартный функционал большинства сайтов знакомств.

Pyzia ★★★★★
()
Ответ на: комментарий от Pyzia

Думаю, в будущем это будет стандартный функционал большинства сайтов знакомств

Думаю вот тоже робота запилить для сайта знакомств, самому влом там сидеть. Залить пару фоточек, врубить робота и вперед, потом уже когда найдется которая отвечает можно на «ручной» режим переходить

mio ★★
()
Ответ на: комментарий от mio

Идея шикарна! Жаль, я далёк от прогерства.

Pyzia ★★★★★
()
Ответ на: комментарий от EVFR

мне нужны активные сторонницы трансгуманизма, но они обычно практикуют трансгуманизм, а это мне как-то не надо

fixed for teh graet justice

heilkitty ★★
()
Ответ на: комментарий от heilkitty

Не неси фигню, ок? Если так интересно - из всех пяти заняты три (в двух случаях заняты Ъ), с одной я поругался (не связано с сабжем), а другая недостаточно Ъ.

EVFR
() автор топика
Ответ на: комментарий от psv1967

1) Кто-то не прочитал ничего.

2) См. пункт 1.

Если серьёзно - бОльшая часть времени уходит на ручную проверку страниц, сделана пара сотен запросов и/или сообщений, переписка с некоторыми длится уже месяцы. Выборка минимизируется автоматическими методами без явных потерь информации, а дальше я ранжирую по степени Ъ (там есть и награды, и штрафы).

EVFR
() автор топика
Ответ на: комментарий от EVFR

кто то ничего не понял?

надо общаться еще и со случайно набранной _нецелевой_ выборкой, потому что иначе нет способа обоснованно отобрать эффективный показатель

PS ну типа пилотка есть у всех девушек связисток, это очень важно но ничего не решает на самом деле

ты понял?

psv1967 ★★★★★
()
Ответ на: комментарий от EVFR

OK, тебе виднее, кто там в вашей тусе Ъ, а кто недостаточно Ъ.

heilkitty ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.