LINUX.ORG.RU
ФорумTalks

Расскажите про соцсети

 


0

3

По смыслу пост скорее в developers, но линукс тут никаким боком, так что в толксы.
Можно ли в соцсетях (лицокнига, дуров, линкед) собирать статистику и делать аналитику? Скажем, образование подписчиков. Или религиозные убеждения. Или средний стаж на одном рабочем месте. По открытым данным, разумеется - но как-нибудь автоматизированно?

EDIT: Ага, API по линкеду я нашёл. Уже хорошо.

★★★★★

Последнее исправление: Xellos (всего исправлений: 2)

Конечно, можно. И делают. У всех соцсетей сейчас очень богатые API и запросов можно делать очень много даже бесплатно. Другое дело, что многие указывают фигню всякую, их нужно отсеивать.

CYB3R ★★★★★
()

А зачем тебе такая статистика?

torvn77 ★★★★★
()
Ответ на: комментарий от Deleted

Это не имеет значения. Задача может стоять «как люди себя позиционируют», а может стоять как «этим людям в этом контексте нет резона говорить неправду».

Xellos ★★★★★
() автор топика
Ответ на: комментарий от Xellos

Резон говорить не правду есть, потому что скажем напишу я правду. а в пятницу люблю ходить в бар такой-то.
И всё. клофелинщица знает где на меня можно вести охоту.
(А охоту она на меня поведёт потому что парой месяцев ранее я написал восторженый и самое главное правильный отзыв о телевизоре с диагональю два метра.

Одним словом старая китайская мудрость. сокровища показываем себе, а гостям войска и министра.

torvn77 ★★★★★
()

Скажем, образование подписчиков. Или религиозные убеждения. Или средний стаж на одном рабочем месте.

Мне вконтакте 99 лет, 3 класса образования, резко негативный к религии безработный. Что тебе это даст?

J ★★★★★
()
Последнее исправление: J (всего исправлений: 1)

У VK есть API: https://new.vk.com/dev/methods

Временных меток в отдаваемых данных особо нет, кроме времени создания постов например.

По ВКшному API - в целом ок, но баги ребята не правят годами. Так что под некоторые вещи надо говорить привет костылям.

Norgat ★★★★★
()

Да, на прошлой работе писали такое для работодателя. Модуль собирал все данные с пользователей соц. сетей через API и анализировал и группировал их по открытым данным (не все можно получить через API).

znenyegvkby
()
Ответ на: комментарий от Deleted

Вопрос в том насколько большой. Как бы есть правило 95%, большинству людей плевать на приватность, пока жаренный петух не клюнет. Разве что девушки любят скрывать возраст, а вот свои взгляды обычно наоборот все выпячивают.

KivApple ★★★★★
()

Да, практически все соцсети предоставляют API (правда каждое со своими ограничениями). По-дефолту (нашару), сможешь отковырять только публичную инфу, но за денежку есть опции для маркетологов - там можно копнуть глубже. Только там ничего интересного. Разве что поохотится на ботов, но это быстро наскучивает.

ioway
()
Ответ на: комментарий от Deleted

Дак там огромный процент не соответствующих реальности данных.

Наоборот, в полу-приватных сообществах процент ложных данных гораздо выше.

ioway
()
Ответ на: комментарий от ErasimHolmogorin

Во первых я написал что клофелинщице нужен телевизор, а не я.
А во вторых я не про себя писал, а вообще к примеру.

torvn77 ★★★★★
()
Ответ на: комментарий от KivApple

Теоретик? Довольно мало людей заполняют все графы, а из тех, что таки заполняют, ещё меньше тех, кто заполняет правдиво.

Deleted
()
Ответ на: комментарий от Deleted

Дак там огромный процент не соответствующих реальности данных.

Ты бы сразу ссылки на статистику давал и тд.

xtraeft ★★☆☆
()
Ответ на: комментарий от Deleted

Все графы не заполняют, но многие заполняют. Из моего списка друзей вконтакте, я не знаю ни одного человека, у которого, например, неверно заполнено поле про школу/ВУЗ. Да, у некоторых вообще не заполнено. Но это просто потому что они не хотят, чтобы их нашли одноклассники/одногруппники. У всех остальных заполнено. Также у многих заполнены поля про отношение к алкоголю/курению, религиозные убеждения. Опять же обычно они более-менее совпадают с реальностью (из тех, кого я знаю лично, по крайней мере). Не стоит недооценивать тягу людей к эксбиционизму. Иначе бы всякие инстаграммы бы не взлетали бы. А у тебя просто круг общения состоит из людей очень внимательно относящихся к своей приватности. Таких меньшинство.

Опять же регулярно всплывают всякие скандалы типа акции по поиску в соцсетях порно актрис с помощью специального приложения. Так или иначе это факт - большинство людей вываливают очень много информации о себе в Интернет, хочешь ты этого или нет.

Да, если у тебя весь твой круг общения состоит из одних IT-шников, то процент может быть ниже. Но это лишь частные случаи.

KivApple ★★★★★
()
Последнее исправление: KivApple (всего исправлений: 2)
Ответ на: комментарий от KivApple

А у тебя просто круг общения состоит из людей очень внимательно относящихся к своей приватности

Нет.

большинство людей вываливают очень много информации о себе в Интернет

Большинство - это сколько? 60-70 процентов? Да и эти 60-70 процентов не вываливают всю информацию. А сколько там правдивой информации - вообще никто не знает.

Не стоит недооценивать тягу людей к эксбиционизму

Не стоит её переоценивать. Вопреки бытующему мифу, людям скорее свойственно скрывать многое о себе, нежели выставлять всё напоказ. Под сокрытием я имею в виду не только просто умалчивание, но и намеренное или неосознанное искажение инфы.

Deleted
()
Ответ на: комментарий от Deleted

Я ведь не делаю утверждений вида «Дак там огромный процент не соответствующих реальности данных.». Вот хотелось бы узнать подробнее про огромный процент и каким образом ты это посчитал.

xtraeft ★★☆☆
()
Ответ на: комментарий от Deleted

Вбил рандомное имя. Выбрал свой город (иначе в топе списка какие-то известные личности, которые по-любому всё заполнили). Указаны братья и сёстры, семейное положение.

Выбрал второго рандомного человека. Указано в кого он влюблён, сын, ВУЗ, начальная и средняя школа.

Выбрал третьего рандомного человека. Указаны братья и сёстры, домашний адрес, школа и войсковая часть.

Выбрал четвёртого. Указаны братья и сёстры, место работы, школа, ВУЗ, религия и куча другой информации.

Выбрал пятого. Указана сестра, мобильный телефон, ВУЗ, религия, длинный список мест работы.

Надоело.

Большинство людей таки выкладывают много информации. Да, не всю, да заполняют разные графы. Но ничего не мешает сделать выборку только по тем, кто указал данные. Результат будет репрезентативен, потому что параноиков мало (и они никому кроме спецслужб не интересны).

Касательно правдивости результатов - вот что-то я сомневаюсь, что человек, у которого указано 10 мест работы специально сидел и придумывал правдоподобные данные. Данные по религии/отношению к алкголю/etc в моём списке друзей в большинстве случаев близки к реальности, для рандомных результатов поиска проверить их достоверность не могу. Бывают ложные данные в списках братьев/сестёр, некоторые девушки иногда страдают фигнёй и пишут туда своих близких подруг.

KivApple ★★★★★
()
Ответ на: комментарий от KivApple

Вбил рандомное имя, выбрал свой город. Через одного профили тупо не заполнены. А остальные заполнены, как правило, только в графах учебных заведений и города, естественно.

Deleted
()
Ответ на: комментарий от KivApple

Бывают ложные данные в списках братьев/сестёр, некоторые девушки иногда страдают фигнёй и пишут туда своих близких подруг.

А также в графе учебных заведений (когда человек пишет какой-нибудь СПбГУ вместо задрищенского колледжа), жизненных ориентиров, отношения к вредным привычкам, и т.д. Создавая витрину себя в соцсети, люди любят её приукрашивать.

Deleted
()
Ответ на: комментарий от Deleted

IRL так и есть. Люди бояться и скрывают информацию (попробуй подойти к рандомному человеку на улице и спросить банальное имя - велик шанс, что тебя пошлют). Но в сети почему-то этот рефлекс не действует. Наверное, потому что большинство людей думает лишь о друзьях, заходящих к ним на страничку. К тому же не видит какой-то угрозы в том, чтобы выдать своё место учёбы или работы (ведь если такое спрашивают на улице - это неадекватно и скорее всего вопрошающий задумал недоброе, а тут никто не спрашивает).

Я по твоей методике (искать рандомных людей) пошёл. И у 4 из 5 пользователей указано достаточно много информации. И я сомневаюсь, что много людей будет сидеть и тщательно выдумывать список мест работы или учёбы. Обычно те, кто бояться, что их надут бывшие одноклассники/одногруппники (есть среди знакомых парочка) просто не указывают эти поля, а не заполняют левыми данными. Но так делают немногие, потому что у большинства причин скрываться от бывших одноклассников/одногруппников нет.

KivApple ★★★★★
()
Ответ на: комментарий от Deleted

4 из 5 найденных мною людей указали, что окончили ВУЗы моего города. Ни одного МГУ я там не встретил. 1 из 5 не указал ничего.

KivApple ★★★★★
()
Ответ на: комментарий от KivApple

Но в сети почему-то этот рефлекс не действует

Действует, хоть и слабее.

И я сомневаюсь, что много людей будет сидеть и тщательно выдумывать список мест работы или учёбы.

Омг, что там тщательно выдумывать-то?

Deleted
()
Ответ на: комментарий от Deleted

Касательно жизненных ориентиров, вредных привычек и т. д. - тут люди скорее не преукрашивают действительность, а занимаются самообманом. Так что по сути дела можно примерно считать это правдой. Если человек указал что не пьёт, то вряд ли он будет перед новым знакомым хвастаться вчерашней пьянкой.

KivApple ★★★★★
()
Ответ на: комментарий от KivApple

тут люди скорее не преукрашивают действительность, а занимаются самообманом

Это одно и то же.

Так что по сути дела можно примерно считать это правдой. Если человек указал что не пьёт, то вряд ли он будет перед новым знакомым хвастаться вчерашней пьянкой.

Что за бред я читаю?

Deleted
()
Ответ на: комментарий от Deleted

Проще всего не указывать никаких данных. Если же указывать, то проще указать реальные, чем придумывать. Меньше действий требуется банально. А у того же ВУЗа требуется как минимум рассчитать правдоподобные года обучения.

Я вижу смысл указывать в качестве ВУЗа что-нибудь топовое, но таковых анкет среди 5 выбранных мне не попалось (вряд ли ВУЗ из моего города может считать топовым). Какой им смысл выдумывать, в каком нетоповом ВУЗе они учились? Не проще ли указать реальные данные.

KivApple ★★★★★
()
Ответ на: комментарий от Deleted

Что за бред я читаю?

Я имею ввиду, что если человек занимается самообманом, то это таки влияет на его поведение, как в сети, так и IRL. И во многих ситуациях можно считать, что данные правдивы.

KivApple ★★★★★
()
Ответ на: комментарий от KivApple

Если же указывать, то проще указать реальные, чем придумывать. Меньше действий требуется банально. А у того же ВУЗа требуется как минимум рассчитать правдоподобные года обучения.

Даже не знаю, смеяться с такой бредятины, или плакать от жалости.

Deleted
()
Ответ на: комментарий от KivApple

если человек занимается самообманом, то это таки влияет на его поведение, как в сети, так и IRL

Не влияет, по определению самообмана.

Deleted
()
Ответ на: комментарий от Deleted

Ну я там трафик покупал по разным выборкам, который нормально конвертился по нишам. В любом случае, нельзя делать выводы об «огромном проценте», не имея данных кроме мизерной случайной выборки.

xtraeft ★★☆☆
()
Последнее исправление: xtraeft (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.