LINUX.ORG.RU

Выгрузка детальной статистики по голосованиям с мультивыбором

 , ,


0

1

Вот, на ЛОРе есть голосования. Некоторые из них довольно интересны. Некоторые из этих интересных голосований позволяют выбрать несколько вариантов ответа.

Может быть, можно сделать так, чтобы пользователи могли получить точное количество голосов по каждой комбинации ответов? Это позволило бы смотреть корреляции между ними. Тогда эти результаты можно было бы применить для исследований.

Возьмём это голосование: Какой системой управления версиями вы пользуетесь? (Какой системой управления версиями вы пользуетесь?). Ведь интересно было бы узнать, сколько пользователей Git пользуются ещё и Mercurial и наоборот. Сколько пользователей SVN пользуются другими системами. Чем пользуются 2 пользователя VSS помимо VSS. Сколько пользователей, выбравших «Не пользуюсь», выбрали ещё и другой вариант ответа.

Всё это можно было бы узнать по детальной статистике. Например: "(Git) = 100 голосов, (Git, SVN) = 500 голосов, (SVN, CVS, Mercurial) = 50 голосов, (Единая Россия) = 14000 голосов.

Разумеется, статистику нужно выгружать без ников и другой личной информации голосовавших. И лучше всего в машиночитаемом формате.

★★★★★

Последнее исправление: cetjs2 (всего исправлений: 3)
Ответ на: комментарий от u283

в опросе 15 вариантов ответа. ваши действия?

Это, если я не ошибаюсь, 32767 возможных комбинаций. Не так уж много.

Чего вы боитесь? Чрезмерных затрат серверных ресурсов? Так ведь у нас и так для каждого пользователя сохраняется его выбор по каждому голосованию в БД, раз он показывается самому пользователю. Надо всего лишь их суммировать и выдавать в машиночитаемом виде по запросу.

proud_anon ★★★★★
() автор топика
Ответ на: комментарий от maxcom

Можно выбрать вот этот, он, наверное, будет интересен многим: Как вы участвуете в жизни любимого дистрибутива?

Интересно будет, как ответили те, кто выбрал что-то кроме «не делаю ничего».

В принципе, из других последних опросов меня интересуют вот эти два:
С какими *nix, кроме Linux, вы сталкиваетесь в быту или на работе?
Какие памятки вы используете для найденного в интернет СПО, примеров настроек, статей и т. п.?

proud_anon ★★★★★
() автор топика
Ответ на: комментарий от maxcom

Ой, прошу прощения, что не заметил это сообщение вовремя. Большое спасибо. Сейчас посмотрим, что можно узнать.

proud_anon ★★★★★
() автор топика
Последнее исправление: proud_anon (всего исправлений: 1)
Ответ на: комментарий от cinyflo

И выбранные пользователем варианты ответа насильно заносить в комментарий о нём.

FRCTLL
()
Ответ на: комментарий от maxcom

Итак, благодарю за выгрузку. Действительно, из детальных данных можно узнать многое, что трудно понять только по количеству голосов за каждый пункт.

Напомню список вариантов:

?- show_all_options.
ФОРМАТ: Вариант [ID варианта]: число выбравших (процент от общего числа голосовавших)

Участвую в тестировании [1]: 170 (18,01%)
Не занимаюсь ничем из перечисленного [2]: 539 (57,10%)
Помогаю другим образом (ответ в комментариях) [3]: 85 (9,00%)
Отправляю денежные пожертвования [4]: 42 (4,45%)
Помогаю с переводом и документацией [5]: 62 (6,57%)
Поддерживаю русскоязычный сайт о дистрибутиве  [6]: 27 (2,86%)
Создаю арт-объекты [7]: 17 (1,80%)
Пишу статьи, отвечаю на вопросы других пользователей [8]: 253 (26,80%)
Состою в команде разработчиков, собираю установочные пакеты [9]: 56 (5,93%)

Всего проголосовавших: 944
Всего голосов: 1251
true.

В начале несколько замечаний по самому опросу:

  • Очень многие (ну, очень многие из тех, кто выбрал что-то кроме «ничего») указали, что участвуют в тестировании. Интересно, что они под этим подразумевают. Вполне вероятно, что «писали багрепорты». Интересно было бы провести опрос о том, кто занимается триажем багов в дистрибутивах.
  • Также очень многие выбрали пункт «пишу статьи, отвечаю на вопросы пользователей». В самом деле, под него подходит любой пользователь ЛОРа, кроме вендотроллей.
  • Некоторые пункты естественным образом коррелируют. Например, если человек — владелец русскоязычного сайта, то он, очевидно, пишет и статьи.

Вот какие интересные факты в целом удалось выяснить:

  • Один человек выбрал все варианты (включая «Ничего из перечисленного»). Я его в дальнейшем не учитывал.
  • Из выбравших вариант «Ничего из перечисленного» 18 человек выбрали ещё и другие варианты.
  • Правда ли, что арт в опенсорсе рисуют программисты? Оказалось, нет. Множества проголосовавших художников и членов команды разработчиков не пересекаются.
  • Только 40% разработчиков участвуют в тестировании дистрибутива. Это многое объясняет. (Шутка, конечно. Полагаю, разработчики сомневались, участвуют ли они в тестировании, если тестируют только свои программы).
  • Жертвуют ли деньги на дистр те, кто над ним работает? Только 4% владельцев русскоязычных сайтов (1 человек), 5% разработчиков, 13% художников и переводчиков.
  • Кстати о владельцах русскоязычных сайтов. Всего их 26. Только 2 состоят в команде разработчиков, 1 занимается артом и 1 шлёт деньги. Но только 2 не выбрало никаких других вариантов. 20 пишут статьи и отвечают на вопросы пользователей (остальные 6, видимо, почивают на лаврах. Шучу, шучу...), 13 участвуют в тестировании, 10 помогают с переводом и документацией.
  • Если выкинуть все такие голоса, в которых не выбрано ничего кроме «Тестирование», «Пишу статьи» и «Ничего из перечисленного», останется всего 235 человек. 9 из них почему-то отметили вариант «Ничего из перечисленного». Они, наверное, думают, что недостаточно трудятся во славу любимого дистра. И вот, голоса этих 235 человек распределяются более ровно, хотя художников и владельцев русскоязычных сайтов было и остается мало:
    ФОРМАТ: Вариант [ID варианта]: число выбравших (процент от общего числа голосовавших)
    
    Участвую в тестировании [1]: 79 (33,62%)
    Не занимаюсь ничем из перечисленного [2]: 9 (3,83%)
    Помогаю другим образом (ответ в комментариях) [3]: 84 (35,74%)
    Отправляю денежные пожертвования [4]: 41 (17,45%)
    Помогаю с переводом и документацией [5]: 61 (25,96%)
    Поддерживаю русскоязычный сайт о дистрибутиве  [6]: 26 (11,06%)
    Создаю арт-объекты [7]: 16 (6,81%)
    Пишу статьи, отвечаю на вопросы других пользователей [8]: 109 (46,38%)
    Состою в команде разработчиков, собираю установочные пакеты [9]: 55 (23,40%)
    
    Всего проголосовавших: 235
    Всего голосов: 480
    true.
    Это может обозначать одно из двух:
    • Либо каждый пользователь, занявшийся разработкой дистрибутива, постепенно втягивается во все сферы деятельности.
    • Либо просто активные разработчики дистрибутива не считают тестирование, документирование и перевод, а также статьи и консультации каким-то особым видом работы, а думают, что так или иначе они все этим занимаются. Впрочем, из «команды разработчиков» 40% не отметили никаких других вариантов.

    Вот такие выводы. Я, конечно, не специалист по статистике, но, по-моему, это довольно весело.

    В тред кастуется ins3y3d, автор опроса, может, он чего скажет.

    Для обработки результатов голосования был применен наколенный скриптик на SWI-Prolog: http://pastebin.com/iP36AU6t

    Пример сессии (вставлены комментарии):

    shell $ swipl
    Welcome to SWI-Prolog (Multi-threaded, 64 bits, Version 6.4.1)
    
    %(выкинуто приглашение)
    
    %Загрузить скрипт 
    ?- [ 'lorvote.pro' ].
    % lorvote.pro compiled 0,01 sec, 44 clauses
    true.
    
    %Загрузить данные
    ?- readvotes('vote.txt').
    true.
    
    %Показать все варианты выбора
    ?- show_all_options.
    ФОРМАТ: Вариант [ID варианта]: число выбравших (процент от общего числа голосовавших)
    
    Участвую в тестировании [1]: 170 (18,01%)
    Не занимаюсь ничем из перечисленного [2]: 539 (57,10%)
    Помогаю другим образом (ответ в комментариях) [3]: 85 (9,00%)
    Отправляю денежные пожертвования [4]: 42 (4,45%)
    Помогаю с переводом и документацией [5]: 62 (6,57%)
    Поддерживаю русскоязычный сайт о дистрибутиве  [6]: 27 (2,86%)
    Создаю арт-объекты [7]: 17 (1,80%)
    Пишу статьи, отвечаю на вопросы других пользователей [8]: 253 (26,80%)
    Состою в команде разработчиков, собираю установочные пакеты [9]: 56 (5,93%)
    
    Всего проголосовавших: 944
    Всего голосов: 1251
    true.
    
    %Пример факта vote
    ?- vote(X).
    X = [1] ;
    X = [2] ;
    X = [3] ;
    X = [2] ;
    X = [2] .
    %(перебор остановлен)
    
    %Пример голоса с тремя выбранными вариантами и их человеческими названиями
    ?- vote(X), length(X, 3), explain_vote(X, Names).
    X = [9, 1, 6],
    Names = ['Состою в команде разработчиков, собираю установочные пакеты', 'Участвую в тестировании', 'Поддерживаю русскоязычный сайт о дистрибутиве '] ;
    X = [1, 5, 3],
    Names = ['Участвую в тестировании', 'Помогаю с переводом и документацией', 'Помогаю другим образом (ответ в комментариях)'] ;
    X = [1, 8, 3],
    Names = ['Участвую в тестировании', 'Пишу статьи, отвечаю на вопросы других пользователей', 'Помогаю другим образом (ответ в комментариях)'] ;
    X = [5, 4, 3],
    Names = ['Помогаю с переводом и документацией', 'Отправляю денежные пожертвования', 'Помогаю другим образом (ответ в комментариях)'] .
    %(перебор остановлен)
    
    %Найти голоса со всеми 9 выбранными вариантами и выкинуть их
    ?- vote(X), length(X, 9), retract(vote(X)).
    X = [9, 1, 5, 6, 7, 4, 8, 3, 2] ;
    false.
    %Такой был один
    
    %Что делают художники помимо художества?
    ?- correlation(7).
    Всего выбравших "Создаю арт-объекты" [7]: 16 (1,70%)
    Из них выбрали также:
    * "Участвую в тестировании" [1]: 9
    	56,25% выбравших исходный вариант
    	5,33% всех выбравших этот вариант
    	0,95% всех голосовавших
    * "Не занимаюсь ничем из перечисленного" [2]: 1
    	6,25% выбравших исходный вариант
    	0,19% всех выбравших этот вариант
    	0,11% всех голосовавших
    * "Помогаю другим образом (ответ в комментариях)" [3]: 0
    	0,00% выбравших исходный вариант
    	0,00% всех выбравших этот вариант
    	0,00% всех голосовавших
    * "Отправляю денежные пожертвования" [4]: 2
    	12,50% выбравших исходный вариант
    	4,88% всех выбравших этот вариант
    	0,21% всех голосовавших
    * "Помогаю с переводом и документацией" [5]: 5
    	31,25% выбравших исходный вариант
    	8,20% всех выбравших этот вариант
    	0,53% всех голосовавших
    * "Поддерживаю русскоязычный сайт о дистрибутиве " [6]: 1
    	6,25% выбравших исходный вариант
    	3,85% всех выбравших этот вариант
    	0,11% всех голосовавших
    * Никаких других вариантов: 2
    	12,50% выбравших исходный вариант
    	0,21% всех голосовавших
    * "Пишу статьи, отвечаю на вопросы других пользователей" [8]: 11
    	68,75% выбравших исходный вариант
    	4,37% всех выбравших этот вариант
    	1,17% всех голосовавших
    * "Состою в команде разработчиков, собираю установочные пакеты" [9]: 0
    	0,00% выбравших исходный вариант
    	0,00% всех выбравших этот вариант
    	0,00% всех голосовавших
    true.

proud_anon ★★★★★
() автор топика
Последнее исправление: proud_anon (всего исправлений: 2)
Ответ на: комментарий от proud_anon

Ух ты, спасибо за труд и замечания! Очень занимательный анализ. Стоит, возможно, поразмыслить о визуализации для наглядности, чтобы не писать каждый раз свои выводы.

Что касается моего опроса, пункт «Поддерживаю русскоязычный сайт о дистрибутиве» видимо оказался лишним. Поломал вам часть статистики.

ins3y3d ★★★★★
()
Ответ на: комментарий от ins3y3d

Что касается моего опроса, пункт «Поддерживаю русскоязычный сайт о дистрибутиве» видимо оказался лишним. Поломал вам часть статистики.

Да нет, почему же лишний? Вполне хороший пункт, а главное, обозначает вполне конкретный вид деятельности: либо ты администратор или хотя бы модератор, либо нет.

А то, что при выборе некоторых пунктов опроса человеку автоматически хочется выбрать и другие — так это, можно считать, ограничение движка, который не позволяет, скажем, запретить выбрать пункт «Пишу статьи», если уже выбран пункт «Поддерживаю сайт».

Впрочем, голосования — не главная фича ЛОРа (или таки главная?), так что это не особенно важно.

proud_anon ★★★★★
() автор топика
Последнее исправление: proud_anon (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.