LINUX.ORG.RU
ФорумTalks

Вопрос знатокам математической статистики

 


0

2

Насколько заслуживают доверие методы статистического анализа на множестве данных о голосовании?

Что кто может сказать о расчетах Шпилькина.

Какие известны слабые стороны подобных расчетов.

Что делать если все это правда?


Методы статистического анализа всегда заслуживают доверия, так как известно, что статистика — наука точная :)

Другое дело, что не всегда гипотезы, закладываемые в основу стат. модели, в конкретном случае отражают реальность.

Что касается голосования, то довольно часто гипотеза о нормальном распределении (или его деривативов) оказывается вполне приемлемой, поэтому когда мы видим «ненормальную» картину, то впору задуматься, истинно ли это «случайный» процесс, или кто-то внёс в него значительные коррективы.

С другой стороны, в статистике нет «красивых» чисел, окромя пи, е и других «некруглых», поэтому когда мы видим в статистической картине странные значения на круглых цифрах, это стопудово «ложь, пи...ь и провокация»

Так что стат. анализу упомянутого многоуважаемого господина однозначно можно доверять.

Sahas ★★★★☆
()
Последнее исправление: Sahas (всего исправлений: 1)
Ответ на: комментарий от Sahas

Что касается голосования, то довольно часто гипотеза о нормальном распределении (или его деривативов) оказывается вполне приемлемой

Скажем так, любое отклонение от нормального требует объяснения. Иногда объяснение находится, например в сильно дифференцированных по какому-то признаку странах, распределение может быть двугорбым, сложением двух нормальных распределений, например в Канаде, где население бывает англоговорящим и франкоговорящим, со своими приоритетами. То же самое в странах, разделённых по религиозному признаку — протестанты/католики, христиане/мусульмане, сунниты/шииты (хотя в последнем случае бывают проблемы с честным подсчётом голосов ;)).

gremlin_the_red ★★★★★
()

Что касается слабых сторон любого статистического анализа, то, как я уже написал, это — обоснованность выбора гипотезы.

Предполжим, в одном государстве есть всего два города: Вилларибо и Виллобаджо, и жители этого государства хотят выбрать и конституционно закрепить единственно расово верный способ мытья посуды. При этом в Виллобаджо большинство за ручное мытьё, а в Вилларибо — за эксплуатацию машинного труда. В результате, если мы построим распределение отданных за конкретный способ мытья голосов по явке одновременно в этих двух городах, то почти наверняка увидим двугорбое распределение. Т.е. гипотеза о нормальности (одногорбовости) здесь не применима.

Правда, это довольно редкая и нетипичная ситуация для «нормальных» выборов.

Sahas ★★★★☆
()
Последнее исправление: Sahas (всего исправлений: 2)
Ответ на: комментарий от gremlin_the_red

Ага, только что про это написал :)

Sahas ★★★★☆
()

Что делать если все это правда?

«Если» тут лишнее :)

А вот «что делать» — очень хороший вопрос, со времён Чернышевского на него так и не сумели дать исчерпывающий ответ...

Sahas ★★★★☆
()
Ответ на: комментарий от Sahas

А вот «что делать» — очень хороший вопрос, со времён Чернышевского на него так и не сумели дать исчерпывающий ответ...

Егор Летов же указал оба выхода для честных ребят, правда, по нынешнему УК, озвучить их не совсем законно ☺

gremlin_the_red ★★★★★
()
Ответ на: комментарий от turtle_bazon

Был когда-то такой анекдот:

Международные соревнования по выжиманию сока из стограммового лимона. Выходит здоровый бугай-американец, жмет - 90 граммов сока. Под аплодисменты зала скидывает футболку, на груди татуировка «USA». Выходит японец, жмет, 99 граммов. Под овации скидывает кимоно, там татуировка «karate». От СССР выходит худенький мужичок в очках, жмет - 200 граммов. Под шокированное перешептывание зала снимает курточку, на майке надпись «ЦСУ СССР»

vaddd ★☆
()
Ответ на: комментарий от cvs-255

У неё, говорят, конкурент появился. Который переворачивает стакан и говорит, что так и было.

gremlin_the_red ★★★★★
()
Ответ на: комментарий от cvs-255

все новые анекдоты - это слегка переделанные старые

vaddd ★☆
()

Какие известны слабые стороны подобных расчетов.

  1. выбор гипотезы, иногда волюнтаристский.
  2. выбор метрики, иногда неадекватный задаче, например, статистики пассажиропотоков на метриках французских и британских ж.д. ©.

Насколько заслуживают доверие методы статистического анализа на множестве данных о голосовании?

На классические 146% :)

quickquest ★★★★★
()

Какие известны слабые стороны подобных расчетов.

Не учитывает психологию людей. Рост лояльности с явкой легко объяснить стокгольмским синдромом на фоне добровольно-принудительной явке и нездоровой госпропаганде.

KillTheCat ★★★★★
()

Думайте сами. Если людям предложить на выбор съесть или конфетку или какашку.
Тоже нормальное распределение будет?

Bad_ptr ★★★★★
()
Ответ на: комментарий от KillTheCat

Стандартное распределение — это всего на всего следствие наличия множества объектов исследований на которых действуют примерно одинаковые силы и законы. Психология у человеков тоже примерно одинакова, так что ЦПТ рулит независимо от её наличия/отсутствия.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 4)

Что делать если все это правда?

Взять данные и расчёты Шпилькина, повторить и убедиться в их надёжности самому.

Evgueni ★★★★★
()
Ответ на: комментарий от turtle_bazon

Во времена Марка Твена было плохо с статистическим образованием. С ним и сейчас плохо, но это не мешает как минимум некоторым разобраться с вопросом и понять, что это хороший и крайне годный инструмент, если им правильно пользоваться.

Evgueni ★★★★★
()

Ответы в простейшем учебнике по статистике получишь :) Ты просишь сейчас объяснить слишком многое.

lochness
()
Ответ на: комментарий от Bad_ptr

Думайте сами. Если людям предложить на выбор съесть или конфетку или какашку. Тоже нормальное распределение будет?

Будет какое угодно, включая нормальное. Потому что мнение о том, что считать конфеткой, а что какашкой на выборах - сугубо субъективное и тоже будет распределяться непредсказуемо )

vaddd ★☆
()
Ответ на: комментарий от Bad_ptr

Тоже нормальное распределение будет?

Да, а с чего ему быть другим? Только горб будет очень крутым, но и всё, нормальным оно от этого быть не перестанет, и всем законам статистики прекрасно подчинится. Если, конечно, результаты считать честно.

gremlin_the_red ★★★★★
()

Советую обратиться не к «soviet» литературе, а к буржуинской разжеванной, например отэтой https://www.amazon.com/Whos-1-Science-Rating-Ranking/dp/069116231X

И читая книжечку сходить по ссылочкам из разделов про выборы человеками себе властей.

nikitos ★★★
()

Насколько заслуживают доверие методы статистического анализа на множестве данных о голосовании?

Заслуживают достаточно сильно.

Что кто может сказать о расчетах Шпилькина.

Его расчет лежит в пределах реально ожидаемых показателей.

Что делать если все это правда?

Как будто это что-то меняет. Суть везде одна и та же. Просто тут совсем топорно и убого сделано, у «цивилизованных» работают более тонко (до тех пор пока не происходят казусы типа Трампа, когда начинают работать не менее убого через пропаганду), но суть повторю одна и та же.

vtVitus ★★★★★
()
Ответ на: комментарий от gremlin_the_red

Не знаю, я придерживаюсь такой философии — «не сотвори себе кумира». Ни один метод, ни одно правило нельзя возводить в абсолют. Возможно оно работает не всегда.
Надо анализировать условия, доказывать что оно тут применимо и т.д.

В случае с выборами понятно, что в свободном обществе, где нет ограничений свободы слова, не происходит каких-то чрезвычайных событий и т.д. и т.п. вполне ожидаемо нормальное распределение.
Понятно что в России выборы фальсифицируют, есть даже мнение что их специально фальсифицируют очень грубо и топорно, хотя могли и подогнать картину к более правдоподобной.

Но это всё нифига не значит что во всех случаях надо свято верить в нормальное распределение как в конечную истину.

Bad_ptr ★★★★★
()
Ответ на: комментарий от Bad_ptr

В случае с выборами понятно, что в свободном обществе, где нет ограничений свободы слова, не происходит каких-то чрезвычайных событий и т.д. и т.п. вполне ожидаемо нормальное распределение

Абсолютно не нужна ни свобода слова, ни свободное общество, ничего. Нормальность распределения ничего не говорит о справедливости выборов. В абсолютно несвободном обществе, с бессменным диктатором, с идеологической обработкой с детства, с тотальной цензурой, с населением, искренне любящим своего диктатора, с бегемотом в роли «соперника» на выборах. всё равно, если честно считать голоса, распределение будет около нормального. Просто этот нормальный колокол будет сильно смещён в сторону 100% Методы статистики ничего не могут сказать о таких нарушениях проведения выборов, как недопуск кандидатов, как неравный допуск к агитации, как принуждение к голосованию и тому подобное. Ими можно обнаружить только вбросы/приписки.

gremlin_the_red ★★★★★
()
Последнее исправление: gremlin_the_red (всего исправлений: 1)
Ответ на: комментарий от gremlin_the_red

Это смотря по каким параметрам строить кривую.

Ну а если допустим в городе есть завод + воинская часть + куча бюджетников их всех на автобусе везут на участок голосовать и они там всю кривую портят. Потому как явка «без принуждения» низкая.

Bad_ptr ★★★★★
()
Ответ на: комментарий от Bad_ptr

и они там всю кривую портят

Нет, не портят. Когда ты это поймёшь, поймёшь и то, почему распределение при честном подсчёте будет нормальным.

gremlin_the_red ★★★★★
()
Ответ на: комментарий от gremlin_the_red

Так, подожди.

Допустим такая теоретическая ситуация:
Некие выборы, некий участок, пришло проголосовало 10 человек за разных кандидатов, потом пришло проголосовало 50 человек за одного кандидата.
Как это будет выглядеть и чем это будет отличаться если эти 50 человек не приходили, а были «вброшены».

Bad_ptr ★★★★★
()
Последнее исправление: Bad_ptr (всего исправлений: 1)

В 90-е годы очень любили повторять о том, что некий товарищ (швед, кажется), «подсчитал» статистически, что Шолохов не может быть автором «Тихого Дона»! Только глухой не слышал об этом. В то же время есть свидетельства в пользу того, что именно Шолохов был автором и никто другой. Кажется, сейчас это уже не оспаривается.

С тех пор я очень и очень осторожно отношусь к результатам всяких экзитполов, соц.опросов и прочих наукообразных вещей касательно того, что относится к людям, хотя сам по образованию прикладной математик, а теория вероятностей была моим любимым предметом в университете, особенно нравился учебник Ширяева.

dave ★★★★★
()
Ответ на: комментарий от dave

а теория вероятностей была моим любимым предметом в университете,

...но потом я краем уха неправильно услышал об _одном_ случае ошибочного применения каких-то статистических методов

Anonymous ★★★★★
()
Ответ на: комментарий от Anonymous

не потом, а прямо во время этой самой учебы

dave ★★★★★
()
Ответ на: комментарий от Bad_ptr

Как это будет выглядеть

А ты точно понимаешь, что такое статистика? Это будет одна из десятков тысяч записей в том массиве информации, к которому и применили методы статистического анализа.

и чем это будет отличаться если эти 50 человек не приходили, а были «вброшены»

Ничем. Статистика не работает с одиночными записями.

gremlin_the_red ★★★★★
()
Ответ на: комментарий от dave

В 90-е годы очень любили повторять

Случайно, не между передачей про НЛО и сеансом Кашпировского (да, я знаю. что в 90 Кашпировского уже не было, но мысль, думаю. понятна)?

gremlin_the_red ★★★★★
()
Ответ на: комментарий от gremlin_the_red

Статистика не работает с одиночными записями.

Т.е. голосование массы людей внутри участка гауссом не проверяется, здесь статистика не работает, а голосование участков внутри страны гауссом проверяется, тут статистика работает. Так?

Bad_ptr ★★★★★
()
Ответ на: комментарий от dave

В 90-е годы очень любили повторять о том, что некий товарищ (швед, кажется), «подсчитал» статистически, что Шолохов не может быть автором «Тихого Дона»!

Это лоооол. Гейр Хьетсо (только он норвежец) статистически пытался доказать авторство «Тихого Дона» именно Шолоховым! Между прочим, его методику сильно критиковали, как сторонники плагиата, так и его противники.

gremlin_the_red ★★★★★
()
Ответ на: комментарий от gremlin_the_red

Воспринимаю как дерзость юного человека

dave ★★★★★
()
Последнее исправление: dave (всего исправлений: 1)
Ответ на: комментарий от Bad_ptr

Ну с чего-то надо начинать. А то сейчас ты просишь показать тебе решение квадратного уравнения, а сам даже не умеешь складывать и вычитать. не то. что умножать и уравнения решать.

gremlin_the_red ★★★★★
()
Ответ на: комментарий от dave

Еще раз, единственный человек, который в 90е использовал для анализа Тихого Дона статистику — Гейр Хьетсо. И он доказывал авторство Шолохова. Другие исследования в этой области стали появляться в начале нулевых. Так что кто тебе повторял, остаётся загадкой.

gremlin_the_red ★★★★★
()

Что делать если все это правда?

Выкапывать из схрона ППШ дедушки-партизана )

Harald ★★★★★
()
Ответ на: комментарий от turtle_bazon

Никто не мешает в этом вопросе разобраться. В случае Шпилькина, который выкладывает подробную процедуру и данные это элементарно. Если бы серьёзные косяки были, то так как тема горячая и интерес к ней значительный, давно бы уже накопали.

А по методам обмана с помощью неправильного использования статистического аппарата давно уже написано десятки годных популярных книг, чего во времена Самуэля Клментса не было.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 2)
Ответ на: комментарий от Evgueni

При чём тут оправдание? Это правда жизни. С ней ничего не поделать.

turtle_bazon ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.