История изменений
Исправление Evgueni, (текущая версия) :
зная их я могу приблизительно посчитать сколько были бы отсутствующие оценки, а потом среднюю
А зачем? Зачем считать среднюю, если гипотеза работает? Иными словами: проверяешь гипотезу на «хороших данных» и предполагаешь, что она работает везде. Там где нет данных у тебя всё равно ничего и нет, а на «хороших данных» гипотеза и так работает. Так что используй для оценки более качественную выборку и всё. А вот если гипотеза не работает (что такое «работает» это отдельная тема и в темпе вальса тут её на форуме не изложишь, так как есть множество нюансов, которые я и сам все не знаю), то тебе придётся либо сконструировать другую гипотезу (которая учитывает какие-то дополнительные факторы, например, число проголосовавших), либо отказаться от гипотез вообще и просто выводить то, что есть.
IMHO лучше выводить все (три) независимые источника, а не одно число. А если числа нет, то для этого источника выводить оценочный результат посчитанный по твоей гипотезе с помаркой (оценка со ссылкой на алгоритм ей расчёта и статью на arxiv.org)
P.S. И да, волшебной палочки не существует. Если данных нет, то их нет. Это как в БД троичная система: Да/Нет/Не знаю.
Исправление Evgueni, :
зная их я могу приблизительно посчитать сколько были бы отсутствующие оценки, а потом среднюю
А зачем? Зачем считать среднюю, если гипотеза работает? Иными словами: проверяешь гипотезу на «хороших данных» и предполагаешь, что она работает везде. Там где нет данных у тебя всё равно ничего и нет, а на «хороших данных» гипотеза и так работает. Так что используй для оценки более качественную выборку и всё. А вот если гипотеза не работает (что такое «работает» это отдельная тема и в темпе вальса тут её на форуме не изложишь, так как есть множество нюансов, которые я и сам все не знаю), то тебе придётся либо сконструировать другую гипотезу (которая учитывает какие-то дополнительные факторы, например, число проголосовавших), либо отказаться от гипотез вообще и просто выводить то, что есть.
IMHO лучше выводить все (три) независимые источники, а не одно число. А если числа нет, то для этого источника выводить оценочный результат посчитанный по твоей гипотезе с помаркой (оценка со ссылкой на алгоритм ей расчёта и статью на arxiv.org)
P.S. И да, волшебной палочки не существует. Если данных нет, то их нет. Это как в БД троичная система: Да/Нет/Не знаю.
Исправление Evgueni, :
зная их я могу приблизительно посчитать сколько были бы отсутствующие оценки, а потом среднюю
А зачем? Зачем считать среднюю, если гипотеза работает? Иными словами: проверяешь гипотезу на «хороших данных» и предполагаешь, что она работает везде. Там где нет данных у тебя всё равно ничего и нет, а на «хороших данных» гипотеза и так работает. Так что используй для оценки более качественную выборку и всё. А вот если гипотеза не работает (что такое «работает» это отдельная тема и в темпе вальса тут её на форуме не изложишь, так как есть множество нюансов, которые я и сам все не знаю), то тебе придётся либо сконструировать другую гипотезу (которая учитывает какие-то дополнительные факторы, например, число проголосовавших), либо отказаться от гипотез вообще и просто выводить то, что есть.
P.S. И да, волшебной палочки не существует. Если данных нет, то их нет. Это как в БД троичная система: Да/Нет/Не знаю.
Исправление Evgueni, :
зная их я могу приблизительно посчитать сколько были бы отсутствующие оценки, а потом среднюю
А зачем? Зачем считать среднюю, если гипотеза работает? Иными словами: проверяешь гипотезу на «хороших данных» и предполагаешь, что она работает везде. Там где нет данных у тебя всё равно ничего и нет, а на «хороших данных» гипотеза и так работает. Так что используй для оценки более качественную выборку и всё. А вот если гипотеза не работает (что такое «работает» это отдельная тема и в темпе вальса тут её на форуме не изложишь, так как есть множество нюансов, которые я и сам все не знаю), то тебе придётся либо сконструировать другую гипотезу (которая учитывает какие-то дополнительные факторы, например, число проголосовавших), либо отказаться от гипотез вообще и просто выводить то, что есть.
Исправление Evgueni, :
зная их я могу приблизительно посчитать сколько были бы отсутствующие оценки, а потом среднюю
А зачем? Зачем считать среднюю, если гипотеза работает? Иными словами: проверяешь гипотезу на «хороших данных» и предполагаешь, что она работает везде. Там где нет данных у тебя всё равно ничего и нет, а на «хороших данных» гипотеза и так работает. Так что используй для оценки более качественную выборку и всё. А вот если гипотеза не работает (что такое «работает» это отдельная тема и в темпе вальса тут её на форуме не изложишь, так как есть множество нюансов, которых я и сам все не знаю), то тебе придётся либо сконструировать другую гипотезу (которая учитывает какие-то дополнительные факторы, например, число проголосовавших), либо отказаться от гипотез вообще и просто выводить то, что есть.
Исходная версия Evgueni, :
зная их я могу приблизительно посчитать сколько были бы отсутствующие оценки, а потом среднюю
А зачем? Зачем считать среднюю, если гипотеза работает? Иными словами: проверяешь гипотезу на «хороших данных» и предполагаешь, что что она работает везде. Там где нет данных у тебя всё равно ничего и нет, а на «хороших данных» гипотеза и так работает. Так что используй для оценки более качественную выборку и всё. А вот если гипотеза не работает (что такое «работает» это отдельная тема и в темпе вальса тут её на форуме не изложишь, так как есть множество нюансов, которых я и сам все не знаю), то тебе придётся либо сконструировать другую гипотезу (которая учитывает какие-то дополнительные факторы, например, число проголосовавших), либо отказаться от гипотез вообще и просто выводить то, что есть.