LINUX.ORG.RU

Коэффициент надежности статистического расчета

 , ,


0

2

Вот я в своей статистической программе использую для оценки надежности расчета формулу N/(1+N) от количества замеров. В некоторых случаях, если какой-либо расчет средних из самого множества то предварительно из N вычитаю один. И есть еще несколько вариаций.

Формулу я выдумал из головы, но наверняка в статистике есть название этому или подобным приемам. Вопрос, как такая штука называется, и что по этой теме читать? В частности, в некоторых случаях она не эффективна - как коэффициент для среднего взвешивания при оценках из множества множеств.

Ответ на: комментарий от no-such-file

Что такое «надёжность расчёта»?

если бы я знал правильное название, я бы не спрашивал.

Начнем производить экспериментальные замеры чего-либо. При количестве замеров стремящихся к большому количеству, вырисуется какая-то средняя и нормальное распределение этих замеров. Но пока есть только один замер, сложно сказать где будет эта средняя. И два и три замера то же не показатель. Количество замеров ограничено количеством обследуемых объектов, и не может увеличиваться до бесконечности.

А после есть еще пачка замеров того же самого, но произведенных каким-либо другим способом, или на другом множестве объектов. Вроде такие-же цифры, но чуть отличаются. Их центры как-то нужно сложить. И при сложении использую средне взвешенную от этого коэффициента надежности.

И этих пачек то же несколько, и все их складываю с этими коэффициентами взвешенности. Складывать со взвешенностью относительно количеством замеров будет не правильно, т.к. в этом случая обсчитываю скорее качественную характеристику, а не вероятностную. Вероятностная будет только в пределах одной пачки. Даже не знаю как это сформулировать...

victor79
() автор топика

Тебе критерий Стьюдента нужен что ли?

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от victor79

доверительные интервалы похоже тебе нужны.

hope13 ★★★
()

Эм....ну смотри

Статистические расчеты проверяются, например, в социологии через опрос респондентов (тестовые 50 человек) и потом путем соопределения с некоторыми аксиоматическими параметрами утверждается, что новая формула расчета валидна или не валидна.

Конечно, тебе уже вот Eddy_Em вполне себе предпложил и Критерий Стьюдента, и hope13 доверительные интервалы.

Я думаю что тебе надо проверять Z-распределение. Полезно будет и регрессию для таких кейсов. Но опять же: кто объект расчетов?

bookman900 ★★★★★
()
Ответ на: комментарий от Norgat

Хм...интересно.

Но я видел статью, в которой обосновали проблему 95% и 99% вероятности)) Для любой выборки причем.

bookman900 ★★★★★
()

Ты хочешь p-value, t-distribution или z-distribution? Или что?

x3al ★★★★★
()

Попробуй прочитать statistics without tears.

x3al ★★★★★
()

хи-квадрат, ти-тест (критерий стьюдента), регрессия, коэффициент корреляции - базовые инструменты.

но у них у каждого (практически) своя область применения.

AndreyKl ★★★★★
()
Ответ на: комментарий от victor79

если бы я знал правильное название, я бы не спрашивал.

Судя по описанию тебе нужен доверительный интервал, он показывает насколько то что ты намерял может отличается от «реальности». Впрочем посмотри ещё стат. значимость, т.к. если ты занимаешься обработкой результатов и поиском корреляций, то она покажет нашёл ты их в случайных флуктуациях или там и в самом деле что-то есть.

ya-betmen ★★★★★
()

Формулу я выдумал из головы

Классическое «ненужно».

но наверняка в статистике есть название этому или подобным приемам.

Статистическая значимость (со стандартными уровнями 10 %, 5 %, 1 %, и 0,1 %.) на основе кучи критериев, выбор которых зависит от задачи.

И есть еще несколько вариаций.

Порядковые статистики — на все случаи жизни.

quickquest ★★★★★
()
Последнее исправление: quickquest (всего исправлений: 1)
Ответ на: комментарий от bookman900

Я конечно понимаю, что я полный неуч в данной области, начал я изучать, что такое критерий Стьюдента, и... буду признателен, если объясните в доступных словах:

Что такое гипотеза? Нулевая гипотеза? Отсюда насколько я понимаю следует определение нулевого математического ожидания, чем оно отлично от простого математического ожидания?

Делаю я алгоритм прогнозирования потока информации. Объекты анализа - множества кусочков из потока (паттерны), которые я тестирую на подобие по различным свойствам. И различные варианты выборок тестирую на подобия свойств общих для этих выборок, для целей определения что это то же самое. При подобии больше чем некий коэффициент, эти множества можно объединить, и объединить их свойства с каким-то коэффициентом.

Пусть будет функция, получающая значение из тестируемой ситуации. Дальше собираем множество ситуаций, и применяем для каждой эту функцию, и получаем вероятности для каждого варианта результата.

А после эту функцию применяю к другому множеству. И результаты вероятностей для одинаковых вариантов нужно сложить, что бы было утверждение, что для каждой выборки полученной по прежнему же правилу, вероятности значений функции такие-то и с такой то ошибкой (хотя оценка ошибки пока вторична).

Мне в принципе такой вот нужен коэффициент взвешенного сложения. И складывать нужно даже слабые множества от двух или трех элементов. Сейчас я это считаю как N/(1+N). Для вероятностей, N беру как количество максимального по вероятности результата.

victor79
() автор топика

ищи робастные оценки

Deleted
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.