LINUX.ORG.RU

Теория эксперимента: «усреднить» результаты нескольких экспериментов, учитывая их погрешности

 , теория эксперимента,


1

1

Приветствую.

Контекст — обычные студенческие физлабы, но хотелось бы сделать максимально «правильно».

Итак, имеется несколько экспериментальных результатов, представляющих собой арифметические выражения от показаний (нескольких) приборов, и соответствующие им «погрешности». Я не знаю, как это правильно называется с точки зрения статистики, но последние были посчитаны исходя из величины деления шкалы и классов точности приборов по известным правилам вида «относительная погрешность произведения ...». В каждом случае эти «погрешности» получились существенно разными, сами результаты тоже несколько отличаются.

Вопрос: как усреднить результаты и посчитать «погрешность» среднего (видимо, это называется стандартное отклонение...) с учётом вышесказанного? На пальцах — я хочу что-то вроде взвешенного среднего, и какой-то способ оценить погрешность того, что получится.

Дисклеймер: курсов матстата, теории вероятности, теории эксперимента и тому подобных у нас не было. Буду благодарен, если кто-то ответит более развёрнуто, чем «читать вон туда».

★★★★★

Последнее исправление: intelfx (всего исправлений: 2)

Единственный правильный способ «всё учесть и не налажать» это бутстреп.

«Точность приборов» вводиться униформным распределением по последней цифре «точности» в перевыборке получившихся отсчетов.

Формулы по которым выводятся «конечные результаты» многократно прогоняются через перевыбоки и строиться оценка распределения для результата (это лучше всего делать, а не ограничиваться квантилями, тогда все «тонкие эффекты» станут заметны).

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

Тут к сожалению определяет не статистика, а систематика.

Ну и вообще физики знают ровно два статистических распределения: гаусс и экспонента (эксперимент подстраивается под получение хороших данных, а не наоборот), а по сему ужасно дремучи в статобработке ибо в подавляющем большинстве случае оно не нужно — всё описывает RMS.

Evgueni ★★★★★
()
Ответ на: комментарий от Evgueni

Понял, спасибо, задача треда исчерпана (хотя ответ на вопрос в исходной формулировке мне всё ещё интересен).

intelfx ★★★★★
() автор топика
Последнее исправление: intelfx (всего исправлений: 1)
Ответ на: комментарий от Evgueni

У меня эта лаба была автоматизирована через OpenCV с построением графика падения шарика и расчета скорости падения на равномерном участке падения.

psv1967 ★★★★★
()
Ответ на: комментарий от intelfx

Я уточнил, действительно, не нужно было ждать долго между падениями шариков, а вот ждать минут 5-10 после изменения температуры нужно.

grem ★★★★★
()

Ну давай попробуем в двух словах. Ошибки бывают статистические и систематические. Статистическая, это почти всегда \sqrt{N}, систематические оцениваются по косвенным данным. Скажем, если у тебя есть несколько методик подсчета одной и той же величины, то некую одну методику, самую достоверную, мы принимаем за среднее, а на основе всех остальных считаем систематики.

Следующий момент важен только если ты измеряешь значение некой функции при разных значениях аргумента. Т.е. ты делишь область входных значений на некоторые промежутки, и меряешь значение в каждом промежутке. По-английски эти промежутки называются «bins». В этом случае ошибки могут быть скоррелированными между бинами или нескоррелированными. Степень корреляции определяется хитрой линейной алгеброй, и я ее так не вспомню. И если с нескоррелированными ошибками все понятно, мы их применяем на каждый бин по отдельности, то с первыми все хитрее, надо строить корреляционную матрицу и вычислять nuisanse-параметры. Это отдельное хитрое колдунство, и я вообще не в курсе где о нем читать. Даже у нас мало кто знает как именно оно работает.

Чтобы получить общую погрешность надо квадратично сложить статистическую и все систематические погрешности.

Ну и наконец третий, самый хитрый момент, это объединение нескольких экспериментов в один. В общих чертах алгоритм такой: берем вероятностную функцию нашего измерения, обычно это гаусс с центром в центральном значении и с дисперсией в общую погрешность. Суммируем все такие функции соответствующие каждому измерению. Фитируем хи-квадратом на гаусса получившуюся сумму. Центральное значение фита - это наше среднее, дисперсия фита - это наша погрешность. Повторяем для каждого бина. Если в измерении много бинов, и много систематических скоррелированных погрешностей начинается треш и угар во мгле ада, и для студ лабы это уже будет перебор. И не забудь посчитать собственно хи-квадрат/Ndof. Если он сильно больше единицы, значит твои измерения несовместимы.

morse ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.