LINUX.ORG.RU

Теория эксперимента: «усреднить» результаты нескольких экспериментов, учитывая их погрешности

 , теория эксперимента,


1

1

Приветствую.

Контекст — обычные студенческие физлабы, но хотелось бы сделать максимально «правильно».

Итак, имеется несколько экспериментальных результатов, представляющих собой арифметические выражения от показаний (нескольких) приборов, и соответствующие им «погрешности». Я не знаю, как это правильно называется с точки зрения статистики, но последние были посчитаны исходя из величины деления шкалы и классов точности приборов по известным правилам вида «относительная погрешность произведения ...». В каждом случае эти «погрешности» получились существенно разными, сами результаты тоже несколько отличаются.

Вопрос: как усреднить результаты и посчитать «погрешность» среднего (видимо, это называется стандартное отклонение...) с учётом вышесказанного? На пальцах — я хочу что-то вроде взвешенного среднего, и какой-то способ оценить погрешность того, что получится.

Дисклеймер: курсов матстата, теории вероятности, теории эксперимента и тому подобных у нас не было. Буду благодарен, если кто-то ответит более развёрнуто, чем «читать вон туда».

★★★★★

Последнее исправление: intelfx (всего исправлений: 2)

Если нужно усреднить, то тут много вариантов как усреднить: арифметич среднее, геометрич, по норме и т.д. Я бы взял квадратичную норму:

\sqrt{\sum{(x_i)^2}}

Но все зависит от того что за эксперимент и что нужно получить.

Zodd ★★★★★
()
Последнее исправление: Zodd (всего исправлений: 2)

я хочу что-то вроде взвешенного среднего

Их куча вариантов, мат. статистика тебе в помощь.

какой-то способ оценить погрешность того, что получится

Считай доверительный интервал, соответствующий доверительной вероятности с учётом коэффициентов Стьюдента, например: ©

курсов матстата, теории вероятности, теории эксперимента и тому подобных у нас не было.

А зря. Без них студент подобен «обезьяне с гранатой»™.

более развёрнуто, чем «читать вон туда».

Студенческий раздел форума метрологов. ©

quickquest ★★★★★
()

Правильно — выкидываешь на мороз неправильные измерения и оставляешь наиболее точное. А какое из них точное — дык думать надо и доказывать — это тебе не валёного славить.

Evgueni ★★★★★
()
Ответ на: комментарий от Evgueni

Правильно — выкидываешь на мороз неправильные измерения и оставляешь наиболее точное.


— Чего грузишься?
— Да вот, сделал несколько экспериментов и получился ужасный разброс значений.
— Балда! Надо было делать только один!

i-rinat ★★★★★
()
Ответ на: комментарий от quickquest

Считай доверительный интервал, соответствующий доверительной вероятности с учётом коэффициентов Стьюдента, например

А если у всех усредняемых результатов разные погрешности?

Их куча вариантов, мат. статистика тебе в помощь.

Я понятия не имею, как правильно, и понятия не имею, нужно ли здесь вообще «взвешенное» что-либо. В лабнике написано «отбрасывайте погрешности конкретных измерений, тупо берите среднее арифметическое и считайте стандартное отклонение». Но интуитивно кажется, что более точный результат должен сильнее влиять на результирующее «среднее». В этом и вопрос.

intelfx ★★★★★
() автор топика

В каждом случае эти «погрешности» получились существенно разными, сами результаты тоже несколько отличаются.

обычно бывает наоборот, а почему погрешности сильно отличаются? А разница в показаниях в пределы погрешности попадает?

А что за лаба? У нас на лабах бывало что старые приборы выдавали невесть что. Самый забавный случай когда мы кобальтовой пушкой светили и меряли поглощение гаммы в воздухе, а у нас выходил сразу ноль. Там распалось всё, а студенты сдавали старые работы хрен знает сколько лет с красивой затухающей экспонентой, преподаватель посмеивался и ставил зачеты, но некоторые настырные разобрали пушку и померяли счётчиком источник в упор, а там фон.

WerNA ★★★★★
()
Последнее исправление: WerNA (всего исправлений: 1)
Ответ на: комментарий от intelfx

А если у всех усредняемых результатов разные погрешности?

Усреднять нужно не всё подряд, а отдельно серии измерений по каждому прибору. Затем, на основании критерия Стьюдента © для средних значений и критерия Фишера © для дисперсий определяешь каким результатам можно доверять с априорно заданным уровнем значимости ©.

В лабнике написано «отбрасывайте погрешности конкретных измерений, тупо берите среднее арифметическое и считайте стандартное отклонение».

Дык, тут и думать ненужно!, делай как прописано в «лабнике».

Но интуитивно кажется, что более точный результат должен сильнее влиять на результирующее «среднее». В этом и вопрос.

Вот когда станешь «академиком от статистики», тогда и получишь право на «интуитивно кажется» :)

quickquest ★★★★★
()
Ответ на: комментарий от quickquest

Усреднять нужно не всё подряд, а отдельно серии измерений по каждому прибору. Затем, на основании критерия Стьюдента © для средних значений и критерия Фишера © для дисперсий определяешь каким результатам можно доверять с априорно заданным уровнем значимости ©.

У меня один прибор, в который я кидаю шарики разных диаметров, а потом вычисляю вязкость жидкости. Шариков много, у всех разный диаметр с разной погрешностью. Отсюда много слегка разных значений вязкости и совсем разных погрешностей измерения. Очевидно неправдоподобные я уже отбросил. Теперь хочу как можно более правильно посчитать итоговую вязкость и оценить точность такого подсчёта.

Дык, тут и думать ненужно!, делай как прописано в «лабнике».

Думать нужно. Нам за обоснованные усовершенствования методик эксперимента или обработки результатов отлы ставят. А за «как в лабнике» — только хор.

intelfx ★★★★★
() автор топика
Последнее исправление: intelfx (всего исправлений: 2)
Ответ на: комментарий от intelfx

Ну раз такео дело, то я бы построил нечто от диаметра, так чтобы это нечто линейная функция была от диаметра. Затем полюбовался бы на график, далее МНК, но перед этим выкинуть лишние точки, а они наверное там будут.

ну вязкость будет сидеть в угле прямой, что там за формула будет не знаю, но погрешность её тоже можно будет рассчитать

WerNA ★★★★★
()
Последнее исправление: WerNA (всего исправлений: 1)
Ответ на: комментарий от WerNA

Если бы это была линейная регрессия, вопросов бы не было (за метод Деминга, учитывающий ошибки по обеим осям, мне в своё время уже поставили отл). Но там конструктивная формула от объёма шарика и плотностей.

intelfx ★★★★★
() автор топика
Последнее исправление: intelfx (всего исправлений: 1)
Ответ на: комментарий от intelfx

У меня один прибор, в который я кидаю шарики разных диаметров

У тебя не один прибор, а столько, сколько разных шариков.

Каждый шарик нужно кидать много раз для получения серий измерений. А затем выбирать результаты, сосчитанные по сериям, например, по методу наименьших квадратов. ©

P.S. Влияние диаметра шарика на точность измерений можно оценить дисперсионным (однофакторным) анализом. ©

quickquest ★★★★★
()
Ответ на: комментарий от quickquest

Кидать один шарик несколько раз не получается, в этом специфика эксперимента. Там длинная колба, из которой раз в семестр выгребают все шарики.

А зачем МНК? У меня \eta = f(R, v), есть готовая формула.

intelfx ★★★★★
() автор топика
Последнее исправление: intelfx (всего исправлений: 1)
Ответ на: комментарий от intelfx

Но можно же построить линейную зависимость, может я туплю, ну там по осям там квадраты от чего-то строить или exp или невесть что, лишь бы однозначную.

Кидать один шарик несколько раз не получается, в этом специфика эксперимента. Там длинная колба, из которой раз в семестр выгребают все шарики.

ого, вот это уже интересно

WerNA ★★★★★
()
Последнее исправление: WerNA (всего исправлений: 1)
Ответ на: комментарий от intelfx

Кидать один шарик несколько раз не получается, в этом специфика эксперимента.

Ну, тогда мучайся и страдай, ибо твоя задача эквивалентна измерению длины удава слонёнками, мартышками и попугаями. © :)

quickquest ★★★★★
()
Ответ на: комментарий от quickquest

А ниточку привязать, если тонкая она не должна сильно влиять. А последний раз каждый шарик кидать без неё.

WerNA ★★★★★
()

Если по простому, то из 100% результатов отбрасываешь 25% максимальных и столько же минимальных результатов и остальное обрабатываешь привычным методом.

Вместо 25% может быть 10% или 30% или что угодно, в зависимости...

Отбрасывание части результатов нормально в статистике, это вот здесь https://ru.wikipedia.org/wiki/Квантиль ,а как-то подкручивать - ненормально.

anto215 ★★
()
Ответ на: комментарий от WerNA

А ниточку привязать...

Тут нужно знать в каких пределах методичка по лабе и препод допускают изменение методики измерений.

quickquest ★★★★★
()

Определись для начала с типом распределения своих случайных величин. А дальше книжку по теорверу и математической статистике в руки и вперёд с песней.

peregrine ★★★★★
()

Что на этот счёт говорит методичка? А здоровый чёрный сборник по лабораторкам с теорией больше не существует? :(

я кидаю шарики разных диаметров, а потом вычисляю вязкость жидкости

Я надеюсь, ты после каждого бросания шарика в этот «глицерин» ждал определённое время пока всё устаканится прежде чем бросить новый шарик? Иначе измерения вязкости у тебя будут показывать погоду на Марсе.

grem ★★★★★
()
Ответ на: комментарий от intelfx

за «как в лабнике» — только хор

Жесть какая-то оценку за это снижать. У меня однокурсник автоматизировал лабу по подсчёту частиц, подсоединив ненавистный счётчик к компу, а то до этого она 2 пары только измерений занимала, нужно было сидеть рядом с ним и секундомером.

grem ★★★★★
()
Ответ на: комментарий от grem

У нас эта лаба уже была с компьютерами. Тёплыми ламповыми компьютерами с 8086, монохромными жёлтыми CRT, MS-DOS 3.30 и программой примерно тех же лет создания. Только всё равно нужно сидеть две пары около установки.

intelfx ★★★★★
() автор топика
Ответ на: комментарий от grem

Что на этот счёт говорит методичка?

Методичка вообще ничего не говорит. «Отберите 20 шариков, проведите измерения для шести температур, для каждой температуры вычислите вязкость».

А здоровый чёрный сборник по лабораторкам с теорией больше не существует? :(

Жёлтый. Это он и есть — совокупность всех методичек по всем лабам.

Я надеюсь, ты после каждого бросания шарика в этот «глицерин» ждал определённое время пока всё устаканится прежде чем бросить новый шарик? Иначе измерения вязкости у тебя будут показывать погоду на Марсе.

Между окончанием полёта одного шарика и закидыванием второго проходило секунд десять. Я полагаю, за это время устаканится всё что можно.

intelfx ★★★★★
() автор топика
Ответ на: комментарий от peregrine

Я не хочу ботать теорвер и матстат вперёд курса ради одной лабы. У меня на это банально нет времени.

intelfx ★★★★★
() автор топика
Ответ на: комментарий от quickquest

Да понятно, что «всё говно». Я вроде конкретный вопрос спросил — есть ли какие-то более правильные методы, чем «отбросить приборные погрешности + среднее арифметическое + стандартное отклонение», в контексте вот именно этой лабы.

Метод с коэффициентами Стьюдента интересен (правдоподобен), правда, хотелось бы почитать про него в оригинале — а то в твоей статье половина картинок с формулами куда-то исчезла.

intelfx ★★★★★
() автор топика
Последнее исправление: intelfx (всего исправлений: 3)
Ответ на: комментарий от intelfx

Между окончанием полёта одного шарика и закидыванием второго проходило секунд десять. Я полагаю, за это время устаканится всё что можно.

Для подогретого глицерина? 10 секунд слишком мало, там пару минут ждать нужно. У меня однокурсник тоже почти сразу кидал шарики вслед, в итоге получил хрень какую-то, а не вязкость - до сих пор вспоминает :)

grem ★★★★★
()
Ответ на: комментарий от intelfx

Есть надёжный вариант: попросить тетрадь с лабами у старших курсов и посмотреть как там считали. Или у тех, кто уже успел её сделать, если такие есть.

У нас был чёрный лабник, в нём кусок теоретической части был об оценках погрешностей и вообще об измерениях.

grem ★★★★★
()
Ответ на: комментарий от intelfx

Вы определитесь: шашечки или ехать. Если измерения проводились на одной установке, то погрешности будут тем же. Если на разных - считайте отдельно для разных установок. Но лучше всего показать исходный «сырой» датасет с детальными комментариями, а то штатный телепат в отпуске.

ZERG ★★★★★
()
Ответ на: комментарий от grem

Есть надёжный вариант: попросить тетрадь с лабами у старших курсов и посмотреть как там считали. Или у тех, кто уже успел её сделать, если такие есть.

Увы, сейчас на ФУПМе вообще не принято хорошо делать лабы. Все съ5.1ывают из одного и того же довольно хреновенького источника.

Разумеется, ни о каких правильных оценках погрешности речи не идёт (вообще ни о каких оценках погрешности речи не идёт, потому как там для отвода глаз написана пара формул, а потом в выводе с потолка указана «погрешность» в 10%).

intelfx ★★★★★
() автор топика
Ответ на: комментарий от grem

Для подогретого глицерина? 10 секунд слишком мало, там пару минут ждать нужно. У меня однокурсник тоже почти сразу кидал шарики вслед, в итоге получил хрень какую-то, а не вязкость - до сих пор вспоминает :)

Ну... у меня вроде все значения плюс-минус ложатся на линию.

intelfx ★★★★★
() автор топика

http://phys-bsu.narod.ru/lib/mkt/mkt/204.htm

Метод оценки погрешности отсюда сойдёт?

Только там есть вопрос

Получите формулу для расчета относительной погрешности Е.

grem ★★★★★
()
Последнее исправление: grem (всего исправлений: 1)
Ответ на: комментарий от i-rinat

Так экспериментов или "(нескольких) приборов"? Разброс очевидно систематический. А в этом случае с усреднением средним квадратом не обойдёшься — думать и исследовать эти приборы надо.

По хорошему в случае разброса между "(нескольких) приборов" следует выбирать наиболее надёжное значение и приписывать систематическую неопределённость не меньше максимального разброса от него. Статистика безусловно тоже имеет смысл, но в случае _одинаковых_ _независимых_ измерений.

Evgueni ★★★★★
()

Для серий измерений с одинаковой вязкостью можно взять просто арифметическое среднее с выбросом тех значений, которые ушли дальше трёх сигм от него, ну и по идее разброс значений должен быть меньше приборной погрешности, посчитанной по классу точности приборов и по правилам распространения погрешностей. Потом по получившимся точкам построить график зависимости вязкости от температуры и его аппроксимировать теоретическим графиком методом наименьших квадратов, в правильных координатах, где он спрямляется, оттуда вытащить коэффициенты и их погрешности. Подставить коэффициенты в уравнение, вытащить оттуда вязкость для температуры, сравнить её со средней экспериментальной. Если разница укладывается в погрешность, всё зер гут.

dn2010 ★★★★★
()
Ответ на: комментарий от Evgueni

Я проглядел часть про "(нескольких) приборов".

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

А между тем человек дело сказал. Нужен лишь 1 эксперимент, но заранее спланированный, с оценками нужной точности (разных) исходных данных, чтобы не было глупых узких мест в процессе прослеживания ошибок к конечному результату.

В каждом случае эти «погрешности» получились существенно разными

Будь я лаб-лидом, первое бы спросил - почему? И ++ комменту Evgueni.

abvgdee
()
Ответ на: комментарий от Evgueni

Здесь два источника разброса: 1) какие-то случайные процессы и 2) неточность измерения диаметра шарика (который иногда вообще не шарик, там тупо берётся среднее от нескольких измерений диаметра).

Шариков несколько, все разные, кидаются друг за другом в один и тот же глицерин. Как поступают в этом случае?

intelfx ★★★★★
() автор топика
Последнее исправление: intelfx (всего исправлений: 1)
Ответ на: комментарий от intelfx

Шариков несколько, все разные

который иногда вообще не шарик,

Оставь только шарики, и только одного размера. Иначе непонятно, что ты вообще экспериментом проверяешь.

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

Это уже выполненный эксперимент. Ты подходишь, тебе выдают N шариков. Ты их измеряешь, каждый по нескольку раз, и получаешь такую классную величину, как средний диаметр. Потом закидываешь шарики с секундомером. Всё. Теперь эти результаты нужно как-то обработать.

intelfx ★★★★★
() автор топика
Последнее исправление: intelfx (всего исправлений: 1)
Ответ на: комментарий от intelfx

Если на всех остальных шагах не заботятся (даже вид не делают) о точности, от корректной статистической обработки результатов точности явно не прибавится.

Примерно как собрать схему из прецизионных компонентов, стабилизировать температуру, давление, влажность в изолированной среде, а потом измерять ожидаемые в пределах десятка вольт напряжения с помощью киловольтного вольтметра. Одного звена достаточно, чтобы всё запороть.

(Как будто ты это всё сам не понимаешь.)

i-rinat ★★★★★
()
Ответ на: комментарий от intelfx

Шариков несколько, все разные, кидаются друг за другом в один и тот же глицерин. Как поступают в этом случае?

А, стандартная глицериновая лаба. Много-много-много одинаково при одинаковой температуре глицерина покидать один и тот же шарик в одно и тоже место. Это будет одна точка — можно надеяться, что систематика там мала и основной вклад в разброс дают ошибки измерения aka в качестве результата брать среднее, в качестве систематической ошибки брать точность измерительных приборов — если она получается сильно меньше, чем среднеквадратичное отклонение от среднего, то эта тема для того, чтобы задуматься что было сделано не так. Если всё более-менее учтено, то среднеквадратичное отклонение и оценка систематики должны быть одного порядка.

Нарисовать точки на графике (вязкость от диаметра шарика или от температуры глицерина), приписать получившиеся ошибки, провести теоретическую прямую-кривую и пофигеть почему оно не сходится, если вязкость брать из методички (глицерин могут разбавлять, так как разные его проливают, а продукта на всех не напасёшься, но тссссс) — подогнать всё скажем методом наименьших квадратов. Если повезёт, то всё более-менее совпадёт.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 4)
Ответ на: комментарий от Evgueni

Много-много-много одинаково при одинаковой температуре глицерина покидать один и тот же шарик в одно и тоже место.

Так не получится. Один шарик можно кинуть только один раз. Хуже того, на пять температур есть всего 20 шариков. Ну и да, лаба уже прошла, данные собраны. Теперь из них надо сотворить что-то отдалённо приемлемое.

Это будет одна точка — можно надеяться, что систематика там мала и основной вклад в разброс дают ошибки измерения aka в качестве результата брать среднее, в качестве систематической ошибки брать точность измерительных приборов — если она получается сильно меньше, чем среднеквадратичное отклонение от среднего, то эта тема для того, чтобы задуматься что было сделано не так. Если всё более-менее учтено, то среднеквадратичное отклонение и оценка систематики должны быть одного порядка.

Если бы можно было кинуть каждый шарик много раз и усреднить для каждого шарика, я бы так и сделал.

Но, в любом случае. Допустим, я гипотетически покидал каждый шарик много раз, усреднил, получил разброс, он совпал по порядку с приборной погрешностью. Теперь для каждой температуры у меня есть несколько похожих точек, каждая со своим разбросом. Проверяем, что вязкость не имеет какой-то выраженной зависимости от радиуса. Допустим, не имеет. Дальше что? Их нужно опять усреднить, а чему равно отклонение полученного результата?

intelfx ★★★★★
() автор топика
Последнее исправление: intelfx (всего исправлений: 2)
Ответ на: комментарий от intelfx

Так не получится.

Плохо. Систематику придётся брать с потолка.

Проверяем, что вязкость не имеет какой-то выраженной зависимости от радиуса.

Естественно не имеет, т.к. вязкость — это характеристика жидкости. Размер имеет значение, если размер шарика становится сравним с диаметром сосуда — тогда формулу для времени падения нужно уточнять, точнее менять. Точки для разных шариков просто будут иметь разные ошибки. Совсем маленький шарик не прокатит, так как просто не утонет из-за поверхностного натяжения, а для большого нужно учитывать размер сосуда и падает он быстрее, поэтому для измерения есть некий оптимум.

А вот от температуры вполне себе имеет.

Повторение эксперимента нужно исключительно для подтверждения, что ничего внезапного не случается и все возможные неопределённости учтены.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: комментарий от Evgueni

Проверяем, что вязкость не имеет какой-то выраженной зависимости от радиуса.

Естественно не имеет

Я понимаю, что на самом деле не имеет. Если мы налажаем в эксперименте, то будет иметь, потому что все используемые физические законы приближённые и с кучей допущений.

И да ­— ну так чего делать-то? Предположим, что я идеальный экспериментатор :), прикинемся шлангом и предположим, что каждое измерение — это результат усреднения серии, а его приборная погрешность равна стандартному отклонению серии. Получаем несколько похожих точек с разными радиусами (и разными ошибками) для каждой температуры.

Что с этими измерениями делать дальше — в методичке не сказано. Сейчас покажу сами данные.

intelfx ★★★★★
() автор топика
Последнее исправление: intelfx (всего исправлений: 2)
Ответ на: комментарий от intelfx

Evgueni, вот: http://nbviewer.jupyter.org/github/intelfx/mipt-lab/blob/master/Курс 1 семест...

Данные на самом деле хреновые получились. Если не затруднит, посмотри и расскажи, где и насколько сильно мне надо отрубить руки я не прав, и что всё-таки делать с этими результатами.

intelfx ★★★★★
() автор топика
Последнее исправление: intelfx (всего исправлений: 4)
Ответ на: комментарий от intelfx

Немного не понял в чём проблема? Основное — очевидно, что с увеличением температуры вязкость падает. Я сам никогда не делал эту лабу, но неоднократно принимал, правда у школьников. Ничего сверхестественного там не требовалось — основное это то, что экспериментально получаются основные зависимости без особых требованиям к точности их получения. Упор делался на понимание обучающегося что именно он делает и что измеряет. Если были идеи на тему как улучшить измерение — это плюс, но их обычно не было.

Сделай один большой график и размести на нём все точки. В силу того, что ошибки (с твоих слов) систематические, то по идее не очень понятно как их обрабатывать с точки зрения статистики, но не будет сильно большой ошибки, чтобы при подгонке теоретической зависимостью притвориться, что эти ошибки статистические. То есть выполнить подгонку с помощью метода наименьших квадратов.

Evgueni ★★★★★
()
Ответ на: комментарий от Evgueni

Сделай один большой график и размести на нём все точки <...> не будет сильно большой ошибки, чтобы при подгонке теоретической зависимостью притвориться, что эти ошибки статистические

Окей. У меня каждой температуре соответствуют 3-4 точки. Их усреднять или как?

intelfx ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.