LINUX.ORG.RU
ФорумTalks

Верификация данных


0

0

Имеется набор данных - значения некоторых показателей за некоторый период времени. Поставлена задача "верифицировать данные". Что означает эта формулировка, никто точно не знает. Вроде бы, нужно чисто формально, не вдаваясь в происхождение и значение этих данных, определить их достоверность. Например, если среднее значение показателя 10, какой-то один замер дает 100, а среднеквадратическое отклонение мало, то либо измерение ошибочно, либо данные намеренно фальсифицированы.

Как можно осуществить подобное? Какие есть методы?

> то либо измерение ошибочно, либо данные намеренно фальсифицированы

Ты точно это знаешь по условию задачи? Всякое бывает.

Я думаю, что для «верификации» всё же нужно иметь набор эталонных данных или хотя бы знать, как должны быть распределены величины.

Это лаба по матстату или суровый энтерпрайзъ?

Sphinx ★★☆☆
()
Ответ на: комментарий от Sphinx

>> то либо измерение ошибочно, либо данные намеренно фальсифицированы

> Ты точно это знаешь по условию задачи? Всякое бывает.

По условию задачи любое значение показателя, не проходящее некоторую процедуру верификации, подлежит индивидуальной проверке, посколько происхождение этого значения известно.

> Я думаю, что для «верификации» всё же нужно иметь набор эталонных данных или хотя бы знать, как должны быть распределены величины.

Я тоже так думаю, но ничего этого нет. Данные являют собой значения некоторых реальных статистических показателей.

> Это лаба по матстату или суровый энтерпрайзъ?

Это летняя практика.

plumbum
() автор топика
Ответ на: комментарий от anonymous

> чё, закончил среднюю школу и думаешь что теперь всё можно, да?

ага.

plumbum
() автор топика

Если я правильно понял условие - то график. Где слишком сильный выход за пределы интерполяции - под лупу..

Bod ★★★★
()
Ответ на: комментарий от Bod

> Если я правильно понял условие - то график. Где слишком сильный выход за пределы интерполяции - под лупу.

Да, это один из вариантов. Интересует, есть ли еще какие-либо способы.

plumbum
() автор топика
Ответ на: комментарий от plumbum

ИМХО, остальные способы производные от этого.
Взять среднее значение данных за эталон и провести эталонную верификацию каждого значения с этим эталоном используя какое-то заданное максимальное отклонение. Все, что превышает дозволенное отклонение - опять же под лупу.
Но это только в случае относительно небольшого процента отклонений. И если нужно выявить только максимальные по отклонению данные.
Та дал слишком общую задачу.
В любом случае, с графиком точнее и нагляднее.

Bod ★★★★
()
Ответ на: комментарий от Bod

> за эталон.. эталонную.. этим эталоном..

Что-то меня уже клинить начало..

Bod ★★★★
()
Ответ на: комментарий от anonymous

> алсо, не верится, что ты хотя бы не школьник

Я тщательно шифруюсь.

plumbum
() автор топика
Ответ на: комментарий от quickquest

Огромное спасибо. Судя по всему, это то, что нужно. Завтра на свежую голову посмотрю более тщательно.

plumbum
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.