LINUX.ORG.RU

Утилита для подсчёта статистики замеров

 , , ,


3

2

Довольно часто решаю задачу поиска средних, худших, медианных результатов по набору данных представляющих числа в текстовом представлении. Каждый раз горожу лясик то на питоне, то ещё на чём что подвернется под руку...

Есть ли готовые простые шелл утилиты, для подобного нехитрого анализа, которые выдавали бы инфо в каком то стандартном (в идеале настраиваемом) варианте и ставились в два клика?

Upd: Говорят вот R надо юзать. Господа спецы, скиньте однострочник подсчёта медианы из данных со стандартного ввода.

Upd: Нашёл, мне нужен был littler

r -de "print(summary(X[,1])); stem(X[,1])" < delays
★★★★★

Последнее исправление: pon4ik (всего исправлений: 2)

Открой для себя R. Там есть некоторое количество способов генерации отчётов любой статсложности. Ищи по слову CRAN. Оттуда же можно скачать «Наглядная статистика. Используем R» Шипунова и компании

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 3)
Ответ на: комментарий от Evgueni

Наглость конечно - но можно, однострочник, например, для подсчёта распределения(50%, 75%, 99%, 99.9%) попросить наваять?

Я уже смотрю на R прямо сейчас, но, что-то не осилил как бы мне без написания скриптов сиё делать, иначе - это будет очередной лясик, просто на R.

pon4ik ★★★★★
() автор топика
Ответ на: комментарий от Evgueni

Да, все эти прекрасные функции я уже нашёл и мне определенно нравится, что это всё часть пакета из коробки :)

Не хватает адаптора под стандартный вход, иначе, смысл тогда использовать R - 99% процентов нужных мне расчетов пишутся за полчаса на питоне или есть в либах, а питон есть почти везде из коробки.

pon4ik ★★★★★
() автор топика
Ответ на: комментарий от pon4ik

Тебе нужно выучить три действия Прочитать файл:

x <- read.table("file1.txt",header=TRUE)
Посмотреть квантили:
quantile(x$колонка)
Выйти:
q()

Можно смотреть в сторону генератора отчётов, например, если тебе нужно текст формировать (включая результаты вычислений и графики), то подойдёт что-то вроде Sweave или knitr.

Можно R вызвать из python, воспользовавшись скажем rpy2.

И да, статистику лучше с самого начала делать правильно. На медузе недавно была статья на тему громких факапов при использовании для анализа данных, прости господи, Excel.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: комментарий от Evgueni

Спасибо.

Я уже открыл для себя littler(см. хэдпост). Это в точности то, чего я хотел :) R - мощь, для людей сделано.

pon4ik ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.