LINUX.ORG.RU

Статистическая обработка данных в R

 , , ,


0

0

По согласованию с редакцией Linux Format выложил в открытый доступ «Статистическая обработка данных в R» — четвёртую часть из первого цикла статей по R (основной автор А.Б. Шипунов). По ссылке также лежат исходные коды команд к статьям в Rnw-формате и результаты их выполнения в pdf.

Из Википедии: R — язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом в рамках проекта GNU.

С сентябрьского номера в LXF выходит второй цикл статей. Основные главы: "Работа с двумя переменными" в двух частях (основной автор А.И. Коробейников), "Графический интерфейс к R" (я) и пока не дописанная статья про Data mining (основной автор А.Б. Шипунов).

Предварительно обсуждается возможность для издания третьего цикла, но для этого нужна поддержка читателей. Письма в редакцию (или мне, а уж я точно перешлю) с рассказами "как мне в жизни помогли статьи по анализу данных с R" и "зачем цикл нужно продолжать" были бы весьма кстати. Пожелания к третьему циклу также принимаются.

P.S. Если в тексте будет найдена ошибка, то дайте знать — исправлю. Сам текст немного отличается от журнальной статьи и в дальнейшем будет развиваться, возможно "до книги".

>>> Подробности

★★★★★

Проверено: anonymous_incognito ()
Последнее исправление: CYB3R (всего исправлений: 1)
Ответ на: комментарий от anonymous

>а вообще алгоритм несложный, вдобавок эмпирический --- может поэтому и не реализуют.

мне показалось, что этот МГУА разновидность генетических алгоритмов, с несколькими определёнными фитнес-функциями, я не особо понял

dimon555 ★★★★★
()
Ответ на: комментарий от dimon555

это их прородитель.... все нейросети и генетические алгоритмы ростут из него....

Amorthis
()
Ответ на: комментарий от dimon555

> прикладной регрессионный анализ? не

не всегда он может даже рядом встать с МГУА.... даже лучше так только в ограниченном круге задач он даст точность близкую к МГУА да и расчётов обычно при реализации больше

Amorthis
()
Ответ на: комментарий от plantago

>Вообще говоря, узок круг этих революционеров (c), на Западе GMDH не пользуются и живут как-то...

чего???? ты как то не потому западу ходил.... Ивахненко давно уже на англицком пишет и живёт давно не на украине и насколько я встречал буржуйских учёных никто не предлагал более или менее адекватной замены для большенства задач по оценке и прогнозированию просто этот метод чаще всего укрыт под лоском проприетарного ПО где делаться прогнозы по их "самым самым свежим алгоритмам разработанным в недрах супер лабораторий" а на самом деле либо GMDH в чистом виде либо вариация

anonymous
()
Ответ на: комментарий от anonymous

ну ортогональные полиномы как параметрическая модель не такая уж и панацея. Кроме того Вы считаете что подбор их параметров может осуществляться только "по Ивахненко"?

Ортогонализиовать данные, лишить их мультиколлинеарности можно и перед обычным регрессионным анализом. Ортогональные полиномы реализованы, аналогично присутствует куча эмпирических способов оптимизации. Критерий оптимизации можно взять такой же как у Ивахненко.

О чем спор не понимаю...

Вам обязательно алгоритм должен быть на R кодирован? Или те же полиномы можно взять готовую реализацию? Подгонять их тоже самому на R писать? Или можно взять библиотечную процедуру?

Само по себе явление перебора кусочков модели и надежда что решение пригодно не только для интерполяции, но и для экстраполяции все равно научным от этого не станет.

Ввиду глубокой эмпирики и наличия всех элементов в свободном доступе метод скорее всего и не реализовывают в R.

В конце концов раз это такой МЕТОД напишите биндинг в R к указанным Вам реализациям на си и фортране.

Мы все искренне скажем спасибо.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.