LINUX.ORG.RU
ФорумJob

Ищется разработчик R на отдельную задачу

 


0

4

Добрый день. Ищется разработчик R на проект связанный с прогнозированием наступления сезонных событий по метеоданным.

Требуется написать программу на языке R, которая: - получит выборку исходных данных - оценит влияние различных факторов на дату наступления сезонного явления и на его силу, - на основе оценки построит прогноз наступления явления различными методами с использованием обучающей выборки, - оценит точность методов прогнозирования, - с использованием лучших методов построит прогноз на текущий на 2016 год. Город не важен. Важен рабочий опыт c R. Возможны уточнения в постановке задачи. Вознаграждение от 10 000 рублей. Подробности по адресу pb собака aport.ru



Последнее исправление: PavelB_ (всего исправлений: 2)

А чем не устраивает обычный прогноз погоды? У него примерно такая цель и есть, как описано.

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

Обычный прогноз погоды

Биологические явления, которые предполагается прогнозировать связаны с погодой, но не только с ней. Поэтому нет возможности использовать только прогноз погоды

PavelB_
() автор топика
Ответ на: комментарий от unikum

Согласен с Вами. Если Вам интересно и Вы решали подобные задачи - напишите в почту Ваши условия, обсудим.

PavelB_
() автор топика
Ответ на: комментарий от iVS

Может там за три дня можно успеть (пока условия нечеткие что бы решить подъемная ли задача).

psv1967 ★★★★★
()
Ответ на: комментарий от unikum

В R для анализа статистики есть всё... Ну кроме возможности работать с массивами данных не влезающими в оперативную память.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: комментарий от Evgueni

В R для анализа статистики есть всё...

Однако, чтобы в этом «всём» грамотно ориентироваться, необходима очень крутая мат. подготовка. В поставленной задаче это и есть самое главное требование, IMHO.

Jurik_Phys ★★★★★
()
Ответ на: комментарий от Evgueni

Ну кроме возможности работать с массивами данных не влезающими в оперативную память.

И это есть. Из последних решений это SparkR.

unikum ★★★★★
()
Ответ на: комментарий от Evgueni

Уже и это прикрутили в виде потоковых алгоритмов. Например RMOA:)

psv1967 ★★★★★
()
Ответ на: комментарий от unikum

С 1998 года немного накопилось «скриптов» :)

psv1967 ★★★★★
()
Ответ на: комментарий от Jurik_Phys

1) Особенная математическая подготовка скорее будет вредить, нужна скорее «математическая интуиция» в области алгоритмов ML.

И эти алгоритмы (не конкретные реализации) довольно примитивные надо сказать. Все сводиться к многомерке и как конкретно алгебраически описали плоскость делящую случаи и пространство в которое случаи отобразили довольно ортогонально, пока ты можешь представить геометрические свойства этой плоскости и пространства.

2) А вот возможность быстро разбираться в прикладной области где делаешь в данный момент анализ требует неслабого кругозора.

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

Особенная математическая подготовка скорее будет вредить, нужна скорее «математическая интуиция» в области алгоритмов ML.

И эти алгоритмы (не конкретные реализации) довольно примитивные надо сказать.

нудаканешна :)))

Другое дело, что за такие огромные деньги самым честным будет дать заказчику действительно полезный совет:
самому освоить R, и безо всякого ML задействовать из коробки сезонную ARIMA с экзогенными факторами

Bell
()
Ответ на: комментарий от psv1967

Я не пистонист и даже готов указать на редкий случай, что ARIMA в R реализован(а?) гораздо полнее, чем в любых питоновских библиотеках. А что думать не надо, так это только тем, у кого накопилось скриптов с 1870 года :)

Bell
()
Ответ на: комментарий от Bell

1) Ввиду того, что питон это язык общего назначения, в нем действительно приходиться любой алгоритм реализовывать куда «полнее» чем в R.

Большинство пакетов R это алгоритм + реализация стандартных методов R для него

2) Для любого кто хоть раз видел, что показывает predict() для ar() на реальных данных, проблемы _практического_ применения таких результатов обычно не стоит. Особенно для прогноза «на сезон вперед» :)

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

Погоду на сезон вперед и не прогнозируют. Это уже называется «климат». У погоды прогнозный горизонт дней 10 в лучшем случае. А вот сезонность каких-нибудь продаж хорошо получается даже простой ARIMA - проверено.

Насчёт того, что «любой алгоритм приходится реализовывать»: если не знать о наличии библиотек, то конечно придется самому :) А если знать, то... пока у меня лишь один пример того, что в R сделано полнее Питона, и много обратных. Ещё в R красивей графика (ggplot2).

Bell
()
Ответ на: комментарий от Bell

1) Хорошо получается сезонность продаж... Ну и что, что не в этот день, а в следующий... Ну и что, что ошибка 30%... Плавали, знаем :). С такой же эффективностью сезонность продаж простой сверткой данных по календарю получается.

2) Еще раз (судя по всему это осталось непонятым) --- в питоне любой алгоритм приходится реализовывать более «полно», чем в R.

Причина не в «библиотеках», а в том, что питон это язык общего назначения. Тогда как R фактически реализованный в рамках компилятора-интерпретатора схемы DSL в который просто добавить алгоритм и описать стандартные методы. Все остальное сделает написанная в этом самом DSL экосистема.

А все эти «библиотеки» смешно и несерьезно. В крайнем случае можно просто коннектор к R написать, или использовать готовый.

Экосистему методов и объектов и способов работы с ними в R нарабатывали несколько десятков лет (он многое потянул из сред-предшественников), причем по большей части «не за деньги».

Так что если не пытаться «делать вдоль» («программировать на фортране» в R), то R более чем достаточен для любой обработки данных и быстрой расшивки узких мест встраиванием низкоуровневого кода. Просто надо читать base и понимать для чего куча высокозанятых людей потеряли время и написали каждую из этих функций. Код компактный и легко модифицируемый + именно под данные написан, а не «во имя программы».

PS и еще нет полноценного REPL

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

Из последних негативных моментов, в сравнении с пистоном, упоминали отсутствие поддержки GPU. И это отчасти правда. Поддержка CUDA есть в полутора пакетах и без бубна не заводится (то версия не та, то путь не тот).

unikum ★★★★★
()
Ответ на: комментарий от unikum

Ну если это не поддержка...

https://developer.nvidia.com/hiplar

Конечно заставить всех писателей прописать в зависимости своих творений использование матричных операций будет довольно трудно :) но говорить о отсутствии поддержки слишком сильно.

ЗЫ собственно все по зависимостям отсюда https://cran.r-project.org/web/packages/Matrix/index.html вполне акселерируется (когда есть смысл естественно)

psv1967 ★★★★★
()
Последнее исправление: psv1967 (всего исправлений: 1)
Ответ на: комментарий от unikum

Я дум, что GPU под R не особо и нужно. GPU окупается на уровне более цельных и специализированных задач. В интерактивной среде внезапно захотеть перемножить матрицы - больше времени уйдет на пересылку туда-сюда. Пример таких цельных проектов - нейропакеты. Конечно, и под R есть H2O, и может к нему даже можно прикрутить GPU. Так ведь и в экселе некоторые извращаются, не говоря про Матлаб.

Bell
()
Ответ на: комментарий от unikum

Ну вот lme4 акселерированный через вызовы matrix, textminer, gdistance, CoxBoost, kknn, randomForest.ddR, rARPACK, mboost, text2vec ....

Да если так уперлось можно функции от матрикса повтыкать практически везде... но, надо помнить что в задачах обычного размера это все даст только тормоза.

psv1967 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.