LINUX.ORG.RU
ФорумJob

ищем знатока gnu core utils, linux, Perl & C++

 , , lingustics,


1

4

В научный проект в области компьютерной лингвистики ищется программист Perl, Bash, C++, java с для решения разнообразных задач в области text mining. Работа удаленная. Оплата 60 т.р. в месяц. Занятость не полная, не менее 20 часов в неделю.
Цель проекта - построение лингвистической поисковой системы, позволяющей провести статистические исследования тенденций развития естественных языков, провести различия в использовании конструкций языка в зависимости от пола, возраста, региона и т.д.

Необходимый опыт:

  • Знание утилит gnu core utils Linux ( sort, grep, tac, etc ) – 3-4 года
  • Способность писать на Perl 5, bash, java, C++. Из указанного списка, возможна разработка новых программ на Python или Ruby или Java вместо bash & Perl, но претендент должен быть способен зафиксить, если нужно, имеющиеся скрипты. Программы на Java не сложные, в основном, только поддержка. Знание С++: stl обязательно, фичи 11х не широко используются, кроме auto.

Задачи:

  • Написание отчетной системы, запускаемой по крон, о составе и этапах обработки, через которые прошли тексты,
  • Подготовка индексируемых текстов, программы фильтры в основном написаны, некоторые могут потребовать изменения.
  • Тестирование программы случайного упорядочения большого множества текстов.
  • Принять участие в доработке программы, выполняющей разбор языка запросов к строящемуся корпусу.

Условия:

  • Занятость около 20-30 часов в неделю. Претендент должен делать оговоренный объем в срок, из чего следует, что оплата будет производиться по факту сделанного;
  • Претендент понимает, что результатом работ являются не только программы, но и сами тексты корпуса, проиндексированные и готовые для использования в лингвистической поисковой системе;
  • Претендент имеет достаточно быстрый интернет – канал для доступа по ssh, который оплачивает самостоятельно;
  • Ход работ обсуждается по скайпу ( телефоном или сообщениями ), задачи ставятся в системе trac;
  • Время, удобное для обсуждений – с 11 до 14 часов, с 23 до 03 часов по Московскому времени;
  • Срок занятости в таком режиме предполагается до конца мая 2014 года, после чего возможен переход на полную занятость;


От претендента ожидается письмо с описанием своего опыта в областях:

  • Утилит командной строки для обработки данных и текста;
  • С++ - указать уровень знания языка и stl + boost, несколько слов о проектах, пример кода если есть что показать и претендент может объяснить, почему сделано именно так а не иначе и каким образом можно развить данный код;
  • Знание одного-двух языков из Bash, Perl, Python, Ruby
  • Знание языков разметки HTML, XML, XPATH;


Также интересен ( но не обязателен ) опыт областях:

  • Автоматического морфологического и синтаксического разбора, построения онтологий;
  • Машинного обучения и статистики – weka, liblinear, R;
  • Веб-программирования.


В случае интереса высылать письмо до 23 января по адресу: textmining@mail.ru

Спасибо и жду ваших писем и каментов.



Последнее исправление: anymouse (всего исправлений: 1)

В этом нет смысла. Все, что можно сделать в этой области, сделал Яндекс. Все хорошие специалисты в этой области уже работают - в Яндексе. У них на сайте можно скачать консольную утилиту, которая и так сделает все, что вам нужно - это такая малость, что они ее распространяют бесплатно. Зачем повторять чужой путь вместо того, чтоб двигать нашу цивилизацию вперед? Мы и так отстаем, мы уже должны осваивать другие планеты.

heisenberg ★★
()

ищем знатока

Отвечает Александр Друзь!

Оплата 60 т.р

я много неадекватных предложений в Job видел, но все равно произвело впечатление.

guest_star
()
Ответ на: комментарий от heisenberg

Судя по задачам и зарплатам это крайне похоже на Abbyy :)

Хотя, я могу сильно ошибиться в оценке их зарплат, да.

catap ★★★★★
()
Ответ на: комментарий от guest_star

я много неадекватных предложений в Job видел, но все равно произвело впечатление.

За 20часов в неделю на удалёнке вполне нормально.

DELIRIUM ☆☆☆☆☆
()
Ответ на: комментарий от DELIRIUM

за 120к (фулл-тайм если) одним человеком пятерых заменить, нормально да:)

И там написано что 20 часов это минимум, т.е. в реальности все 30. А то, что удаленка это не плюс, потому что в любом случае нужна вторая подобная вакансия чтоб нормально работать.

guest_star
()
Ответ на: комментарий от heisenberg

1) а mystem уже борщ варит, или нет ? 2) а зачем люди пытаются залезть на Эверест, если там уже был человек ? 3) давайте начнем с самых страшных проблем, например, голода и существования религий, прежде чем лететь к другим планетам ?

anymouse
() автор топика
Ответ на: комментарий от guest_star

Путин цены на водку поднял, но белочка все равно пришла.

Я поясню затею. Если человек заинтересуется деньгами и задачей, то, имея соответствующий опыт, за 20 часов в неделю не напрягаясь слишком сильно сделает, а если нужно будет до фуллтайма доходить, с работой все выходные, то просто это будет значить, что час работы такого специалиста стоит меньше. Но, мне хотелось бы пригласить специалиста, который знает как сделать и вероятность увеличения сроков меньше.

anymouse
() автор топика
Ответ на: комментарий от heisenberg

сделал Яндекс

до AI ему как до китая. Раком.

Они даже браузер (пере)делать нормально не могут...

emulek
()

но ведь все равно: с++ и буст это 1 человек, perl и анализ текста - 2ой человек, python + R + статистическое обучение - 3й человек. Я сильно сомневаюсь, что все это можно эффективно совмещать на более-менее серьезном уровне.

guest_star
()

Занятость около 20-30 часов в неделю. Претендент должен делать оговоренный объем в срок, из чего следует, что оплата будет производиться по факту сделанного;

Кто назначает сроки? Судя по всему деятельность близка к исследовательской, и поэтому зарплату никто не получит ;)

OxiD ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.