В научный проект в области компьютерной лингвистики ищется программист Perl, Bash, C++, java с для решения разнообразных задач в области text mining. Работа удаленная. Оплата 60 т.р. в месяц. Занятость не полная, не менее 20 часов в неделю.
Цель проекта - построение лингвистической поисковой системы, позволяющей провести статистические исследования тенденций развития естественных языков, провести различия в использовании конструкций языка в зависимости от пола, возраста, региона и т.д.
Необходимый опыт:
- Знание утилит gnu core utils Linux ( sort, grep, tac, etc ) – 3-4 года
- Способность писать на Perl 5, bash, java, C++. Из указанного списка, возможна разработка новых программ на Python или Ruby или Java вместо bash & Perl, но претендент должен быть способен зафиксить, если нужно, имеющиеся скрипты. Программы на Java не сложные, в основном, только поддержка. Знание С++: stl обязательно, фичи 11х не широко используются, кроме auto.
Задачи:
- Написание отчетной системы, запускаемой по крон, о составе и этапах обработки, через которые прошли тексты,
- Подготовка индексируемых текстов, программы фильтры в основном написаны, некоторые могут потребовать изменения.
- Тестирование программы случайного упорядочения большого множества текстов.
- Принять участие в доработке программы, выполняющей разбор языка запросов к строящемуся корпусу.
Условия:
- Занятость около 20-30 часов в неделю. Претендент должен делать оговоренный объем в срок, из чего следует, что оплата будет производиться по факту сделанного;
- Претендент понимает, что результатом работ являются не только программы, но и сами тексты корпуса, проиндексированные и готовые для использования в лингвистической поисковой системе;
- Претендент имеет достаточно быстрый интернет – канал для доступа по ssh, который оплачивает самостоятельно;
- Ход работ обсуждается по скайпу ( телефоном или сообщениями ), задачи ставятся в системе trac;
- Время, удобное для обсуждений – с 11 до 14 часов, с 23 до 03 часов по Московскому времени;
- Срок занятости в таком режиме предполагается до конца мая 2014 года, после чего возможен переход на полную занятость;
От претендента ожидается письмо с описанием своего опыта в областях:
- Утилит командной строки для обработки данных и текста;
- С++ - указать уровень знания языка и stl + boost, несколько слов о проектах, пример кода если есть что показать и претендент может объяснить, почему сделано именно так а не иначе и каким образом можно развить данный код;
- Знание одного-двух языков из Bash, Perl, Python, Ruby
- Знание языков разметки HTML, XML, XPATH;
Также интересен ( но не обязателен ) опыт областях:
- Автоматического морфологического и синтаксического разбора, построения онтологий;
- Машинного обучения и статистики – weka, liblinear, R;
- Веб-программирования.
В случае интереса высылать письмо до 23 января по адресу: textmining@mail.ru
Спасибо и жду ваших писем и каментов.