Всем привет!)
Я не знаю, насколько этот тут может быть на 100% релевантно данной тематике, но если что JB определи по контексту, если тебе не трудно.
Товарищи! Вопрос таков: Имеется IBM SPSS for Linux. Потренировавшись в пользовании TeX'ом, освоился в кодинге (хоть немного) и мозги начали «вправляться» в программирование. Но не в этом суть.
SPSS (кто не знает) --- это помесь СУБД (читай что-то типо DB2) и своего статистического анализатора (что-то типо R). Под Линуксом сие дело немного лагает... Ну и в общем, когда меня в очередной раз бомбануло (а бомбануло знатно, когда SPSS вылетел на процессе MATCH variables by keys), я стал пересчитывать на R. Пересчитал. Однако вот тягость к СУБД (для вбивания данных, их перекодировки, созданию новых переменных и т.д.) осталась.
Кто пользуется активно и ежедневно СУБД для Анализа данных (или вообще): вот, к примеру, PostgreSQL умеет делать операции вида «перекодировать переменную» (ну типо есть параметр age, в нем, допустим, 5000 записей; мне нужно сделать новый параметр age_2, где будут удалены куски из 5000 записей) и что-нибудь в этом роде?
Про тупоголовый csv я знаю. Про то, что в R тоже можно перекодировку переменных делать — знаю (но делает оно, ИМХО, долго и сложно, мне не очень понравилось). В SPSS за работу с записями и переменным отвечает внутренняя СУБД, а не «типо-R».
Заранее спасибо за помощь! Гугление пока не приводит к пониманию ситуации.
P.S. Если я что-то не уточнил, скажите пжст, постараюсь объяснить еще подробнее.
P.S.S. Никакого троллинга/флуда/срача_субд. Я говорю вообще о СУБД (без разницы, SQL/NoSQL). В SPSS нечто, напоминающее Инвалидную Реляционную БД (А-ля Access).