LINUX.ORG.RU

Неожиданное снижение размерности

 


0

1

Есть такой вот код на R

dim(training)
[1] 11776   160
 dim(testing)
[1] 7846  160
numIndex <- sapply(training, is.numeric)
preProc <-preProcess(training[,numIndex],method="pca",pcaComp=50)
trainPC<-predict(preProc,training[,numIndex])
modelFit<-train(training$classe~.,method="rpart",data=trainPC
testPC<-predict(preProc,testing[,numIndex])
length(predict(modelFit,testPC))
[1] 170
Что за ерунда? Почему было 7846 строк, а стало 170, как так?

★★★

Ты используешь метод главных компонент и сетуешь на неожиданное снижение размерности? :)

yoghurt ★★★★★
()

1) не надо вот так вот не указывать library() вызванные в сессии

2) в preProcess(caret) стоит na.remove = TRUE скорее всего поэтому и результат

psv1967 ★★★★★
()
Ответ на: комментарий от LIKAN

ну с такими запросами тогда только осталось познать что такое импутация пропущенных данных :)

psv1967 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.