Inicio › Foros › Etapa III – Ciencia de Datos › ejercicio de regresion
- Este debate tiene 1 respuesta, 2 mensajes y ha sido actualizado por última vez el hace 1 año, 1 mes por
Jordi.
-
AutorEntradas
-
16 abril, 2021 a las 16:27 #10860
Beatriz Sánchez Godoy
ParticipanteBuenas tardes
adjunto mi ejercicio de regresión de la etapa 3, bloque 6.4
https://drive.google.com/file/d/1bvRH0-E2AtWovP7PG8RibPYlS_0RH2Yy/view?usp=sharing
tengo atrasado el de clasificación, pero me da un error que no sé subsanar y que pego aquí para que esté a mano:
data(BreastCancer)
datos <- BreastCancer
#quitamos el id
datos <- datos[,-1]
datasetNOmiss <- datos[complete.cases(datos),]
# Split out validation dataset
# create a list of 80% of the rows in the original dataset we can use for training
set.seed(7)
validation_index <- createDataPartition(datos$Class, p=0.80, list=FALSE)
# select 20% of the data for validation
validation <- datos[-validation_index,]
# use the remaining 80% of data to training and testing the models
dataset <- datos[validation_index,]
# make predictions
set.seed(7)
x <- datasetNOmiss[,1:9]
# convert input values to numeric
for(i in 1:9) {
x[,i] <- as.numeric(as.character(x[,i]))
}
preprocessParams <- preProcess(x, method=c(«BoxCox»))predictions <- predict(fit.cart, newdata=preProcess(validation, method=c(«BoxCox»)))
confusionMatrix(predictions, validation$Class)predictions <- predict(fit.knn, newdata=preProcess(validation, method=c(«BoxCox»)))
caret::confusionMatrix(predictions, validation$Class)y el error que da es este:
preprocessParams <- preProcess(x, method=c(«BoxCox»))
Warning in pre_process_options(method, column_types) :
The following pre-processing methods were eliminated: ‘BoxCox’
predictions <- predict(fit.knn, newdata=preProcess(validation, method=c(«BoxCox»)))
Warning in pre_process_options(method, column_types) :
The following pre-processing methods were eliminated: ‘BoxCox’
Error in as.data.frame.default(newdata, stringsAsFactors = FALSE) :
cannot coerce class ‘»preProcess»’ to a data.frame22 junio, 2021 a las 10:13 #11579Jordi
SuperadministradorHola Beatriz,
¡Lo tenemos por fin!
Después del training de todos los algoritmos el último punto es aplicar el algoritmo ganador a los datos de validación.
Ese código no es correcto, no hace falta aplicar este preprocesado de BoxCox ya que el algoritmo ya lo tiene intrínseco en el training.
Así que borra todas estas líneas finales y añade el training de la validación y el resultado final de la matriz de confusión.
predictions <- predict(fit.knn, newdata=validation) confusionMatrix(predictions, validation$Class) Y listo. Utiliza el algoritmo que ha funcionado mejor. Aquí he puesto el fit.knn pero cada uno seleccionará el que le toque. 1 abrazo, Jordi -
AutorEntradas
- Debes estar registrado para responder a este debate.