Inicio › Foros › Etapa II – Analiza tus Datos › [AD] 13-Hoja de trabajo – Modelos Logisticos GLM › Respuesta a: [AD] 13-Hoja de trabajo – Modelos Logisticos GLM
Hola Jordi,
Estoy trabajando sobre los datos de heart-failure. Estoy intentando la evaulación del modelo cuantificando el error pero me da todo el rato este error:
Error en confusionMatrix.default(data = pred.class, reference = real):
The data must contain some levels that overlap the reference
He comprobado que los dos argumentos sean factores además de que ya se hace previamente en cálculo del modelo. El modelo sale sin problemas. Te dejo lo que tengo puesto, porque ya he probado varias maneras con las sugerencias de los foros stack overflow.
# Estimar la variable respuesta:
probabilidades = predict(mlog,newdata = data, type = «response»)
probabilidades
# Calcular las probabilidades:
prediccion.classes <- as.factor(ifelse(probabilidades > 0.5, «Si», «No»))
# Valores reales de HeartDisease:
real = data$HeartDisease #ya estaba puesta como factor
predicciones = data.frame(Reales = real, Prediccion = pred.class, Probabilidades = probabilidades)
predicciones
# Evaluacion del modelo cuantificando el error:
# Matriz de confusion:
library(caret)
caret::confusionMatrix(data=prediccion.classes, reference=real)
Generé un data.frame para que me dijera el tipo de variable y efectivamente son factores.
Espero poder solucionarlo pronto para poder continuar con las hojas de trabajo.
Mil gracias!