Inicio › Foros › Estrategia de Análisis de Datos › Dudas u orientación para poder desarrollar mi proyecto › Respuesta a: Dudas u orientación para poder desarrollar mi proyecto
Hola Germán, el futbol es un tema que mueve pasiones así que haces bien en «tomar prestada» esa energía para empezar a analizar los datos.
Veo que tienes muchas variables «de entrada» (variables independientes), pero no tienes ninguna variable de salida (ninguna variable que diga si el portero es bueno).
Lo idoneo sería que hubiera una puntuación que indicase como de bueno es el portero (por ej: si sigues el tenis el ranking mundial de los tenistas). No sé si habrá alguna puntuación de ese estilo para los jugadores de futbol, o veces que ha sido nominado a mejor jugador algo así. En caso de que no encuentres una variable así, aunque sería más subjetivo no veo otra que califiques tú qué es un buen portero dando a todas las variables que tienes un peso o importancia (como cuando se bareman méritos: «Por cada ocasión de gol salvada +0,02», «Por cada acción defensiva fuera del área +0,01″).
En este caso lo más probable es que no todos los porteros hayan jugado el mismo tiempo, ni el mismo número de partidos (de modo que los porteros que jueguen poco tendrían menos oportunidades de hacer cosas buenas y malas).
Así que yo te recomendaria que para que la comparación fuera más equitativa las variables que dependen del número de partidos las dividieras por el número de partidos (en vez de partidos ganados hacer % de partidos ganados= partidos ganados/partidos jugados * 100).
Las de los tiros a puerta o penaltis igual, haría porcentajes para esas variables » % ocasiones salvadas = ocasiones salvadas/disparos a puerta * 100″
1º Hacer un scatter-plot entre minutos jugados v.s partidos jugados y más o menos tendrían que salirte parecidos.
Espero que te ayude.