En esta ponencia tutorial, Reiche, alumno de Analiza tus Datos, nos mostrará un ejemplo de segmentación de datos para que puedas seguirlo y replicarlo con tus propios datos utilizando RStudio.
Te comparto por aquí el material que hemos utilizado para crear el ejemplo que Reiche nos ha mostrado. Es une pequeñísima parte de los más de 190 códigos de R que incluye Analiza tus Datos
¡Gracias Reiche!
Clustering o segmentación de datos
El clustering es una herramienta muy utilizada para identificar patrones en los datos.
Es muy útil en la práctica y muy fácil de utilizar. Solo tienes que ser conocedor de algunos aspectos importantes y listos.
En palabras llanas el clustering te permite separar grupos que se comportan de manera similar según unas características. Estas características se denominan en inglés, features, como no podría ser de otra forma :P. Estas features son cuantitativas ya que el objetivo del clustering es crear una variable cualitativa como salida que nos clasifique la base de datos en grupos.
Los algoritmos principales para el clustering de menos a más potentes son los siguientes:
- Hierarchical clustering
- k-Means clustering
- GMM - Gaussian Mixture models clustering (MCLUST)
¡Ahora vamos a aprender cómo utilizarlos!
¡Adelante!
