El clustering es una herramienta muy utilizada para identificar patrones en los datos.
Es muy útil en la práctica y muy fácil de utilizar. Solo tienes que ser conocedor de algunos aspectos importantes y listos.
En palabras llanas el clustering te permite separar grupos que se comportan de manera similar según unas características. Estas características se denominan en inglés, features, como no podría ser de otra forma :P. Estas features son cuantitativas ya que el objetivo del clustering es crear una variable cualitativa como salida que nos clasifique la base de datos en grupos.
Los algoritmos principales para el clustering de menos a más potentes son los siguientes:
- Hierarchical clustering
- k-Means clustering
- GMM - Gaussian Mixture models clustering (MCLUST)
¡Ahora vamos a aprender cómo utilizarlos!
¡Adelante!