DESCARGA TODOS LOS CÓDIGOS DE R Y PYTHON DE ANALIZA TUS DATOS
BLOQUE VI - CIENCIA DE DATOS
BLOQUE VII - PRESENTA TUS RESULTADOS
MATERIAL EXTRA Y WEBINARS

Cómo seguir creciendo

Ahora te has familiarizado con el mapa de técnicas avanzado, posees las bases más que nutridas de un científico de datos.

Eres capaz de aplicar muchas técnicas y resolver innumbrales problemas prácticos. A partir d'aquí el límite lo pones tú. Con esta guía paso a paso ya eres capaz de mucho. Ahora toca simplemente profundizar en las técnicas que te resulten claves. Y practicar, practicar y practicar.

¡En este capítulo (escrito) te voy a dar indicaciones para que sigas avanzando y mejorando!

¿Te acuerdas del árbol de la estadística?

¿Te acuerdas que al principio te presentaba las tres partes fundamentales del conocimiento?

Déjame decirte que tu árbol ha crecido mucho y es realmente fuerte.

Ahora tienes unas raíces profundas de tus árbol de la estadística. Los conceptos esenciales los tienes asentados y listos para aplicarlos siempre que quieras.

Entiendes y aplicas un método de análisis de datos inferencial y predictivo a tus datos utilizando R y SPSS como herramientas. Tienes un tronco muy potente capaz de sostener tus ramas.

Has conseguido aplicar muchas de las técnicas de análisis. Posees mucha capacidad y puedes aplicar técnicas en muchas situaciones. Eres conocedor del conocimiento y el mapa de técnicas descriptivas, inferenciales, y de ciencia de datos.

¿Y ahora qué?

¿Has acabado aquí?

Lo bueno es que es sólo el principio. Durante esta lección te ayudaré a seguir creciendo.

¡El límite lo pones tú!


Construye y mantiene tus propias recetas

A lo largo de este máster, ha aprendido muchas técnicas en base a recetas o piezas de lego en R. El baúl de las técnicas de R es el comienzo de tu propia base de código privada. La gracia de todo esto es que seas capaz de ampliar y seguir aumentando las recetas de R para que seas realmente potente con tus datos y tus proyectos. (en la siguiente lección te explico cómo buscar información y crear tus propias recetas)

Estas recetas son un comienzo, no un final. Cuanto más extenso y sofisticado sea su catálogo de recetas de ciencia de datos, más rápido podrás comenzar con nuevos proyectos y más precisos serán los modelos que puede desarrollar.

A medida que apliques sus habilidades como científico de datos con la plataforma R, desarrollarás experiencia y habilidades con nuevas y diferentes técnicas con R.

Puedes extraer o resumir fragmentos y recetas a medida que avanzas y agregas a su propia colección de recetas, sobre el código que puede utilizar en futuros proyectos de aprendizaje automático. Con el tiempo, acumulará su propio y maduro catálogo de código de aprendizaje automático para R.


De pequeño a grande. Pequeños proyectos con pequeños conjuntos de datos

En el bloque anterior ya te he comentado dónde encontrar más datos para seguir creciendo poco a poco.

Los conjuntos de datos del Repositorio de aprendizaje automático de UCI son fantásticos para seguir creciendo.

Son estandarizados, relativamente limpios, fáciles de comprender y excelentes para que usarlos como conjuntos de datos de práctica.

Puedes utilizar los conjuntos de datos en el repositorio de Aprendizaje automático de UCI como el foco de pequeños proyectos de aprendizaje automático centrados (de 5 a 10 horas de dedicación) utilizando la plataforma R.

Una vez completado, puedes escribir tus resultados y conclusiones en tu propio blog o como parte de su cartera de proyectos para mostrar a posibles clientes, a otros investigadores y colegas de profesión o a tus responsables.

También puedes usarlos más tarde como un depósito de conocimientos en el que puedes desarrollar sus habilidades.

Estos son los pasos que te recomiendo para seguir creciendo:

>> Navega por la lista de conjuntos de datos gratuitos en el repositorio de UCI y descarga entre 5 y 10 que te parezcan interesantes.

>> Usa las plantillas de proyectos y las recetas de esta formación para trabajar a través del conjunto de datos y desarrollar un modelo preciso y concreto para solucionar el objetivo que te marques. Como siempre es importante entender tus variables y definirlas bien.

>> Escribe el flujo de trabajo y lo que hayas descubierto de manera que puedas consultarlos más tarde o tal vez compartirlos públicamente en un sitio web, linkedin etc.

Lo mejor, trabajar con un proyecto corto. Entre 5 a 10 horas como mucho.


¡A por tu primera competición!

Trabajar en pequeños proyectos en la sección anterior es una buena manera de practicar los fundamentos, las recetas y la metodologías que has aprendido durante Analiza tus Datos. Poco a poco los problemas/proyectos de análisis de datos se volverán una diversión para ti 😉

Para seguir creciendo, como siempre es importante estar en peligro. Y salir de tu zona de confort con proyectos cada vez más ambiciosos. De esta manera podrás desarrollar tus habilidades.

Una buena manera de hacerlo es unirte a una competición. (yo no lo he hecho porque con los proyectos de mis clientes voy servido) Seguro que puede ser una muy buena experiencia.

El organizador de la competición te vas a proporcionar un conjunto de datos para analizar.

Luego, tu y tus "contrincantes" trabajareis para crear el modelo más preciso posible o aplicar la técnica que mejor funciona para los datos. Los ganadores a menudo reciben premios en efectivo ¡Estas competiciones duran semanas o meses y pueden ser muy divertidas!

El sitio web principal para competiciones de aprendizaje automático es Kaggle: http://www.kaggle.com. Las competencias se dividen en diferentes clases y niveles.

Otro sitio web muy interesantes es Analytics Vidhya https://www.analyticsvidhya.com/. Además, puedes encontrar tutoriales y información muy relevante para tu proyecto.

Para comenzar, apúntate a una competición para principiantes, ya que a menudo son menos desafiantes y tienen mucha ayuda en forma de tutoriales para comenzar. También es una gran forma de seguir aprendiendo y nutriendo tu árbol de la estadística.


Take away

En este capítulo, has descubierto 3 formas de seguir creciendo:

  • Amplia y nutre tu propia baúl de recetas de R. Esto te permitirá ser un auténtico científico de datos y hacer frente a proyectos cada vez más ambiciosos.

  • Continuar trabajando en los conjuntos de datos del Repositorio de aprendizaje automático de UCI te ayudará a tener un conjunto de proyectos terminados y preparados para presentarlos a tus clientes, colegas de trabajo o responsables. Lo puedes hacer en tu sitio web o blog o en linkedin, research gate etc...

  • Para comenzar a trabajar a través de conjuntos de datos y proyectos más ambiciosos puedes apuntarte a las competiciones http://www.kaggle.com o https://www.analyticsvidhya.com. ¡Seguro que aprenderás un montón y te lo pasarás pipa!


¡Nos vemos en nada!

?