Una vez definida la estrategia de tu proyecto de datos el siguiente paso es conseguir datos.
Necesitamos de nuestra materia prima.
Para ello necesitamos importar los datos a nuestro software.
Hay infinidad de formatos y tipos de datos pero los más comunes son ficheros de texto, excel, bases de datos y escrapear datos de webs.
En esta lección vas a clasificar los tipos de fuentes de datos y tendrás un paso a paso en la zona Tech Zen de cómo leer los ficheros de texto, de Excel y empezar el web scraping.
¡A por ello!
A continuación tienes los tutoriales de RStudio, Python y SPSS para leer e importar datos. Mi consejo si trabajas con RStudio o Python es que generes tu mismo los códigos siguiendo los vídeos de esta forma entenderás mucho mejor como trabajar con las piezas de lego que te voy a ir aportando durante el programa. Completa los ejercicios de la hoja de trabajo utilizando los vídeos y las piezas de código que te voy aportando.
Tech Zen RStudio
Consejo: es mejor leer datos .csv en Excel ya que la lectura de hojas de Excel genera un tipo de variables llamadas "tible" que no son muy amigable de trabajar. Convierte las hojas de Excel a csv y RStudio lo leerá mucho mejor.
Tech Zen Python
Cómo conectar tu google drive en Jupyter y leer datos de tu base de datos en drive:
Tech Zen SPSS