R y Python para Data Science y Análisis de Datos
Como vimos en este post, para iniciar en el mundo de la Ciencia de Datos, existen 3 pilares fundamentales que constituyen el soporte del éxito en este campo, como se ilustra en el siguiente diagrama:
La Estadística nos proporciona las herramientas que nos permiten obtener el conocimiento y las respuestas que necesitamos de los datos, por ejemplo, los métodos de análisis descriptivo, donde describimos las características fundamentales de los datos que tenemos, los métodos predictivos como los de regresión que nos permiten predecir datos futuros (o que no tenemos) en base a datos históricos que sí conocemos; o también los métodos de inferencia, donde intentamos verificar si los resultados que obtenemos de nuestros datos, se pueden extrapolar de forma general a toda la población más grande que esa muestra de datos representa. Es decir, la Estadística es la base que nos permite tener algunas de las herramientas más importantes para hacer Ciencia de Datos.
Pero como vemos en el diagrama, esto no es suficiente. Otro de los pilares fundamentales en Ciencia de Datos es la Programación, la cual vamos a necesitar para poder implementar de una manera mucho más eficiente y sencilla todos esos modelos de la Estadística de los que hemos hablado.
En Ciencia de Datos, en estos tiempos, los dos lenguajes de programación más…