que_es_datascience

 

http://drewconway.com

Drew Conway, CEO and founder of Alluvium

Mi intención es responder a la pregunta en dos pasos: desde un punto de vista más objetivo y desde lo que me dice mi experiencia.

Desde un punto de vista más objetivo

Para responder a esta pregunta voy a utilizar una imagen sobre la que me apoyaré para el análisis. Se trata un diagrama de Venn en el que se pueden ver las diferentes habilidades que debe tener un data scientist y cómo se relacionan entre sí. Los tresgrandes pilares serían:

·         Programación: Tener capacidad para utilizar uno o más lenguajes de programación. Hoy día es de todos sabido que los lenguajes para el análisis de datos por excelencia son R y Python.

·         Matemáticas y Estadística: En este aspecto es necesario disponer de una base sólida en álgebra, cálculo y estadística básica. En principio, se puede comenzar con el nivel que se puede adquirir en cualquier carrera de tipo técnico o científico.

·         Experto en la materia: Es muy importante que el data scientist entienda el negocio sobre el que está trabajando, es decir, que entiende suficientemente los datos con los que está trabajando como para extraer de ellos la mejor y más eficiente información posible.

 

Es muy interesante ver las intersecciones del diagrama porque explican ciertos detalles:

Cuando una persona dispone de la base matemática y de programación comentadas puede pasar a aplicar herramientas (algoritmos) más complejas que sólo son posibles con la ayuda de un ordenador. Machine Learning (aprendizaje automático) es una de las respuestas derivadas de la sinergia que existe cuando unes estas dos competencias. Aquí deberíamos añadir, estadística multivariable, visualización gráfica estática e interactiva, y un largo etcétera.

Todas estas competencias se encuentran en los contenidos del curso GIS-DataScience en R que ofrece esta plataforma.

El tercer pilar en el que se sustenta la figura del data scientist es el propio conocimiento de los datos. Cuando juntamos las habilidades anteriores, de un experto en programación y matemáticas, con el conocimiento del negocio es cuando tenemos realmente a un data scientist. De ahí, que las empresas que se dedican a temáticas realmente complicadas decidan formar a empleados que tienen en plantilla y que conocen bien el negocio.

data_science_2

Desde un punto de vista no tan objetivo

Voy a esquematizarlo para que no se haga muy pesado:

1.       Lo primero es que estoy totalmente de acuerdo con lo que nos dice el diagrama de Venn anterior.

2.       Un data scientist no sólo se dedica a poner en funcionamiento las herramientas que conoce sino que está envuelto en un viaje de formación continua debido a tratarse de un mundo que está en completa ebullición. Hoy estoy aplicando esta herramienta, mañana necesitaré otra más potente y tendré que aprender cómo se utiliza.

3.       A  los tres pilares del diagrama, añadiría uno relacionado con las habilidades sociales. Como mínimo, debes saber explicar qué estás haciendo y qué información que se deriva de tus análisis. Un data scientist no es sólo una persona, es una persona dentro de un ámbito de trabajo.

4.       Un data scientist debe intentar ver los problemas desde varios puntos de vista. En el tiempo que lleva el curso en funcionamiento, a los alumnos que vienen del mundo GIS les gusta la sensación de poder enfocar sus análisis desde perspectivas que vayan más allá del ámbito geoespacial.

5.       Por último, añadiría que aspectos como la curiosidad por lo que nos puedan decir los datos, la creatividad en la búsqueda de soluciones y la constancia son atributos que se deberían tener.

Conclusión

La cantidad de competencias técnicas, sociales y emocionales que se exigen a un data scientist son realmente altas. Mirándolo bien, parece que estamos hablando de algún tipo de superhéroe. Sin embargo, existen muchos peldaños en el camino en los que podemos buscar nuestra “zona de confort” especializándonos en algo concreto en lo que podamos sentirnos a gusto.

En el curso de GIS-DataScience que ofrecemos te damos las herramientas básicas para que comiences tu ascenso y puedas encontrar ese peldaño en el que acomodarte.

 

Autor: Lorenzo Martínez – Monitor/Consultor del curso de GisDataAnalyst