En lo que se refiere al mercado laboral, científico de datos son palabras de moda en 2018. La gran mayoría de empresas se comienzan a interesar por este perfil que mezcla diversas habilidades de campos muy diferentes y que incluso ha llegado ser catalogada como “la profesión más sexy del siglo XXI”.
Hasta cierto punto es normal, pues la revolución digital en la que estamos inmersos ha generado en todas las empresas la necesidad de procesar, analizar y explotar la información que existe en los datos para extraer valor estratégico que facilite la toma de decisiones correctas. Algunas empresas ya están trabajando en ello desde hace pocos años, otras están iniciando este nunca fácil camino ahora mismo y estoy seguro que, el resto, las seguirá en los próximos años: el científico o analista de datos se encuentra en el centro de dicho nuevo ecosistema y por ello ya es muy valorado en sectores como banca, retail, medios o telecomunicaciones.
Pero, al contrario de lo que mucha gente piensa, ser científico de datos no consiste conocer uno, dos o tres lenguajes de programación y aplicarlos en el día a día de una empresa. En mi opinión, la principal clave para convertirse en data scientist es la de poseer y sacar provecho a una visión holística del mundo de los datos y del negocio particular al que se dedica. Al igual que nunca he recomendado ser experto en una herramienta de analítica web, tampoco se trata de ser el mayor experto en R o Python, por poner dos ejemplos concretos.
El científico de datos debe saber valorar diferentes fuentes de datos, dimensionar su valor, ser capaz de explotar esa información esté donde esté, analizarla y convertirla en conocimiento para llevarla al resto de la empresa.
Mi experiencia profesional, el contacto con compañeros y la evolución del propio campo me dice que un buen analista de datos es una persona con conocimientos variados. Es más, no entiendo al analista de datos como alguien que solo conoce un aspecto concreto del mundo de los datos, sino que debe tener conocimientos en diferentes aspectos relativos a este mundo, aunque lógicamente podrá destacar o sentirse fuerte en determinados aspectos.
Si alguien que se dedica a explotar datos no tiene esa visión holística, esa foto completa de qué se puede hacer con los datos y cómo se puede aplicar a nivel empresa, no podrá siquiera plantearse soluciones más o menos simples (aunque sea otro el que luego las ejecute).
Es por eso que siempre que me hacen la pregunta sobre las principales claves de un científico de datos intento estructurar la respuesta en tres pasos:
- ¿Quién puede ser científico de datos?
- ¿Qué hace falta para serlo?
- ¿Qué tiene que tener un científico de datos?
En lo referido a la primera pregunta, siempre digo que muchos de los que hasta ahora han manejado datos pueden seguir haciéndolo en el nuevo ecosistema, aunque claramente los perfiles más técnicos tienen ventaja. Un buen ejemplo es el de los analistas web, quienes pueden comenzar a explotar otro tipo de fuentes de información más allá de Google Analytics o Adobe Analytics.
Si sus capacidades técnicas son avanzadas desde un inicio o si han avanzado en su carrera profesional dada su inquietud a lo largo de estos últimos años, un analista de datos puede comenzar a pegarse con otros mundos y evolucionar hacia data science que, como comenzaba escribiendo, es el futuro en todas las empresas.
Pero, ¿qué hace falta para serlo?
Personalmente, me preocuparía mucho por entender cómo funciona una base de datos y también aprendería, de forma conceptual, cómo funciona un lenguaje de programación. Estoy seguro que, en 2018, todavía hay muchos analistas de datos que no saben esto a pesar de que sí les llama la atención el mundo de la ciencia de datos y el big data.
De nuevo, este punto está muy relacionado con la visión holística que mencionaba anteriormente: es necesario saber desenvolverse en el ecosistema propio del data science. Una vez aprendido esto, entonces sí aprendería lenguajes de programación concretos: SQL, Python y R son los que mandan. Dichos lenguajes suelen ser necesarios para desarrollar diversas tareas complejas, como desarrollar aplicaciones, tocar APIs o poner modelos en producción.
Además, un científico de datos debe conocer diversas tecnologías y tener conocimientos de estadística. Saber modelar datos, tener claros los objetivos y el modelo de negocio de tu empresa para saber qué métodos o técnicas estadísticas pueden ofrecer una respuesta a problemas concretos de la compañía es fundamental.
De forma adicional, un buen científico de datos no es aquel que se queda en el laboratorio: los buenos analistas son aquellos que también dominan herramientas de visualización y echan mano de su creatividad para explicar lo que han hecho o están haciendo a otras áreas de negocio que, por supuesto, no tienen por qué ser conscientes de lo complejo de tu análisis pero sí necesitan soluciones concretas a determinados problemas dentro de una empresa.
En definitiva, un ámbito tan apasionante como lleno de posibilidades, ¿te apuntas?
Por Fran Gallego