Vanuit allerlei hoeken hoor je over (big) data. Dat het heel belangrijk is en dat er veel vraag is naar specialisten. Data scientist, data analist of data wetenschapper, er zijn vele benamingen voor. Ik houd het voor mijn verhaal bij Data scientist.
Data Scientist
Een Data Scientist houdt zich bezig met het leggen van verbanden tussen datasets en het beantwoorden van vragen. Een eenvoudige vraag is bijvoorbeeld “Waar zijn gebruikers naar op zoek?” Een ingewikkelde vraag is “hoe kan ik het proces optimaliseren?"
Definitie Data Scientist
De volgende uitspraak is een mooie samenvatting van het geheel:
"Je kunt stellen dat een data scientist zich bevind op het kruispunt tussen programmeren, statistieken en kritisch denken."
Twee types
Er zijn twee types te onderscheiden binnen data, namelijk Type A & Type B.
Type A
Type A is vooral bezig met analyseren. Bezig met verbanden leggen en een bijpassende logica vanuit een statistische benadering. Dit type is goed te vergelijken met een statisticus maar kent wel alle praktische toepassingen om met data te werken (wat normaal gesproken niks met het vak statistiek te maken heeft). Denk hierbij aan data opschonen, omgaan met grote datasets, visualiseren van data e.d.
Type B
Type B deelt ook wel iets van de statistische achtergrond met Type A maar kan ook (redelijk) goed programmeren. Type B is vooral geïnteresseerd in het gebruiken van data en het bouwen van datamodellen die interactie aangaan met gebruikers. Zoals aanbevelingen van producten of films.
Echter in de praktijk
Echter is het in de praktijk niet zo mooi opgedeeld en zeker niet binnen de vacatures die voorbijkomen. De meeste bedrijven zijn nog niet zover dat ze werken met een data infrastructuur en datamodellen waar direct analyses op losgelaten kunnen worden. De meeste vacatures behelzen dus een combinatie van beide datatypes zoals hierboven omschreven.