Wij maken gebruik van Cookies. Cookies zijn bestanden die in je browser worden opgeslagen en zorgen dat de website optimaal werkt, dat je sneller vindt wat je zoekt en dat getoonde content voor jou zo relevant mogelijk is. Lees er meer over in ons cookies- en privacybeleid. Klik hieronder het gewenste niveau.
Niveau 1: Deze cookies zijn noodzakelijk voor een goed en veilig werkende website.
Niveau 1+2: Met deze cookies maken we de website persoonlijker en gebruiksvriendelijker.
Niveau 1+2+3: Deze cookies zorgen ervoor dat we je relevante advertenties kunnen laten zien.
Blog

Ben jij net als ik geïntrigeerd door het vak Data Science?

Door: Linda Waaijer 09-04-2018

Vanuit allerlei hoeken hoor je over (big) data. Dat het heel belangrijk is en dat er veel vraag is naar specialisten. Data scientist, data analist of data wetenschapper, er zijn vele benamingen voor. Ik houd het voor mijn verhaal bij Data scientist.

Data Scientist

Een Data Scientist houdt zich bezig met het leggen van verbanden tussen datasets en het beantwoorden van vragen. Een eenvoudige vraag is bijvoorbeeld “Waar zijn gebruikers naar op zoek?” Een ingewikkelde vraag is “hoe kan ik het proces optimaliseren?"

Definitie Data Scientist

De volgende uitspraak is een mooie samenvatting van het geheel:

"Je kunt stellen dat een data scientist zich bevind op het kruispunt tussen programmeren, statistieken en kritisch denken."

Twee types

 Er zijn twee types te onderscheiden binnen data, namelijk Type A & Type B.

Type A

Type A is vooral bezig met analyseren. Bezig met verbanden leggen en een bijpassende logica vanuit een statistische benadering. Dit type is goed te vergelijken met een statisticus maar kent wel alle praktische toepassingen om met data te werken (wat normaal gesproken niks met het vak statistiek te maken heeft). Denk hierbij aan data opschonen, omgaan met grote datasets, visualiseren van data e.d.

Type B

Type B deelt ook wel iets van de statistische achtergrond met Type A maar kan ook (redelijk) goed programmeren. Type B is vooral geïnteresseerd in het gebruiken van data en het bouwen van datamodellen die interactie aangaan met gebruikers. Zoals aanbevelingen van producten of films.

Echter in de praktijk

Echter is het in de praktijk niet zo mooi opgedeeld en zeker niet binnen de vacatures die voorbijkomen. De meeste bedrijven zijn nog niet zover dat ze werken met een data infrastructuur en datamodellen waar direct analyses op losgelaten kunnen worden. De meeste vacatures behelzen dus een combinatie van beide datatypes zoals hierboven omschreven.

Buddy de mascotte die een signaal ontvangt
Buddy de mascotte laat zien wat je als Data Scientist moet kunnen

Profiel van een succesvolle Data Scientist

Welke kenmerken zijn van toepassing op een Data Scientist?

  • Graag werken met Data
  • Analytisch denkvermogen
  • Nieuwsgierig
  • Probleemoplosser
  • Uitdagingen aangaan
  • Patronen zoeken
  • Open staan voor tips & tricks van anderen
  • Relevante vragen kunnen stellen
  • Open mindset t.o.v. nieuwe ontwikkelingen en technologieën
  • Kunnen samenwerken met anderen

Wat heb je nodig om aan de slag te gaan als Data Scientist?

Om als Data Scientist aan de slag te kunnen gaan,  zul je op de hoogte moeten zijn van de meest gebruikte statistieken en deze ook toe moeten kunnen passen. Tevens moet je kunnen begrijpen wat deze statistieken zeggen over je data.

  • Data modellen kennen en deze ook kunnen gebruiken
  • Het is handig om communicatief vaardig te zijn, omdat je resultaten moet overbrengen op anderen en soms zelf resultaten moet verdedigen.
  • Er zijn redelijk wat verschillende (benodigde) tools en er komen regelmatig nieuwe tools bij, op de hoogte blijven van de nieuwste ontwikkelingen is daarom een vereiste.

Waar is een Data Scientist het meest mee bezig?

Je hebt betrouwbare data nodig om analyses uit te kunnen voeren. Dit is een grote uitdaging en kost ook nog eens veel tijd. Er kan data ontbreken, er kan dubbele data zijn, er kan foutieve data zijn, enz. Als je 200 rijen aan data hebt is dit nog wel te overzien, maar als je 20.000 rijen aan data hebt, heb je andere (complexere) manieren nodig om je data betrouwbaar te maken.

Het begrijpen van de dataset waarmee gewerkt wordt kost ook veel tijd en zodra er duidelijkheid is, zullen er nog verbanden moeten worden gelegd voordat er analyses uitgevoerd kunnen worden. En zegt de data die je hebt wel iets over de vraag of vragen die je, of het bedrijf, beantwoord wilt hebben? Ook is het gebruikelijk om te werken met data uit verschillende bronnen, hoe kom je bij die data, hoe verhoudt die data zich tot elkaar?

Om tot de uiteindelijke resultaten te komen zal er veel tijd besteed moeten worden aan de data.

Lijkt het je leuk om jezelf hierin verder te ontwikkelen?

Neem dan deel aan een (gratis) online MOOC cursus (=Massive Open Online Course) van Microsoft. Deze MOOC richt zich op de beginselen van Data Science.

Begin hiermee

Mijn advies is om eerst de korte introductie te bekijken, dan de enquête in te vullen en gelijk verder te gaan naar “Module 1, deel 2: Meet The Data Scientist”.

Door middel van interviews krijg je een beeld van wat Data Science inhoudt, waar data scientists zich dagelijks mee bezig houden, welke skills je nodig hebt inclusief advies voor beginnende data scientists.

UPDATE 09-07-2018: Bovenstaand beschreven MOOC is begin Juli ge-update waarbij de inhoud veranderd is. De MOOC laat je nu echt de inhoud van het vak ervaren en de interviews zitten er niet meer in. Onderstaande link gaat nu naar de nieuwe versie. Wil je toch graag deze interviews zien? Vul verderop je naam en e-mailadres in en je krijgt alsnog toegang tot de interviews.

Klik hier voor de gratis MOOC
Buddy de mascotte die een schilderij maakt, Bob Ross stijl
Heb je vragen?
Onze deskundige opleidingsadviseurs helpen je graag bij het maken van de juiste keuze!
Waarom @The Academy?
Praten Icon
Hoge klanttevredenheid
8.7 uit 4258 evaluaties
Checklist Icon
Spreiden van lesdagen
flexibiliteit voor uw gemak
Medewerker Icon
Persoonlijk advies
bij het zoeken van de juiste training
Virtueel Icon
Virtueel trainen
voor alle klassikale en blended trainingen