Valid Nieuws

05 nov. 2018

Dutch Data Dude at Valid

Wijze lessen van de Dutch Data Dude

Een van de meest bekende Data-goeroes van ons land, Jeroen van Heerdt, is door zijn werkgever Microsoft naar de VS geroepen. Voor Jeroen, die als de ‘Dutch Data Dude’ grote naam heeft gemaakt in het wereldje van Data Science, AI, Analytics en Machine Learning, is dat natuurlijk een geweldige kans. Voor ons bij Valid een gemis, want wij hebben altijd met veel plezier samengewerkt en we hebben veel van hem opgestoken.

De Dutch Data Dude maakt momenteel een afscheidstournee langs de grotere Microsoft Partners. Wij hadden de eer als een van de eerste aan de beurt te zijn geweest. Hieronder het verslag van een mooie avond.

Na een korte inleiding door Olivier Giraud en Guido Ritzen, waarin werd gememoreerd hoe de band tussen Valid en Jeroen ter Heerdt is ontstaan, hield Jeroen een inspirerende  afscheidsrede voor een dertigtal medewerkers en gasten van Valid.

Binnenkort viert Jeroen zijn tienjarige dienstverband met Microsoft. De laatste jaren was hij actief als ‘technical evangelist’ op het gebied van Data en AI. Zijn bijnaam Dutch Data Dude heeft hij bedacht om zich te onderscheiden. Die eigenzinnigheid komt terug in zijn uitgesproken visie op het vakgebied. Zo was hij het niet eens met sommige keuzes van zijn collega’s bij Microsoft op het gebied van productontwikkeling. Dat schept verplichtingen. Binnenkort verhuist hij naar het hoofdkantoor van Microsoft om op de stoel te gaan zitten van diegenen die keuzes moeten maken. Mocht je hem willen volgen en een van zijn t-shirts willen kopen (opbrengsten gaan naar een goed doel), ga naar https://www.dutchdatadude.com/

We kregen eerst een lesje geschiedenis. De hypes in data volgen elkaar de laatste jaren snel op. Na ‘Big Data’ en ‘AI’ is ‘Machine Learning’ (dat laatste bestaat overigens al sinds de 70 jaren van de 20ste eeuw en is “gewoon wiskunde”) nu al te gewoontjes en is ‘Deep Learning’ de nieuwe modekreet. Deep Learning is een evolutie van ML waarbij software de manier emuleert waarop het menselijk brein werkt. In sommige toepassingen doet DL het zelfs beter dan de mens, bijvoorbeeld teksten samenvatten of snel foto’s herkennen.

Niet alles is AI

Een stofzuiger die weet wat te doen als hij een obstakel tegenkomt, is ook geen AI, maar werkt op basis van een simpel ‘if-then-else’ programma. Bij AI hoort het nemen van acties, zich zelfstandig aanpassen aan omstandigheden. Jeroen gebruikt zijn home automation als voorbeeld. Zijn wekker monitort zijn hartslag, weet dus wanneer Jeroen slaapt, en is verbonden aan zijn smartphone GPS en agenda. De wekker maakt Jeroen wakker op een tijdstip dat afhankelijk is van de afspraken van die dag en de verkeersomstandigheden. De wekker neemt dat besluit zelfstandig. Dat is weliswaar een simpel, maar mooi voorbeeld van AI.

Mede door het optreden van technologieleveranciers voelen veel bedrijven zich gedwongen om technologie aan te schaffen om mee te kunnen doen aan de AI-ontwikkelingen. Hier, vindt Jeroen, dient men kritisch naar te kijken. De meeste organisaties zijn al geholpen met ‘eenvoudige’ algoritmes voor bijvoorbeeld regressieanalyse. Begin daar eens mee. AI is voor velen nog een stap te ver.

Wat de Dude betreft zijn er drie trends waar je rekening moet houden: ‘Datafication’, ‘Opslagkosten’, ‘Information Production’.

Datafication

Met datafication bedoelt hij dat het tegenwoordig mogelijk is om bijna alles te vertalen naar data, waardoor de volumes aan data enorm toenemen. Voorbeeld: aan de hand van 20 sensoren in een autostoel kan de auto in principe de chauffeur(s) herkennen, waarmee een anti-diefstalsysteem ontworpen kan worden. Maar het werkt nog niet feilloos, zeker niet als je zwaar heb gedineerd.

Die datafication-trend wordt versterkt doordat data van waarde zijn. Tegenwoordig kunnen telecomoperators meer geld verdienen met de data van hun klanten dan aan de abonnementen zelf.

De waarde van data heeft ook een keerzijde, namelijk diefstal en oneigenlijk gebruik. Security en privacy zijn eens te meer van het hoogste belang; hoe gaan we hiermee om?

Opslagkosten

De opslagkosten zijn afgelopen decennia gigantisch omlaag gegaan. Het loont niet meer de moeite om data weg te gooien. Sterker nog, het is vaak duurder om uit te zoeken welke data weg kunnen dan ze maar simpelweg te bewaren. Hier liggen kansen voor de Valid’s van deze wereld: bedrijven helpen om ‘legacy’ data geautomatiseerd toegankelijk te maken en te benutten.

Information Production

De eerste twee trends leiden tot een enorme informatieproductie. We bewaren alles; bedrijven richten gigantische ‘data lakes’ in. Terwijl ze nog niet eens kunnen zwemmen…

Om iets te maken van deze trends – samengevat als ‘digitale transformatie’, door velen opgevat als ‘hoe kan je geld verdienen met data?’ – zijn volgens Jeroen specifieke rollen en gedragsregels nodig.

Die rollen zijn: de ‘Data Wrangler’, de ‘Data Scientist’ en de ‘Data Artist’.

Data Wrangler

De Wrangler (je weet wel, de cowboy, veehoeder te paard) verzamelt de data, temt ze, houdt ze in het gareel en waakt over ze. De Data Wrangler zorgt ervoor dat de data schoon en ordentelijk georganiseerd zijn, weet wat ermee gedaan kan worden en wat niet. Doorgaans heeft de Wrangler een IT-achtergrond en wordt ook 'data engineer' genoemd. Op dit moment maakt dit zo’n 85% uit van het werken aan data.

Data Scientist

Wanneer de Data Wrangler klaar is kan de Data Scientist aan het werk: wiskunde toepassen. Men gaat met R, Python of Scala aan de slag en converteert data in resultaten die bruikbaar zouden moeten zijn voor de business. Volgens Jeroen zijn Data Scientists zo met wiskunde begaan dat ze gewone stervelingen niet lang kunnen boeien.

Data Artist

Dit is de persoon die de data kan laten spreken als de Data Scientist zijn publiek in slaap heeft gebracht. Hij of zij converteert de informatie van de Data Scientist naar visualisaties en inzichten die elke persoon in de business intuïtief begrijpt. De Artist is creatief en houdt van esthetiek. Een Data Artist weet bijvoorbeeld dat je nooit en te nimmer pie charts mag gebruiken (“Pie Charts zijn de duivel”). In veel organisaties ontbreekt de rol van Data Artist. Dit kan een reden zijn waarom AI moeilijk doordringt tot de boardroom.

Negen gedragsregels

En dan de gedragsregels… De Dutch Data Dude onderkent er negen (eigenlijk zou voor de eerste regel  0 moeten staan, want dit behoort de basispositie te zijn):

  1. Start met data verzamelen. Als je over 5 jaar wilt voorspellende analyses wilt doen, moet je nu beginnen met verzamelen. En let op: veel data zijn al door anderen beschikbaar gesteld voor algemeen gebruik. Overheden bijvoorbeeld stellen hun data als ‘Open Data’ beschikbaar.
  2. Data zijn de verantwoordelijkheid van iedereen in de organisatie. Datakwaliteit begint bij de invoer op de werkvloer. Gaat er rotzooi in, dan komt er rotzooi uit. Daar kan geen AI tegenop.
  3. Vraag jezelf bij iedere beslissing af 'waar zijn de data?' Beslissingen moeten onderbouwd worden door data en niet voortkomen uit buikgevoel.
  4. Stop met teveel nadenken, en begin! Veel organisaties blijven steken in de oriëntatiefase en lopen van congres naar congres. Het meeste leer je door gewoon te doen.
  5. Faciliteer toegang tot kennis en gereedschap. Aanbod schept immers vanzelf de vraag.
  6. Houd op met het maken van architectuurplaten en met managen, laat creativiteit haar vrije loop, in ieder geval tijdelijk.
  7. Wees eerlijk en transparant.
  8. Fail fast en fix fast. Microsoft’s twitterbot Tay die na een tijdje racistische praat ging uitslaan is een mooi voorbeeld van onbedoeld effect van AI, maar ook van hoe snel ingrijpen en transparant communiceren tot begrip leidt. Lees hier de (transparante – zie punt 7) reactie van Microsoft. 
  9. Last but not least: doe het, of doe het helemaal niet, er is geen proberen (naar Yoda uit Starwars).

AI als commodity?

Na een korte break konden we met Jeroen in discussie. Het gesprek begon over de mogelijke rol van Microsoft partners zoals Valid. Zoals eerder genoemd nemen de werkzaamheden van Data Wranglers veel tijd in beslag. Valid kan haar klanten helpen door deze taken te helpen automatiseren. Daarnaast zagen we een mogelijk vierde rol, die van Data Business Consultant, de linking pin tussen de 3 rollen en de business.  Is dat een product owner, of een gedeelde verantwoordelijkheid van de Wrangler-Scientist-Artist combinatie?

Ook werd Jeroen gevraagd welke hype hij verwacht na 'AI'. Sterke kansen dicht hij toe aan de wereld van 'augmented' werkelijkheid. Niet in de zin van VR-brillen, maar eerder in een abstractie laag boven technologie. Iets waardoor de complexiteit van de techniek achter de schermen verdwijnt en waarmee leken zelf de rol van 'integrator' kunnen spelen. Als voorbeeld geeft Jeroen een cognitieve zoekmachine die betekenis zoekt in allerlei bestandsformaten, incluis video, beeld en tekst uiteraard. AI zal doordringen in het dagelijks leven. AI zal een commodity worden, net als stroom uit het stopcontact en water uit de kraan, zoals het ook met Cloud is gegaan. Als de technologie een commodity is geworden, raakt de rol van de technische AI-consultant overbodig. De behoefte naar Business Consultancy komt daarvoor in de plaats. Het is dan niet meer nodig te adviseren over wat AI is en wat je ermee kunt, maar uit te leggen hoe je het toepast en hoe je er het meeste aan hebt.

Voordat het zover komt zullen we open interfaces moeten adopteren en open source initiatieven moeten omarmen. Uiteraard horen hier open data initiatieven bij zoals de recente van Microsoft, SAP en Adobe.

Ereplaats

Als dank voor de samenwerking en het boeiende betoog kreeg de Dutch Data Dude door Olivier Giraud een fraaie prent overhandigd die een ereplaats krijgt op de nieuwe werkplek in het hoofdkantoor van Microsoft. De avond werd gezellig afgesloten met een hapje en drankje met de aanwezigen.

Hey Dude, veel succes in de USA. We houden contact. Gelukkig heb je in Megan Bloemsma een goede opvolger.

Terug naar nieuwsoverzicht

Carrières

Eindelijk een omgeving waarin je écht vooruitstrevende cloudoplossingen kan ontwikkelen én jezelf.

Valid is het enige IT-bedrijf waar je werkt aan de technologie van morgen én aan je eigen toekomst. Want technologie alleen brengt de wereld niet veel verder. Daarom investeren wij, vanaf de eerste dag dat je bij ons komt werken, in jou. Met trainingen, opleidingen en de juiste begeleiding, waardoor je altijd blijft ontwikkelen.

Bezoek onze carrièresite

Wij gebruiken cookies om het gebruik van onze website te analyseren en het gebruiksgemak te verbeteren. Door onze website verder te bezoeken ga je hiermee akkoord. Lees meer over cookies.