Datawetenschappers in een wereld voordat Data Science bestond

Data Science is hot! Maar hoe is de datawetenschap eigenlijk ontstaan? Welke (menselijke) figuren vormen het gezicht achter alle kennis die we nu als ‘logisch’ beschouwen? Het fundament van Data Science is al eeuwen geleden gelegd. Sinds mensenheugenis proberen mensen al bewijs te verzamelen om hun mening te onderbouwen, hoe groot of klein de impact van die mening ook is. Door middel van data hebben de personen die hieronder beschreven zijn, allemaal op hun eigen manier een grote impact gehad op de wereld zoals die nu is. Een streven van elke Data Scientist vandaag de dag!

Tycho Brahe (1546 – 1601) was een Deense Astronoom. Hij was een rijke edelman en stond in goed daglicht bij de toenmalige koning Frederik II, die hem een eiland met een observatorium schonk. Op dit eiland heeft Tycho al zijn sterrenkundige observaties nauwkeurig vastgelegd (data!). Na Tycho’s dood gebruikte zijn leerling Johannes Kepler (1571-1630) deze observaties voor het opstellen van ‘de wetten van Kepler’: Drie natuurkundige wetten die de baan en beweging van hemellichamen beschrijft. Begin 20e eeuw is Tycho opgegraven uit zijn graf in Praag waaruit bleek dat hij hoogst waarschijnlijk is gestorven aan een kwikvergiftiging, in plaats van aan een tot toen bekende blaasontsteking. Kepler mocht Tycho’s waarnemingen niet volledig inkijken tot na Tycho’s dood. Zou dit toeval zijn of zou Kepler hier iets mee te maken hebben? Wat mensen wel allemaal niet over hebben voor goede data!

Ada Lovelace (1815 – 1852) was een Engelse Wiskundige en wordt ook wel als de eerste programmeuse gezien. Ze creëerde een programma voor het eerste prototype van de digitale computer ontwikkeld door Charles Babbage (1791 – 1871). Ze liet zien dat deze computer een serie van complexe berekeningen kon volgen. Bovendien voorzag ze dat deze in de toekomst misschien zelfs in staat zou zijn om afbeeldingen en muziek te interpreteren en manipuleren. Fun fact: De gokverslaafde Ada gebruikte haar kennis zeer waarschijnlijk om een programma te schrijven welke de uitkomst van paardenraces voorspelde.

Florence Nightingale (1820 – 1910), Britse grondlegster van de moderne verpleegkunde en eerste vrouwelijke lid van de Royal Statistical Society. In het ziekenhuis waar zij werkte tijdens de Krimoorlog stierven relatief veel soldaten. Uit onderzoek bleek dat dit voortkwam uit een tekortkoming aan sanitaire voorzieningen, frisse lucht en schoon drinkwater. Ze ontwierp de zogeheten ‘polar area’ grafiek om dit kracht bij te zetten. Hierin werd een cirkel in twaalf gelijken delen gesplitst waarin elk deel 1 maand van het jaar representeerde. De bijdrage van elke doodsoorzaak aan het totaalaantal doden was proportioneel aan de radius. Door middel van kleur gaf ze de verschillende doodsoorzaken weer waarin rood stond voor oorlogswonden, blauw voor ziektes ten gevolge van slechte hygiëne en zwart voor overige doodsoorzaken. In de rechter grafiek zijn de doodsoorzaken en sterftecijfers weergegeven vóórdat er verbeteringen waren doorgevoerd met betrekking tot de hygiëne in de militaire ziekenhuizen. In de linker grafiek daarentegen, gaf Florence de drastische daling in sterfte weer na het verbeteren van de hygiëne7. Zo gebruikte Florence het pooldiagram om de regering ervan te overtuigen dat er meer geïnvesteerd moest worden in hygiëne en introduceerde hiermee het gebruik van statistiek in de gezondheidszorg. Sommige critici vandaag de dag beweren dat een gestapelde staafdiagram haar punt sterker had overgebracht. Tegenstanders hiervan leggen uit dat juist op deze manier, effect van de verschillende seizoenen op de sterftecijfers beter zichtbaar was. Zo zie je maar weer dat dezelfde data op verschillende manieren kan worden gevisualiseerd, afhankelijk van de boodschap die je wilt overbrengen.

William Sealy Gosset (1876 – 1937), bierbrouwer en chemicus, werkzaam in de Guinness brouwerij in Dublin én het brein achter de Student’s t-test. Hij paste zijn statistische kennis toe om het brouwproces van Guinness te perfectioneren. Nadat een van zijn collega’s in een publicatie fabrieksgeheimen openbaar had gemaakt, mocht er door de wetenschappers werkzaam bij Guinness niet meer gepubliceerd worden. Echter werd William’s uitvinding als strikt wiskundig en filosofisch gezien en mocht hij daarom, onder een pseudoniem, toch publiceren. Je raadt het al; zijn pseudoniem was ‘Student’. Hij ontwikkelde de Student’s t-test om zo de kwaliteit van kleine bier samples te kunnen vertalen naar grote hoeveelheden. Dit benadrukte de intieme connectie tussen statistiek en het oplossen van praktische problemen; een echte Data Scientist!

Alan Mathison Turing (1912 – 1954), uitvinder van de Turing Machine, vader van de computer, grondlegger van kunstmatige intelligentie, en breker van de Duitse Enigma-communicatiecode tijdens WWII. Zoals je ziet heeft Alan een redelijk indrukwekkend CV, deze man kan echt niet missen in het rijtje van invloedrijke data-figuren! Al op 22-jarige leeftijd beschreef hij de ‘Turing Machine’, een model die de kracht van computerprogramma’s vandaag de dag test. Een paar jaar later, kraakte Alan als cryptanalyticus in de tweede wereldoorlog de geheime code van de Duitsers, waarmee hij de oorlog naar inschatting met twee jaar verkortte. In 1950 beschreef Alan de ‘Turingtest’ waarmee hij de fundering voor kunstmatige intelligentie legde. De Turingtest is een experiment waarin hij onderzocht of een machine menselijke intelligentie kan vertonen. Alan’s conclusie; hij zag niet in waarom niet. Helaas maakte deze held een einde aan zijn leven op 42-jarige leeftijd, nadat hij chemisch gecastreerd werd vanwege homoseksualiteit, wat toentertijd illegaal was. In 2009, 55 jaar na zijn dood, heeft de Britse overheid haar publieke excuses aangeboden aan Alan Turing.

Bronnen:

;