We leven in een informatietijdperk. Het is nog nooit zo makkelijk geweest om informatie te vergaren, maar dit heeft ook een keerzijde: we worden informatie moe. Er is een berg aan grafieken, cijfers en verhalen, wat kunnen we nu wel en niet vertrouwen? In deze huidige COVID-19 (ook wel corona) crisis is deze vraag belangrijker dan ooit, kijk maar naar het ‘Nederland gaat Italië achterna’ debacle van een paar weken terug. Het is door misinformatie soms lastig om te bedenken wat überhaupt het nut is van al die data. Om hier een handje bij te helpen, zetten wij daarom de meest voorkomende manieren van datagebruik tijdens de coronacrisis op een rijtje.
Modelleren
Om een zo goed mogelijke schatting te maken over hoe het coronavirus zich zal verspreiden over tijd en ruimte, is modelleren van groot belang. Eenvoudig gezegd is modelleren een vereenvoudigde, wiskundige manier, om een werkelijke situatie zo goed mogelijk te voorspellen. Hoe meer en kwalitatief goede data hiervoor beschikbaar is, hoe dichter de voorspelling bij de werkelijkheid komt. Vervolgens kunnen op basis van deze voorspellingen proactieve maatregelen worden getroffen (zoals het huidige social distancing beleid) en kan de impact daarvan op de verspreiding van het virus in kaart worden gebracht.
Op deze manier heeft het COVID-19 Response Team van het Imperial College in London op basis van de groeifactor van de epidemie in Wuhan en de bevolkingsdichtheid per stad vrij snel kunnen aantonen dat vergaande maatregelen (social distancing, thuisisolatie van geïnfecteerden, isolatie van mogelijk geïnfecteerde familieleden) nodig zijn om het sterftecijfer te verlagen en druk op het zorgsysteem te voorkomen (Ferguson et al., 2020).
Een nadeel van modelleren is dat je, zoals Rutte al zo mooi zei. “…op basis van max 50% van de kennis die je hebt, 100% van de besluiten [wilt] nemen“. Je kan nooit alles weten. Om dit ‘gat’ op te vullen en alsnog een zo goed mogelijke voorspelling te kunnen maken, worden daarom computersimulaties gebruikt om extra data te genereren. Op die manier kan je de beschikbare data aanvullen met waarschijnlijk overeenkomstige data. Je kan dan alsnog een zo goed mogelijke voorspelling doen.
Het is van belang dat de modellen steeds aangevuld worden met nieuwe beschikbare data. Niet alleen ontstaat dan een meer accurate voorspelling, ook brengt dit nieuwe mogelijkheden met zich mee. Met behulp van Machine Learning op basis van CT-scans van patiënten zou men bijvoorbeeld een nieuwe geautomatiseerde diagnose tool kunnen ontwikkelen. Dit zal de druk op het zorgsysteem enorm kunnen verminderen. Een hoop voordelen van het gebruik van data dus. Wel moeten we er rekening mee houden dat de dynamiek van infectieziektes heel complex zijn. Daarom is het een enorm voordeel om ten tijde van deze pandemie proactief te kunnen handelen dankzij modelleren.
Alternatieve Methodes
Naast dat data wordt gebruikt voor het modelleren tijdens de pandemie, zijn er veel meer toepassingen waarbij data een waardevolle ondersteuning kan bieden. Omdat het virus zich van mens tot mens verspreidt brengt de zorg voor mensen in ziekenhuizen of thuisquarantaine ook gevaren met zich mee. Om deze reden werd in China kunstmatige intelligentie (KI) ingezet. Zo werden er bijvoorbeeld Robots van Pudu Technology ingezet om schoon te maken en eten te bezorgen op een veilige manier, door menselijk contact te verminderen. Een ander voorbeeld van toegepaste KI is de inzet van onbemande drones van Terra Drone. Deze drones hebben hulp geboden door medicijnen en testmateriaal efficiënt en veilig te bezorgen. Tot slot kunnen drones gebruikt worden om grote stukken openbare ruimte te patrouilleren, om na te gaan of mensen zich houden aan de door de overheid ingestelde maatregelen.
Een andere populaire KI-toepassing is het inzetten van chatbots. Bij WeChat (het Chinese Whatsapp) worden deze bots gebruikt om reisinformatie te geven aan reizigers die up-to-date willen blijven over corona gerelateerde ov-verstoringen. Daarnaast zijn er chatbots ingezet om mensen medisch advies te geven en op weg te helpen naar relevante websites. Door deze KI-inzet wordt de druk op de telefooncentrales verlicht, en kunnen klanthulpcentra zich zonder (veel) problemen richten op specialistischere noodgevallen
Data kan ook ingezet worden om inzicht te krijgen over de corona besmetting in verschillende landen. Een goed voorbeeld hiervan is het toegenomen internetgebruik in infectiehaarden/getroffen gebieden. De overbelasting van internetproviders kan namelijk direct worden gelinkt aan het relatieve aantal mensen dat thuis zit. Daarnaast worden satellietbeelden ingezet om inzicht te krijgen in bijvoorbeeld de relatieve activiteit van havens en wegen ten opzichte van vóór de crisis.
Open data
De verzamelde data wordt niet alleen in ziekenhuizen en onderzoekscentra gebruikt. Kaggle, een online data-science community, is een mooi initiatief gestart. Een gigantische dataset is geüpload met daarbij tien vragen die, indien beantwoord, kunnen bijdragen in de strijd tegen het coronavirus. Er zijn beloningen uitgeloofd aan knappe koppen die vanuit de data antwoord kunnen geven op de verschillende vragen (dus als jij je onder de noemen ‘knappe koppen’ schaart; neem dan vooral snel een kijkje op de website! zie hier. Data zorgt op deze manier voor een verdeling van de werklast – we zijn niet enkel afhankelijk van gespecialiseerde onderzoekscentra.
Het belang van data tijdens de coronapandemie
Al met al moge het duidelijk zijn dat data veel nuttige toepassingen heeft, ook tijdens deze pandemie. Op de hoogste niveaus van beleidsvorming geven modellen, gebaseerd op data, de nodige kennis en daadkracht. Naast deze modellen biedt data de mogelijkheid mensen te informeren, zowel thuis als in het ziekenhuis. En mochten wij als mens soms even klaar zijn met deze informatiestroom dan kunnen we ons in ieder geval fascineren over robots en drones die gevaarlijk werk uit handen nemen. Of over de verbindende kracht die data heeft om mensen samen te brengen.
Data na corona
Het klinkt ver weg, maar er komt een tijd na corona. Wat gaan we dan doen met de verzamelde data? Het belangrijkste waar datawetenschappers mee aan de slag zullen gaan, is het analyseren van de data en hier waardevolle informatie uit halen, zodat er in de toekomst beter gereageerd kan worden op een soortgelijke situatie. Mogelijke infectiehaarden kunnen tijdig geïdentificeerd worden, risicogebieden preventief beschermd of een virus kan niet eens de mogelijkheid krijgen om te verspreiden. Daarnaast kan na corona aan de hand van de beschikbare data geanalyseerd worden welke maatregelen effectief waren en welke niet.
Kortom, gedurende de pandemie is data van levensbelang. Het biedt een fundering voor het nemen van moeilijke maatregelen en het tijdig kunnen reageren en anticiperen op het virus. Verder is het toepasbaar in de behandeling, preventie en voorspelling van corona en toekomstige virussen. Door het gebruik van data kunnen we als mensheid optimaal weerbaar zijn voor de toekomst.
Gemaakt door Jesse Alma en Thierry van Zundert werkzaam bij trainee.nl detachering bureau gespecialiseerd in Business Analytics & Data Science.
Interessante links:
Ferguson, N. M., Laydon, D., Nedjati-Gilani, G., Imai, N., Ainslie, K., Baguelin, M., … & Dighe, A. (2020). Impact of non-pharmaceutical interventions (NPIs) to reduce COVID-19 mortality and healthcare demand. London: Imperial College COVID-19 Response Team, March, 16
https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge