Hopelijk lees je dit in goede gezondheid, in de breedste zin van het woord. De COVID-19-pandemie vormt een ongekende uitdaging voor onze maatschappij en economie. Misschien zit je thuis met kinderen die de grenzen van jouw geluiddempende koptelefoon opzoeken. Misschien ben je juist helemaal alleen en afhankelijk van technologie als Skype, WhatsApp en de oude vertrouwde telefoon, om zo in contact te blijven met de mensen om je heen, zelfs als het om jouw beste vrienden gaat.
Deze lastige tijden kunnen ons aansporen om nieuwe oplossingen te zoeken – nieuwe manieren om de kinderen bezig te houden, nieuwe plekjes in de buurt om te gaan wandelen, nieuwe hobby's om te leren met behulp van online artikelen en webinars. Veel mensen proberen uit te vinden wat nou waardevol is, zonder van tevoren te weten waar ze eigenlijk naar op zoek zijn.
Voor professionele onderzoekers en andere kenniswerkers is dit bijna dagelijkse routine. Zij navigeren door de beschikbare kennis om relevante informatie te vinden die meer aandacht nodig heeft. Op deze manier doen zij nieuwe inspiratie op voor nieuwe experimenten die uiteindelijk ook iets opleveren.
Ongeveer een maand geleden hoorde ik dat het Allen Institute for Artificial Intelligence een grote dataset van wetenschappelijke artikelen over COVID-19 en coronavirussen gratis beschikbaar heeft gemaakt. Hun doel is simpel: de pandemie bestrijden door innovatie aan te moedigen en te versnellen. Dit trachten zij onder andere door betaalmuren als abonnementen en licentiekosten weg te nemen die normaal gesproken de toegang tot deze beschikbare kennis beperken.
Hun corpus bevat maar liefst 44.000 wetenschappelijke artikelen. Daarmee kunnen kinderen zich zeker vermaken totdat ze weer naar school mogen (stel je eens voor hoeveel plezier een tweejarige zou hebben met deze stapel artikelen en een schaar). En om zo’n ondoordringbare berg aan onderzoeksresultaten te vermijden, zijn er ongetwijfeld diverse mensen die zich aangemoedigd voelen om snel een wandeling te maken. Maar zo'n groot corpus is ook een uitdaging voor de technologie – en dat is precies de reden dat het Allen Institute het heeft gepubliceerd. Door deze gigantische dataset online te zetten, moedigt het instituut intelligent technologiegebruik aan. En wij voelden ons aangesproken.
Inmiddels werk ik al 10 jaar met de InterSystems Natural Language Processing (NLP)-technologie, die er vooral op is gericht om vrij geschreven tekst vanaf de basis te analyseren. Wat de technologie uniek maakt, is dat het proces zich richt op de patronen in natuurlijk taalgebruik. Het hoeft dus geen “expert” te zijn op een bepaald vakgebied of in een bepaald jargon. Dat betekent ook dat NLP zonder vooroordelen werkt, en dat komt bijzonder goed van pas als je gegevens wilt bekijken van een gebied waar je niet in thuis bent – bijvoorbeeld 44.000 wetenschappelijke artikelen over coronavirussen.
Ik heb onze NLP-tool losgelaten op het corpus van het Allen Institute en op Open Exchange gepubliceerd als “content navigator”, zodat iedereen deze gratis kan gebruiken. Onze tool zelf is tevens beschikbaar via open source.
Deze kleine test bleek behoorlijk goed te werken en we besloten om ons experiment als resource aan te bieden voor de deelnemers aan de COVID-19 Challenge hackathon van MIT. Diverse teams hebben gebruik gemaakt van onze content navigator. Nu bieden we de code en een gehoste versie van deze content navigator aan voor iedereen die in deze grote kennisverzameling wil duiken. We zijn ook actief op zoek naar gebruikers die dit naar een nog hoger niveau willen tillen door de code in te bouwen in een oplossing, vooral als deze oplossing kan worden gebruikt om de pandemie sneller de kop in te drukken en ons allemaal weer naar buiten krijgt.
Als je wil helpen, horen we het graag. Stuur een e-mail naar IRIS@InterSystems.com of post een bericht met jouw vragen, ideeën en andere feedback op de GitHub-repository. Het is tijd voor innovatie en om een weg uit deze crisis te vinden.
Lees meer
De route naar een moderne zorgorganisatie E-book voor bestuurders in de zorg