Ziekenhuizen beschikken over grote hoeveelheden data, maar die data staat verspreid over meerdere systemen, is niet altijd compleet en bevat veel vrije tekst. Daardoor kost het onderzoekers vaak weken of maanden om een dataset te verzamelen die geschikt is voor analyse. Tegelijkertijd neemt de vraag naar data toe. PROMs, vragenlijsten, labwaarden, verslaglegging en nacontroles zorgen voor steeds grotere informatiestromen.
Het probleem is niet dat er te weinig data is, maar dat er geen uniforme en geautomatiseerde manier bestaat om grote hoeveelheden data snel, betrouwbaar en volgens dezelfde definities beschikbaar te maken, zonder dat dit meer tijd kost naarmate de dataset groeit.