Welke informatie kun je halen uit tekstuele databronnen, zoals meldingen van burgers en bedrijven? Kun je de meldingen bijvoorbeeld groeperen, of een plotselinge stijging in urgente meldingen over een bepaald voedingsmiddel signaleren?

De Nederlandse Voedsel- en Warenautoriteit (NVWA) is verantwoordelijk voor handhaving van de voedsel- en warenwet. Zij controleren de kwaliteit van ons voedsel, maar ook van niet-eetbare waren zoals speelgoed. Om calamiteiten eerder te signaleren en sneller op urgente meldingen te kunnen reageren, voerde EOM als pilot een text mining-analyse uit op meldingen in het meldingensysteem van de NVWA.

Meldingen

De NVWA biedt burgers en bedrijven de gelegenheid misstanden te melden via verschillende kanalen. Deze meldingen worden verzameld in een centraal systeem en op individuele basis opgepakt.

Maar wat als er in een bepaalde periode plots meer meldingen binnenkomen over een onderwerp? Kun je dit in een vroeg stadium signaleren en zo eerder reageren op calamiteiten? En is het voorspellen van de ernst van individuele meldingen misschien ook waardevol?

Toegepaste SAS Solutions

We hebben onder meer gebruikt gemaakt van deze SAS Solutions:

SAS Enterprise Guide
SAS Enterprise Miner/Text Miner
SAS Visual Analytics

EOM onderzocht of het met text mining via SAS Text Miner mogelijk was om meer informatie uit de meldingen te halen, zoals welke onderwerpen op een bepaald moment vooral onder de aandacht zijn. Ook onderzochten we methoden voor de signalering van calamiteiten.

Data Management

Om tekstbestanden van de meldingen in te lezen, op te schonen en te kunnen combineren met gegevens die zijn opgeslagen in het meldingensysteem hebben we eerst een datastroom ingericht. Het resultaat: één dataset met daarin alle benodigde gegevens voor text mining.

Analytics – Text Mining

Toepassing van text mining op deze dataset liet zien dat we waardevolle voorspellingen konden doen over bijvoorbeeld de ernst van individuele meldingen. Daarnaast zetten we een mogelijke dataflow op voor het signaleren van grote calamiteiten.

Resultaat

Uit de pilot bleek dat het breder uitrollen van text mining zeker waardevolle resultaten op kan leveren voor de NVWA. Daarnaast bleek dat visualisatie van gegevens direct vanuit de bestaande applicatie ook op korte termijn veel inzicht kon bieden. Beide ingangen worden intern verder uitgewerkt.