Waarom Google niet alles vinden kan

Nieuws | de redactie
22 januari 2009 | "Google vindt echt niet alles." Prof. dr. ir. Jan Scholtes gaat in zijn UM-oratie het ontstaan en de toekomst van text mining uitdiepen.

Text mining richt zich op het ontwikkelen van diverse geavanceerde wiskundige, statistische en taalkundige patroonherkenning in grote hoeveelheden elektronische informatie. Daarbij gaat het om een brede range van zaken als documenten, e-mails en chatsessies. Met die patronen en kenmerken kan men beter zoeken en sneller inzichten krijgen die anders verborgen blijven. In plaats van te zoeken op woorden wordt er gezocht op taalkundige patronen van woorden, dat is zoeken op een hoger niveau. Text mining kan dat vinden wat niet gevonden wil worden. Zo wordt deze vorm van zoeken nu ook door diverse financiële instellingen gebruikt voor het analyseren van hun rol in de kredietcrisis.

Kredietcrisis en risicomanagement
“Google of andere internet zoekmachines vinden echt niet alles, ze vinden alleen de beste en meest populaire antwoorden. Juist in fraude onderzoek wil je niet alleen de beste documenten vinden maar alle mogelijke documenten. Op dit moment is text mininig dan ook een belangrijk instrument in het achterhalen van wie er verantwoordelijk is voor de kredietcrisis. Zo maken verschillende financiele instellingen gebruik maken van onze text-mining technologie om zich voor te bereiden op hoorzittingen van de toezichthouders.

Maar niet alleen in het opsporen van wie wat fout heeft gedaan is text mining belangrijk, ook in het voorkomen van een volgende crisis is text mining onontbeerlijk. Banken en financiële instellingen zullen beter risicomanagement moeten voeren en daarbij is controle over de enorme hoeveelheid elektronische informatie essentieel, hoe meer inzicht je hebt hoe eerder je in kunt grijpen”, aldus prof. Scholtes in een mondelinge toelichting op zijn oratie.

Vooral na 9/11
Professor Scholtes houdt zich al vijfentwintig jaar lang bezig met text mining, eerst vanuit zijn baan bij de Koninklijke Marine Inlichtingendienst, nu als directeur van ZyLAB, een bedrijf dat geavanceerde zoeksoftware levert aan onder andere de Belastingsdienst, de FBI, het Witte Huis en alle VN-oorlogstribunalen. De software is ook gebruikt in grote juridische processen als de O.J. Simpson zaak in 1993, de ENRON zaak en recent bij de Ahold affaire.

“Text mining is midden jaren tachtig van de vorige eeuw ontwikkeld binnen veiligheids- en inlichtingendiensten als hulp bij opsporing van fraude en is vooral na 9/11 populair geworden. Omdat de hoeveelheid elektronische informatie alleen maar toe zal nemen, denk aan de complexe structuur van emailbestanden en de gigantische hoeveelheden instant messaging, chat sessies, sociale netwerken, geluid, foto’s en video’s die op ons afkomen, moeten er steeds nieuwe text mining technieken ontwikkeld worden.” Scholtes voorziet dat text mining in deze toenemende ‘information-overload’ straks onontbeerlijk is voor juridisch, medisch en economisch onderzoek.






«
Schrijf je in voor onze nieuwsbrief
ScienceGuide is bij wet verplicht je toestemming te vragen voor het gebruik van cookies.
Lees hier over ons cookiebeleid en klik op OK om akkoord te gaan
OK