Waarom Google niet alles vinden kan

Nieuws | de redactie

22 januari 2009 | "Google vindt echt niet alles." Prof. dr. ir. Jan Scholtes gaat in zijn UM-oratie het ontstaan en de toekomst van text mining uitdiepen.

Text mining richt zich op het ontwikkelen van diverse geavanceerde wiskundige, statistische en taalkundige patroonherkenning in grote hoeveelheden elektronische informatie. Daarbij gaat het om een brede range van zaken als documenten, e-mails en chatsessies. Met die patronen en kenmerken kan men beter zoeken en sneller inzichten krijgen die anders verborgen blijven. In plaats van te zoeken op woorden wordt er gezocht op taalkundige patronen van woorden, dat is zoeken op een hoger niveau. Text mining kan dat vinden wat niet gevonden wil worden. Zo wordt deze vorm van zoeken nu ook door diverse financiële instellingen gebruikt voor het analyseren van hun rol in de kredietcrisis.

Kredietcrisis en risicomanagement
“Google of andere internet zoekmachines vinden echt niet alles, ze vinden alleen de beste en meest populaire antwoorden. Juist in fraude onderzoek wil je niet alleen de beste documenten vinden maar alle mogelijke documenten. Op dit moment is text mininig dan ook een belangrijk instrument in het achterhalen van wie er verantwoordelijk is voor de kredietcrisis. Zo maken verschillende financiele instellingen gebruik maken van onze text-mining technologie om zich voor te bereiden op hoorzittingen van de toezichthouders.

Maar niet alleen in het opsporen van wie wat fout heeft gedaan is text mining belangrijk, ook in het voorkomen van een volgende crisis is text mining onontbeerlijk. Banken en financiële instellingen zullen beter risicomanagement moeten voeren en daarbij is controle over de enorme hoeveelheid elektronische informatie essentieel, hoe meer inzicht je hebt hoe eerder je in kunt grijpen”, aldus prof. Scholtes in een mondelinge toelichting op zijn oratie.

Vooral na 9/11
Professor Scholtes houdt zich al vijfentwintig jaar lang bezig met text mining, eerst vanuit zijn baan bij de Koninklijke Marine Inlichtingendienst, nu als directeur van ZyLAB, een bedrijf dat geavanceerde zoeksoftware levert aan onder andere de Belastingsdienst, de FBI, het Witte Huis en alle VN-oorlogstribunalen. De software is ook gebruikt in grote juridische processen als de O.J. Simpson zaak in 1993, de ENRON zaak en recent bij de Ahold affaire.

“Text mining is midden jaren tachtig van de vorige eeuw ontwikkeld binnen veiligheids- en inlichtingendiensten als hulp bij opsporing van fraude en is vooral na 9/11 populair geworden. Omdat de hoeveelheid elektronische informatie alleen maar toe zal nemen, denk aan de complexe structuur van emailbestanden en de gigantische hoeveelheden instant messaging, chat sessies, sociale netwerken, geluid, foto’s en video’s die op ons afkomen, moeten er steeds nieuwe text mining technieken ontwikkeld worden.” Scholtes voorziet dat text mining in deze toenemende ‘information-overload’ straks onontbeerlijk is voor juridisch, medisch en economisch onderzoek.

Toepassingen

« HBO haalt bètatekort in

Navigatie

Categorieën

ScienceGuide gaat verder

Waarom Google niet alles vinden kan

Meest Gelezen

Wederom intimidatie van journalisten door universiteit, nu in Delft

‘Burgerschapsonderwijs moet ook verplicht worden in hbo en wo’

Raad van State: laat taaltoets nog niet gelden voor hbo-opleidingen

Vrouwen houden universiteit draaiende, maar krijgen daarvoor geen waardering

Extra geld voor bètafaculteiten is daar nooit terechtgekomen

Laatste artikelen

‘Internationalisering hoger onderwijs is voortzetting van kolonialisme en neoliberalisme’

‘Als we niet investeren in Leven Lang Ontwikkelen, worden we een Incarijk’

‘Ook studenten hebben academische vrijheid’

Na Dijsselbloem wil ook NSC bindende afspraken over blijfkans internationale studenten

‘Tegengaan fraude door studenten vergt andere strategie dan nu’