Telefoon voorspelt tweets

Nieuws | de redactie
4 oktober 2013 | Telefoons zijn al redelijk goed in het automatisch aanvullen van tekst. Maar het kan nog beter én veel persoonlijker, ontdekte Nijmeegse student Wessel Stoop. Hij ontwikkelde het woordvoorspellingsysteem Soothsayer, dat leert van de gebruiker én zijn vrienden.

Wessel Stoop, eerder al een van de mensen achter de zelflerende spellingschecker Fowlt, ontdekte tijdens zijn afstudeeronderzoek onder andere dat er niet één manier van voorspellen is die voor iedereen het beste werkt, omdat iedereen anders schrijft. Daarom leert Soothsayer van teksten die de gebruiker zelf eerder heeft geschreven. Daarnaast bleek dat mensen die veel met elkaar communiceren zo veel in hun taalgebruik overeenkomen, dat ook op die manier voorspellingen verder te verbeteren zijn. Met andere woorden: als Soothsayer leert van teksten die je vrienden hebben geschreven, doet het betere voorspellingen dan wanneer het leert van teksten die zijn geschreven door willekeurige Nederlanders.

Soothsayer werkt met teksten die door de gebruiker al eerder geschreven zijn. Door deze teksten te analyseren leert Soothsayer automatisch hoe de gebruiker schrijft. Stel, je traint Soothsayer op je eigen e-mails, en daarin staat heel vaak ‘ik neem de trein’. Als je dan met Soothsayer aan het werk bent, en je hebt getypt ‘ik neem de’, dan zal Soothsayer dat herkennen van het voorbeeldmateriaal, en ‘trein’ voorspellen. Deze letters hoef je dan niet meer in te toetsen. Zelfs wanneer Soothsayer wordt getraind op relatief weinig teksten van een gebruiker, zijn de voorspellingen nog steeds stukken beter dan wanneer hij voorspellingen doet op basis van heel veel algemene teksten in dezelfde taal.

Helft minder toetsaanslagen

Stoop heeft Soothsayer tweets van honderd actieve Twittergebruikers laten voorspellen. Het systeem haalde de beste resultaten als het niet alleen was getraind op de tweets van de gebruikers zelf, maar daarnaast ook de tweets van de mensen met wie deze honderd Twitteraars veel communiceren. Sommige gebruikers zouden zich zelfs meer dan 50 procent van de toetsaanslagen hebben kunnen besparen als ze Soothsayer zouden hebben gebruikt. 

Soothsayer draait op het computerlab van de onderzoeksgroep taal- en spraaktechnologie van de Radboud Universiteit. Om anderen te laten zien wat Soothsayer kan, heeft Wessel Stoop er een website omheen gebouwd. Hierop kan je de taalmodellen van fanatieke bloggers als André Kuipers of fanatieke Twitteraars als Marco Borsato en Youp van ’t Hek ontdekken. Op de site kan je ook je eigen taalmodel laten aanmaken op basis van je eigen tweets.


«
Schrijf je in voor onze nieuwsbrief
ScienceGuide is bij wet verplicht je toestemming te vragen voor het gebruik van cookies.
Lees hier over ons cookiebeleid en klik op OK om akkoord te gaan
OK