Normal_6052

Waar de spellingcorrectie van Word geen fout ziet in de zin ‘Hij zij dat hij naar huis ging', lukt dat Valkuil.net wel. Het correctieprogramma, ontwikkeld aan Tilburg University, wordt op 31 mei gelanceerd tijdens het symposium De automatische taalhulp.

Het bijzondere van Valkuil.net is dat het weliswaar correct geschreven, maar foutief gebruikte taal herkent. Waar de meeste spellingcorrectors zich beperken tot het herkennen van typefouten (‘historisi') en grammaticale fouten (d/t-fouten), is Valkuil.net in staat om specifieke verwarringen te herkennen tussen bestaande woorden (zoals ‘zei' en ‘zij') evenals onterecht gesplitste woorden (‘verpleeg kundige') .

Het programma krijgt dat voor elkaar, omdat het niet werkt met een vooraf ingevoerde woordenlijst of taalkundige kennis, maar louter kijkt naar de context waarin een woord staat. Om de zin ‘hij zij dat hij naar huis ging' als voorbeeld aan te halen: elk woord is goed geschreven, maar uit de context blijkt dat er toch iets niet klopt.

Om dit onder de knie te krijgen, is het programma ‘gevoed' met grote hoeveelheden Nederlandse tekst, opdat het langzaam maar zeker leert wat normaal taalgebruik is, en wat afwijkt. Valkuil.net is dan ook een voorbeeld van waartoe training van computers op basis van grote hoeveelheid informatie, maar zonder vooraf ingevoerde regels of kennis, kan leiden.

Implicit Linguistics
Valkuil.net komt voort uit het onderzoeksproject Implicit Linguistics, uitgevoerd aan Tilburg University bij het Tilburg center for Cognition and Communication. Het project, geleid door Antal van den Bosch, werkte ook aan een automatisch vertaalsysteem, en brengt nu de spellingcorrector Valkuil.net uit om te laten zien wat er technisch mogelijk is.

Door te leren van feedback van online gebruikers wil het onderzoeksteam het systeem gaandeweg verbeteren. Het systeem is niet perfect: het mist nog wel eens echte fouten en corrigeert soms onterecht een prima woord.

De huidige vorm van Valkuil.net, een webpagina met daaronder een webservice, is een eenvoudige illustratie van cloud computing: een dienst die ergens op internet beschikbaar is en toegankelijk is voor mensen (via de webpagina) of software (via de webservice).