Normal_8747

AMSTERDAM - Federico Sangati deed onderzoek naar het leren van syntactische boomstructuren aan de hand van generalisaties uit een verzameling geannoteerde teksten. Hij richtte zich op verschillende probabilistische modellen, met drie verschillende representaties en zal zijn bevindingen op donderdag 12 januari presenteren in de Agnietenkapel aan de Oudezijds Voorburgwal in Amsterdam.

Sangati formuleerde een algemeen kader (framework) voor het definiëren van generatieve modellen van syntaxis. In elk model vallen de syntactische bomen uiteen in elementaire constructies die opnieuw gecombineerd kunnen worden om nieuwe syntactische structuren te genereren. Voor het leren van zinsstructuren introduceert Sangati een nieuwe methode van Data-Georiënteerd Ontleden (Data-Oriented Parsing). Hierbij worden constructies van willekeurige grootte gebruikt als bouwstenen van het model.

Om de grammatica te beperken tot een kleine, maar representatieve verzameling van constructies worden echter alleen constructies die meerdere keren voorkomen gebruikt als verzameling van voorbeelden.

© Nationale Onderwijsgids