| |||||||
|
Van tekst naar informatieOpdracht 2: Inleiding computerlinguïstiekIn deze opdracht kijken we naar twee computersystemen die automatisch een bepaalde vorm van taalkundige analyse uitvoeren: lemmatisering en parsing. In het bijzonder richten we ons op de manier waarop de systemen omgaan met ambiguïteit in de invoertekst. LemmatiseringMBLEM is een automatische lemmatiser voor een aantal verschillende talen, waaronder het Nederlands. In het college is toegelicht hoe lemmatisers in sommige gevallen met ambiguïteit te maken krijgen. In deze opdracht kijken we naar hoe MBLEM daarmee omgaat.
ParsingOok parsing (zinsontleding) is een taak waar ambiguïteit een grote rol speelt. In dit deel van de opdracht kijken we naar hoe de AMAZON parser, een automatische (full) parser voor het Nederlands, omgaat met ambiguïteit.
De opdracht mag gemaakt worden in groepen van maximaal twee personen. Mail je uitwerking uiterlijk 14 februari naar S.V.M.Canisius@uvt.nl. |