|
-
MBT
MBT is een snelle, efficiente "part-of-speech tagger" (toekenner
van syntactische woordklassen), die automatisch is gegenereerd vanuit
een geannoteerd voorbeeldcorpus. Het Nederlands is een van de te
testen talen in deze webdemo.
-
NeXTeNS
NeXTeNS staat voor `Nederlandse Extensie voor Tekst naar
Spraak'. Het project heeft als doel om een multi-platform, open source
tekst-naar-spraak systeem te ontwikkelen voor het Nederlands, dat vrij
beschikbaar is voor onderzoek en onderwijs. De projectpagina biedt een
online demo, en biedt de mogelijkheid de software te downloaden.
-
TreeTalk
TreeTalk zet losse woorden om in hun fonemische transcriptie, ofwel
hun uitspraak, gerepresenteerd in een ASCII-variant van het Internationaal
Fonetisch Alfabet. De demo voorziet ook in beluisterbare spraak: de
genereerde fonemische transcriptie wordt in een spraaksignaal omgezet
(in WAV of AU formaat) via MBROLA.
-
MBLEM
en MBMA
MBLEM
is een lemmatizeerder, die woordvormen terugbrengt naar hun niet-geinflecteerde vorm (lemma). Werkwoordsvormen worden teruggebracht naar hun infinitief; zelfstandige naamwoorden naar hun enkelvoud.
MBMA
analyseert de diepere morfologische structuur van Nederlandse
woordvormen: alle morfemen, hun lemma en hun syntactische woordklasse
of derivationele/inflectionele eigenschappen.
-
MBWSD-D
probeert via de context de betekenis vast te stellen
van 156 veelvoorkomende Nederlandse woorden. Probeer klassiekers als "Wij zagen het meisje in het bos."
-
Frasometer
De Frasometer visualiseert de graden van verrassing in Nederlandse
zinnen. Verrassende woorden of woordgroepen worden groot en rood
weergegeven; verwachte woorden of woordgroepen (vaste uitdrukkingen,
normale woordcombinaties) worden klein weergegeven. De visualisatie
leest soms als een richtlijn voor de plaatsing van accent bij
voorlezen. De onderliggende statistiek is log-likelihood schatting van
de associatiesterkte van woord-ngrammen, met n tussen 2 en 25,
gebaseerd op een 120-miljoen-woordencorpus van Nederlandse
krantentekst.
|
|