Faculteit der Letteren /
UvT
vakcode
826164 / collegerooster
/ tentamenrooster
Digitale leeromgeving (Blackboard)
Emiel Krahmer (E.J.Krahmer@uvt.nl) and Antal van den Bosch (antalb@uvt.nl)
Dinsdag, 14.45 - 16.30, AZ01
literatuur: Jackson & Moulinier (2002): hoofdstuk 1 tot 1.3
slides, 6-slides-per-page pdf
literatuur:
literatuur: Jackson & Moulinier (2002), hoofdstuk 2
literatuur: Jackson & Moulinier (2002), sectie 3.1
slides, 6-slides-per-page pdf
literatuur: Jackson & Moulinier (2002), sectie 3.2 - 3.6
literatuur: E. Charniak (1997), Statistical Techniques for Natural Language Parsing, AI Magazine 18(4): 33-44.
literatuur: Jackson & Moulinier (2002), hoofdstuk 4 (behalve 4.3.2)
literatuur:
literatuur: Jackson & Moulinier (2002), secties 5.2, 5.3, en 5.4
literatuur:
literatuur: M. De Boni (2000), Information Extraction, Query-Relevant Summarization and Question Answering: an Overview, Technical Report, Dept. of Computer Science, University of York
Internet en andere elektronische informatiesystemen werken op basis van computernetwerken. De computers in deze netwerken kunnen meer dan alleen data doorgeven; ze kunnen ook worden ingezet voor het "begrijpen" van de langskomende data (die voor een groot deel uit taal bestaat), zodat de gebruiker kan worden geholpen in het navigeren door die data. Denk aan het samenvatten van teksten, automatisch vertalen, filteren van ongewenste inhoud, en "slim" zoeken op onderwerpen eerder dan alleen trefwoorden.
Taaltechnologie (ook wel language engineering of natural language processing genoemd) is het computationeel verwerken van taal in gesproken of geschreven vorm. De belangstelling voor taaltechnologie is de afgelopen sterk jaren toegenomen. Hier zijn twee redenen voor aan te voeren. Ten eerste is de verwachting dat taaltechnologie (al dan niet in combinatie met spraaktechnologie) de interactie met machines eenvoudiger kan maken. Door de huidige ontwikkelingen op het gebied van bijvoorbeeld personal digital assistants en de ubiquitous computing ("alomtegenwoordige computer") ontstaat er steeds meer behoefte aan nieuwe en natuurlijke user interface vormen, en taaltechnologie lijkt hierbij van groot belang. Een tweede belangrijke reden is de explosieve groei van informatie. Eenvoudige information retrieval technieken volstaan steeds minder, en de behoefte aan intelligente vormen van information retrieval en information extraction is sterk groeiende. In dit college zullen studenten vertrouwd gemaakt worden met:
In de universitaire wereld is postscript een vaak gebruikte standaard. Het verdient in de ogen van veel onderzoekers de voorkeur om publiek beschikbare document-fileformaten te gebruiken, om collega's niet te dwingen gebruik te moeten maken van dure, niet-publieke document viewers die eigen formaten hanteren.
Draait je computer onder MS Windows, en heb je geen postscript viewer om postscript (.ps) files te bekijken, installeer dan GSview en AFPL Ghostscript. Download de self-extracting executables, dubbel-klik en klaar.
Voor PDF, download de Acrobat Reader.