Faculteit der Letteren /
KUB
vakcode
826164 / collegerooster
/ tentamenrooster
Digitale leeromgeving (Blackboard)
Emiel Krahmer (E.J.Krahmer@kub.nl) and Antal van den Bosch (antalb@kub.nl)
Woensdag, 13.45 - 15.30, PZ914
In de universitaire wereld is postscript een vaak gebruikte standaard. Het verdient in de ogen van veel onderzoekers de voorkeur om publiek beschikbare document-fileformaten te gebruiken, om collega's niet te dwingen gebruik te moeten maken van dure, niet-publieke document viewers die eigen formaten hanteren.
Draait je computer onder MS Windows, en heb je geen postscript viewer om postscript (.ps) files te bekijken, installeer dan GSview en AFPL Ghostscript. Download de self-extracting executables, dubbel-klik en klaar.
Voor PDF, download de Acrobat Reader.
literatuur: M. Hearst (1999), Untangling text data mining, In Proceedings of 37th Annual Meeting of the Association for Computational Linguistics, ACL'99, pp. 3-10.
literatuur: Sabine Buchholz and Walter Daelemans, SHAPAQA: Shallow Parsing for Question Answering on the World Wide Web, in Proceedings of the Euroconference on Recent Advances in Natural Language Processing (RANLP), Tsigov Chark, Bulgaria, 5-7 September, pp. 47-51, 2001.
literatuur:
Learning to Extract Symbolic Knowledge from the World Wide Web.
M. Craven, D. DiPasquo, D. Freitag, A. McCallum, T. Mitchell, K. Nigam and S. Slattery.
Proceedings of the 15th National Conference on Artificial Intelligence (AAAI-98).
literatuur: Mani Inderjeet and Mark Maybury (2001), Automatic summarization. Tutorial, ACL/EACL-2001, Toulouse, France. (PDF)
literatuur: M. Spitters (2000), Comparing feature sets for learning text categorization. In Proceedings RIAO 2000, Paris, France, pp. 1124-1135.
De presentatie van Jakub Zavrel (Textkernel) is voor studenten ABVI te downloaden vanaf de Blackboard pagina.
literatuur: E. Krahmer (2001), The Science and Art of Voice Systems.
literatuur: E. Charniak (1997), Statistical Techniques for Natural Language Parsing, AI Magazine 18(4): 33-44.
literatuur: E. Levin, R. Pieraccini and W. Eckert (2000). A Stochastic Model of Human-Machine Interaction for Learning Dialogue Structures, IEEE Transactions on Speech and Audio Processing 8(1):11-23.
literatuur:
Internet en andere elektronische informatiesystemen werken op basis van computernetwerken. De computers in deze netwerken kunnen meer dan alleen data doorgeven; ze kunnen ook worden ingezet voor het "begrijpen" van de langskomende data (die voor een groot deel uit taal bestaat), zodat de gebruiker kan worden geholpen in het navigeren door die data. Denk aan het samenvatten van teksten, automatisch vertalen, filteren van ongewenste inhoud, en "slim" zoeken op onderwerpen eerder dan alleen trefwoorden.
Taaltechnologie (ook wel language engineering of natural language processing genoemd) is het computationeel verwerken van taal in gesproken of geschreven vorm. De belangstelling voor taaltechnologie is de afgelopen sterk jaren toegenomen. Hier zijn twee redenen voor aan te voeren. Ten eerste is de verwachting dat taaltechnologie (al dan niet in combinatie met spraaktechnologie) de interactie met machines eenvoudiger kan maken. Door de huidige ontwikkelingen op het gebied van bijvoorbeeld personal digital assistants en de ubiquitous computing ("alomvertegenwoordige computer") ontstaat er steeds meer behoefte aan nieuwe en natuurlijke user interface vormen, en taaltechnologie lijkt hierbij van groot belang. Een tweede belangrijke reden is de explosieve groei van informatie. Eenvoudige information retrieval technieken volstaan steeds minder, en de behoefte aan intelligente vormen van information retrieval en information extraction is sterk groeiende. In dit college zullen studenten vertrouwd gemaakt worden met: