Gäller från och med: Höstterminen 2017
Beslutad av: Professor Thomas Johansson
Datum för fastställande: 2017-03-22
Avdelning: Datavetenskap (LTH)
Kurstyp: Gemensam kurs, avancerad nivå och forskarnivå
Kursen ges även på avancerad nivå med kurskod: EDAN20
Undervisningsspråk: Engelska
Under de senaste 15 åren har de språkteknologiska metoderna mognat avsevärt på grund av att mängden tillgänglig skriven och talad information har ökat kraftigt, vilket har lett till ökande behov av att behandla den automatiskt. Fastän de flesta datorsystem inte enbart ägnar sig åt språkbehandling så finns det numera många applikationer som i någon mån är "språkmedvetna" och har inbyggda språkteknologiska funktioner såsom stavnings- och grammatikkontroll, sökning och sammanfattning av information eller ett talbaserat dialoggränssnitt. Detta gör att fältet är av ökande betydelse för CS-ingenjörer. Kursen ger en inledning till språkteknologins metoder. Den försöker täcka hela fältet från teckenkodning och statistiska språkmodeller till syntaktisk analys, semantik och dialogsystem. Kursen inriktar sig på välbeprövade tillämpningar i industriell skala eller på försöksnivå.
Kunskap och förståelse
För godkänd kurs skall doktoranden
Färdighet och förmåga
För godkänd kurs skall doktoranden
Värderingsförmåga och förhållningssätt
För godkänd kurs skall doktoranden
En översikt över språkteknologi: delområden, tillämpningar och exempel. Korpuslingvistik: Reguljära uttryck, ändliga automater, introduktion till Perl, konkordanser, tokenisering, frekvenslistor, kollokationer. Morfologi och ordklasstaggning: Morfologi, transduktorer, ordklasstaggning. Frasstrukturgrammatiker i Prolog: Konstituenter, syntaxträd, DCG-regler, unifiering. Partiell parsning: Detektering av multiord, detektering av substantivgrupp och verbgrupp, informationsextrahering, utvärdering. Syntaktiska formalismer: Konstituens och dependens, funktioner. Parsning, statisktisk parsning, dependensparsning. Semantik: Formell semantik, lambda-kalkyl, lexikal semantik, predikat-argument-struktur, ramsemantik, semantisk parsning. Diskurs och dialog: Referens och koreferens, diskurs och retorik, diskursrelationer, analys av diskursrelationer, dialog, talhandling, multimodalitet.
Language Processing with Perl and Prolog, Theories, Implementation, and Application. Pierre Nugues, 2014. ISBN 9783642414640.
Undervisningsformer: Föreläsningar, laborationer
Examinationsform: Skriftlig tentamen
Betygsskala: Underkänd, godkänd
Examinator:
Förkunskapskrav: EDAA01 Programmeringsteknik - fördjupningskurs
Kursansvarig: Pierre Nugues <pierre.nugues@cs.lth.se>
Hemsida: http://cs.lth.se/edan20