Kursplan för

Språkteknologi
Language Technology

EDAN20F, 7.5 högskolepoäng

Gäller från och med: Höstterminen 2017
Beslutad av: Professor Thomas Johansson
Datum för fastställande: 2017-03-22

Allmänna uppgifter

Avdelning: Datavetenskap (LTH)
Kurstyp: Gemensam kurs, avancerad nivå och forskarnivå
Kursen ges även på avancerad nivå med kurskod: EDAN20
Undervisningsspråk: Engelska

Syfte

Under de senaste 15 åren har de språkteknologiska metoderna mognat avsevärt på grund av att mängden tillgänglig skriven och talad information har ökat kraftigt, vilket har lett till ökande behov av att behandla den automatiskt. Fastän de flesta datorsystem inte enbart ägnar sig åt språkbehandling så finns det numera många applikationer som i någon mån är "språkmedvetna" och har inbyggda språkteknologiska funktioner såsom stavnings- och grammatikkontroll, sökning och sammanfattning av information eller ett talbaserat dialoggränssnitt. Detta gör att fältet är av ökande betydelse för CS-ingenjörer. Kursen ger en inledning till språkteknologins metoder. Den försöker täcka hela fältet från teckenkodning och statistiska språkmodeller till syntaktisk analys, semantik och dialogsystem. Kursen inriktar sig på välbeprövade tillämpningar i industriell skala eller på försöksnivå.

Mål

Kunskap och förståelse

För godkänd kurs skall doktoranden

Färdighet och förmåga

För godkänd kurs skall doktoranden

Värderingsförmåga och förhållningssätt

För godkänd kurs skall doktoranden

Kursinnehåll

En översikt över språkteknologi: delområden, tillämpningar och exempel. Korpuslingvistik: Reguljära uttryck, ändliga automater, introduktion till Perl, konkordanser, tokenisering, frekvenslistor, kollokationer. Morfologi och ordklasstaggning: Morfologi, transduktorer, ordklasstaggning. Frasstrukturgrammatiker i Prolog: Konstituenter, syntaxträd, DCG-regler, unifiering. Partiell parsning: Detektering av multiord, detektering av substantivgrupp och verbgrupp, informationsextrahering, utvärdering. Syntaktiska formalismer: Konstituens och dependens, funktioner. Parsning, statisktisk parsning, dependensparsning. Semantik: Formell semantik, lambda-kalkyl, lexikal semantik, predikat-argument-struktur, ramsemantik, semantisk parsning. Diskurs och dialog: Referens och koreferens, diskurs och retorik, diskursrelationer, analys av diskursrelationer, dialog, talhandling, multimodalitet.

Kurslitteratur

Language Processing with Perl and Prolog, Theories, Implementation, and Application. Pierre Nugues, 2014. ISBN 9783642414640.

Kursens undervisningsformer

Undervisningsformer: Föreläsningar, laborationer

Kursens examination

Examinationsform: Skriftlig tentamen
Betygsskala: Underkänd, godkänd
Examinator:

Antagningsuppgifter

Förkunskapskrav: EDAA01 Programmeringsteknik - fördjupningskurs

Kurstillfällesinformation

Kontaktinformation och övrigt

Kursansvarig: Pierre Nugues <pierre.nugues@cs.lth.se>
Hemsida: http://cs.lth.se/edan20


Fullständig visning