Seminar Natural Language Processing im Wintersemester 2015/2016
Allgemeine Informationen
Themengebiete
Verschiedene Themen zur maschinellen Verarbeitung natürlicher Sprachen, z. B.- Formalismen zwischen kontextfreien und kontextsensitiven Grammatiken
- Regelgewinnung aus Baumkorpora
- Parsing von Dependenzstrukturen
Zielgruppen
engagierte Studenten folgender Studiengänge- Bachelor Informatik: Module INF-B-510 (Proseminar), INF-B-520 (Proseminar), INF-B-610 (Proseminar)
- Master Informatik: Modul INF-AQUA (Seminar)
- Diplom Informatik: Module INF-D-520 (Proseminar), INF-D-940 (Seminar)
- Diplom Informatik (Studienordnung 2004 oder älter): Hauptseminar, Fachgebiet Theorie der Programmierung
Voraussetzungen für die Teilnahme
- Bachelor Informatik: Modul INF-B-290 (Theoretische Informatik und Logik)
- Master Informatik: keine; Grundlagenwissen über die Themengebiete wird empfohlen
- Diplom Informatik: Modul INF-D-330 (Theoretische Informatik und Logik)
- Diplom Informatik (Studienordnung 2004 oder älter): Grundlagen der Theoretischen Informatik
Voraussetzungen für das Bestehen
- fristgerecht und eigenständig Termine mit den Betreuern verabreden (mindestens 1 Woche im Voraus) sowie die geforderten Materialien abgeben
- (nicht für Proseminar) Seminararbeit von 12–15 Seiten, mit Titel, Autor, Einleitung (mind. 1 Seite), vollständigen Referenzen, begrifflich und notationell in sich abgeschlossen, Inhalte mit Beispielen und Bildern anschaulich gemacht; davon eine Vorabversion: inhaltlich vollständig, aber in der Darstellung noch rudimentär
- (nur für Proseminar) Handout 1–2 Seiten (nur ein Blatt!)
- (für alle) Vortrag von 30–35 Minuten, durch Medien geeignet unterstützt: Beamer-Folien, Tafel, physische Folien, Handout etc.; von allem eine Vorabversion: inhaltlich vollständig, aber in der Darstellung noch rudimentär
- Anwesenheit bei allen Vorträgen, aktive Teilnahme an den Diskussionen
- bei Einbringen in eine mündliche Prüfung: Übersichtswissen über die Seminarbeiträge (Kernthesen)
Terminplan
Datum | Ereignis |
---|---|
42. KW, Donnerstag, 15. Oktober 2015, 11:10 Uhr | erstes Treffen und Themenvergabe im Raum APB/3027 (Fakultät Informatik) |
bis 45. KW, 5. November 2015 | Termine mit Betreuern (rechtzeitig verabreden!); Ziel: in der Lage sein, dem Betreuer das Problem und die beschriebenen Ansätze zu skizzieren und auf Nachfragen zu reagieren; Fragen an den Betreuer müssen ganz konkret formuliert werden. |
bis 48. KW, 27. November 2015 | Vorabversion der Seminararbeit abgeben, Termine zur Besprechung machen |
bis 51. KW, 18. Dezember 2015 | fertige Seminararbeit abgeben |
bis 2. KW, 15. Januar 2016 | Vorabversion der Vortragsmaterialien abgeben, Termine zur Besprechung machen |
bis 4. KW, 29. Januar 2016 | fertige Vortragsmaterialien abgeben |
Donnerstag, 04.02.2016 13:00 Uhr | Vorträge im Raum APB/E009 |
Themen
Das Thema des Seminars wird in diesem Semester syntaktisches Parsing sein. Unter syntaktischem Parsing versteht man das Vorhersagen der syntaktischen Struktur eines Satzes. Die syntaktische Struktur kann als Phrasenstruktur oder als Dependenzstruktur verstanden werden. Zum Parsing können unter anderem probabilistische Erweiterungen kontextfreier Grammatiken und mild-kontextsensitiver Formalismen, aber auch Transitionssysteme, von Markovprozessen inspirierte Modelle und Neuronale Netze verwendet werden. Im Seminar werden wir eine Auswahl von Publikationen zu syntaktischem Parsing lesen. Die Einführungsfolien sind aus dem Uninetz abrufbar.
Thema | Literatur | Verwendung | Anmerkungen | Student |
---|---|---|---|---|
Probabilistic models for constituent parsing |
[Col97] [Cha00] |
SEM | ||
Unlexicalized PCFG parsing | [KM03] | PRO | ||
Latent variables for PCFG | [MMT05] | SEM | ||
State splitting and merging | [Pet+06] | PRO | Sebastian Döring | |
Dependency Model with Valence | [KM04] [Kle05] |
SEM | In der Formel für P_STOP(...) auf S. 5 sind Zähler und Nenner vertauscht. Es soll nur der DMV-Teil bearbeitet werden; aber das EM-Training sollte anhand von [Kle05] vollständig dargestellt werden. | |
Transition-based Dependency Parsing | [Niv03] | PRO | Markus Reichert | |
Joint dependency parsing and POS-tagging |
[BN12] | SEM | ||
Graph-based projective dependency parsing | [MCP05] [KMN09, Sec. 4.2.3] |
PRO | Eine Gegenüberstellung von CYK-Parsing und Eisners Algorithmus ist in [KMN09] zu finden. | |
Graph-based non-projective dependency parsing and the hashing trick | [McD+05] [Boh10] |
SEM | A complete description of the Chu-Liu-Edmonds algorithm in Fig. 3 of [McD+05] can be found in [McD06, p. 38]. An explaination of MIRA can be found in [MCP05, Sec. 2.3.1]. |
Markus Napierkowski |
Constituent and dependency parsing with LCFRSs | [MK10] [Mai13, Chp. 8] |
PRO | Man beachte die Errata zu [MK10] und [Kuh13] für eine formale Beschreibung der LCFRS Regelextraktion. | |
Dependency parsing with (deep learned) neural networks |
[CM14] ([Wei+15]) |
SEM | Sebastian Mielke |
Literatur
Einige Downloads sind nur aus dem Universitätsnetz erlaubt. Falls Sie gerade keinen direkten Zugang zum Universitätsnetz haben, können Sie auf das VPN der TU Dresden zurückgreifen.
Wird noch ergänzt.
Hilfsangebote
Wir haben einige Hinweise zum Verfassen schriftlicher Arbeiten online zur Verfügung gestellt. Zögern Sie nicht sich bei Fragen an Ihren Betreuer zu wenden. Je eher ein Problem angesprochen wird, desto einfacher wird seine Lösung ausfallen.
Außerdem möchten wir noch einen Blog-Eintrag zur Vorbereitung und Gestaltung von (wissenschaftlichen) Vorträgen empfehlen. Wichtig ist uns die anschauliche (beispielgetriebene) Darstellung der zentralen Inhalte/ Ideen des bearbeiteten Themas. Die Folien sollten nicht überladen sein. Sie können mit Präsentationsprogrammen oder LaTeX Beamer erstellt werden, sollten aber als PDF abgegeben werden.