Maschinelles Übersetzen natürlicher Sprachen im Sommersemester 2021
Beim maschinellen Übersetzen von Texten in einer natürlichen Sprache in eine andere kommen verschiedene Formalismen wie Grammatiken und Automaten zum Einsatz. Diese Vorlesung gibt einen Überblick, wie man solche Formalismen zur Modellierung von natürlichsprachlichen Übersetzungen nutzen kann und wie man ein so modelliertes Übersetzungssystem anhand von Beispielen trainiert.
Organisation
Vorlesung und Übung werden als reine Online-Veranstaltungen (via BigBlueButton) angeboten. Zur Teilnahme ist die Einschreibung in den OPAL-Kurs obligatorisch; die Links zu den BBB-Räumen werden ausschließlich dort und nur für Eingeschriebene bekanntgegeben.
Vorlesung
Die Vorlesung findet wöchentlich am Donnerstag in der 2. DS (9:20 bis 10:50 Uhr) statt.
Foliensatz, der die Vorlesung begleitet: Download (wird während des Semesters aktualisiert)
Die während der Vorlesung auf die Folien geschriebenen Anmerkungen werden nicht zur Verfügung gestellt.
Übung
Die Übung findet wöchentlich am Freitag in der 5. DS (14:50 bis 16:20 Uhr) statt. Der Übungsbetrieb beginnt in der zweiten Vorlesungswoche (d.h. ab 23.04.).
- 16. KW: Einführung in die Wahrscheinlichkeitstheorie (kein Übungsblatt)
- 17. KW: IBM-Model 1 und BLEU-Score
- 18. KW: Rest 17. KW und n-gram models
- 19. KW: Rest 18. KW
- 20. KW: Hidden Markov Models
- 22. KW: Rest zu Hidden Markov Models aus der 20. KW und Training von Hidden Markov Models
- 23. KW: Rest zum Training von Hidden Markov Models aus der 21. KW und Aufgabe 3.3 vom 3. Übungsblatt (Decoding)
- 24. KW: Rest 23. KW und Yamada-Knight-Modell
- 25. KW: Rest 24. KW
- 27. KW: Probabilistic context-free grammars
- 28. KW: Probabilistic context-free grammars
- 29. KW: Konsultation
Hinweis: Alle Materialien sind nur aus dem Netz der TU abrufbar; ggf. über VPN herunterladen.
Sie können sich vorab anhand des vorherigen Vorlesungsdurchlaufs einen Überblick verschaffen.
Literatur
- Baum, L.E., Petrie, T., Soules, G., and Weiss, N. 1970. A maximization technique occurring in the statistical analysis of probabilistic functions of Markov chains. The annals of mathematical statistics, 164–171. [url]
- Brown, P.F., Pietra, V.J.D., Pietra, S.A.D., and Mercer, R.L. 1993. The mathematics of statistical machine translation: parameter estimation. Comput. Linguist. 19, 2, 263–311. [url]
- Chiang, D. 2007. Hierarchical Phrase-Based Translation. Computational Linguistics 33, 2, 201–228. [doi, url]
- Dempster, A.P., Laird, N.M., and Rubin, D.B. 1977. Maximum Likelihood from Incomplete Data via the EM Algorithm. Journal of the Royal Statistical Society. Series B (Methodological) 39, 1, 1–38. [url]
- Dupont, P., Denis, F., and Esposito, Y. 2005. Links between probabilistic automata and hidden Markov models: probability distributions, learning models and induction algorithms. Pattern Recognition 38, 9, 1349–1371. [doi, url]
- Hopcroft, J.E., Motwani, R., and Ullman, J.D. 2006. Introduction to Automata Theory, Languages, and Computation (3rd Edition). Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA. [url]
- Huang, L. and Chiang, D. 2005. Better K-best Parsing. Proceedings of the Ninth International Workshop on Parsing Technology, Association for Computational Linguistics, 53–64. [url]
- Hutchins, W.J. and Somers, H.L. 1992. An introduction to machine translation. London: Academic Press. [url]
- Jurafsky, D. and Martin, J.H. 2000. Speech and Language Processing – An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice-Hall. [url]
- Klein, D. and Manning, C.D. 2003. A* parsing: fast exact Viterbi parse selection. Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology-Volume 1, Association for Computational Linguistics, 40–47. [url]
- Knaster, B. and Tarski, A. 1928. Un théoreme sur les fonctions d’ensembles. Ann. Soc. Polon. Math 6, 133, 2013134.
- Knight, K. 1999. Squibs and Discussion – Decoding complexity in word-replacement translation models. Computational Linguistics 25(4), 607–615. [url]
- Knight, K. 1997. Automating knowledge acquisition for machine translation. AI Mag, 81–96. [url]
- Knight, K. 1999. Decoding complexity in word-replacement translation models. Comput. Linguist. 25, 4, 607–615. [url]
- Knuth, D.E. 1977. A Generalization of Dijkstra’s Algorithm. Inform. Process. Lett. 6, 1, 1–5. [doi]
- Kuich, W. 1998. Formal power series over trees. 3rd International Conference on Developments in Language Theory, DLT 1997, Thessaloniki, Greece, Proceedings, Aristotle University of Thessaloniki, 61–101.
- Lari, K. and Young, S.J. 1990. The estimation of stochastic context-free grammars using the Inside-Outside algorithm. Computer Speech and Language 4, 1, 35–56. [doi, url]
- Lewis II, P.M. and Stearns, R.E. 1968. Syntax-Directed Transduction. Journal of the ACM 15, 3, 465–488. [doi, url]
- Lopez, A. 2008. Statistical machine translation. ACM Comput. Surv. 40, 3, 8:1–8:49. [doi, url]
- McLachlan, G.J. and Krishnan, T. 2008. The EM algorithm and extensions. Wiley, Hoboken, NJ. [url]
- Mohri, M. 2009. Weighted automata algorithms. In: M. Droste, W. Kuich and H. Vogler, eds., Handbook of Weighted Automata. Springer-Verlag, 213–254.
- Och, F.J. and Ney, H. 2003. A systematic comparison of various statistical alignment models. Computational Linguistics 29, 1, 19–51. [doi, url]
- Prescher, D. 2005. A Tutorial on the Expectation-Maximization Algorithm Including Maximum-Likelihood Estimation and EM Training of Probabilisitic Context-Free Grammars. University of Amsterdam. [url]
- Tarski, A. 1955. A lattice-theoretical fixpoint theorem and its applications. Pacific J. Math. 5, 2, 285–309. [url]
- Wang, Y.-Y. and Waibel, A. 1997. Decoding algorithm in statistical machine translation. Proceedings of the eighth conference on European chapter of the Association for Computational Linguistics, Association for Computational Linguistics, 366–372. [doi, url]
- Yamada, K. and Knight, K. 2001. A Syntax-based Statistical Translation Model. Proceedings of the 39th Annual Meeting on Association for Computational Linguistics, Association for Computational Linguistics, 523–530. [doi, url]
- Yamada, K. and Knight, K. 2002. A Decoder for Syntax-based Statistical MT. Proceedings of 40th Annual Meeting of the Association for Computational Linguistics, Association for Computational Linguistics, 303–310. [doi, url]
- Higuera, C. de la. 2010. Grammatical Inference: Learning Automata and Grammars. Cambridge University Press, New York, NY, USA.
- Bar–Hillel, Y., Perles, M., and Shamir, E. 1961. On formal properties of simple phrase structure grammars. Z. Phonetik. Sprach. Komm. 14, 143–172. [doi]
- Ésik, Z. and Kuich, W. 2003. Formal Tree Series. J. Autom. Lang. Comb. 8, 2, 219–285.
Kontakt
-
Prof. Dr.-Ing. habil. Dr. h.c./Univ. Szeged
Heiko Vogler
Tel.: +49 (0) 351 463-38232 -
Dipl.-Inf.
Richard Mörbitz
Tel.: +49 (0) 351 463-38487