Einleitung

Neben der automatisierten Bilderkennung gilt es auch in der Computerlinguistik Klassifikationsaufgaben zu lösen, bei denen Verfahren der künstlichen Intelligenz zum Einsatz kommen. Genauer werden in der Computerlinguistik (engl. natural language processing oder kurz NLP) Texte algorithmisch verarbeitet, um gewisse Informationen darin zu erkennen. Um einige Beispiele zu nennen:

  • Die maschinelle Übersetzung von Texten in eine andere Sprache
  • Die Prüfung eines Textes auf grammatikalische Richtigkeit
  • Automatische Generierung von Texten wie Wettervorhersagen auf Grundlage von Daten
  • Chatbots zur automatisierten Beantwortung häufig gestellter Fragen

Ein weiterer Anwendungsfall, mit dem wir uns in diesem Kurs genauer beschäftigen werden, ist die Stimmungserkennung oder Sentimentanalyse. Dabei werden Texte bezüglich ihrer Stimmung bzw. Haltung in die beiden Klassen gut und schlecht bzw. positiv und negativ klassifiziert. Zwei Beispiele, auf die wir im Kurs mehrfach zurückgreifen werden:

  • Bewertung von Kinofilmen: Spricht die Kritik eines Zuschauers für einen guten oder einen schlechten Film?
  • Hotelbewertungen in Reiseportalen: Ist die (textuelle) Kritik eines Gastes positiv oder negativ?

Um noch einen Schritt weiterzugehen: Die Sentimentanalyse kann schließlich auch eingesetzt werden, um Fakenews zu identifizieren.

Literaturhinweise

Die Inhalte des vorliegenden Kurses sind teilweise den folgenden Quellen entnommen, welche auch zur Vertiefung dienen können:

  • M.H. Alam, W.-J. Ryu, S. Lee. 2016. Joint multi-grain topic sentiment: modeling semantic aspects for online reviews. Information Sciences 339: 206-223.
  • M.A. Nielsen. 2015. Neural Networks and Deep Learning. Determination Press, Version vom 12. Dezember 2016.
  • D. Rao, B. McMahan. 2019. Natural Language Processing mit PyTorch: Intelligente Sprachanwendungen mit Deep Learning erstellen. O'Reilly, 1. Auflage. Deutsche Übersetzung von F. Langenau.
  • A. Roy. 2020. A Guide to Text Classification and Sentiment Analysis. Published on Towards Data Science.
  • D.P. Zaun. 1999. Künstliche neuronale Netze und Computerlinguistik. De Gruyter, Berlin, 1. Auflage.
Quiz
Die Computerlinguistik beschäftigt sich mit der algorithmischen Verarbeitung von Texten und die Sentimentanalyse ist ein Teilgebiet der Computerlinguistik.
Die Aussage ist wahr.
Die Aussage ist falsch.
Tokenisierung