Projektaufgaben

Aufbauend auf dem Quellcode zur Sentimentanalyse der Hotelbewertungen bieten sich die folgenden beiden Projektaufgaben an, wobei auch hier jeweils das HotelReviews-Datenpaket zu verwenden ist:

Zur Referenz

Aufgabe 1

Führe eine Sentimentanalyse wie zuvor durch, wobei als Trainings- bzw. Testdaten nur die Datensätze berücksichtigt werden sollen, bei denen eine Klassifikation in positiv und negativ eindeutig ist:

Eine Hotelbewertung gilt als positiv, falls fünf Sterne vergeben wurden. Eine Hotelbewertung gilt als negativ, falls ein oder zwei Sterne vergeben wurden. Alle anderen Datensätze (mit drei oder vier Sternen) sollen nicht berücksichtigt werden.

Implementiere und untersuche auch dieses Problem. Analysiere deine Ergebnisse und vergleiche diese mit denen zuvor.

Aufgabe 2

Um eine Sentimentanalyse durchzuführen, haben wir Bewertungen anhand der vergebenen Sterne als positiv bzw. negativ definiert. Die Daten können aber auch als Klassifikationsaufgabe bezüglich der Sterne verwendet werden:

Klassifiziere die Texte der Hotelbewertungen bezüglich der Anzahl an vergebenen Sternen.

Zur Erinnerung: Jede Bewertungen wurde mit ein bis fünf Sternen versehen. Somit handelt es sich um ein Klassifikationsproblem, welches die Texte in fünf Kategorien klassifiziert.

Implementiere und untersuche auch dieses Problem. Schaue dir insbesondere die Konfusionsmatrix an und analysiere deine Ergebnisse.

Quiz
Zur Übersicht