.get

Die Funktion WordEmbedding.get() erwartet keine (verpflichtende) Argumente.

Es wird die Embedding-Matrix bestehend aus 10 000 Zeilen und 200 Spalten zurückgegeben. Jede Zeile kodiert die Darstellung eines Wortes des Vokabulars im 200-dimensionalen Vektorraum.

Es kann folgende Option verwendet werden:

VariableDatentypHinweisDefault-Wert
dimensionZahl2, 3 oder 200200

Mittels der Option dimension kann auch eine reduzierte Variante der Embedding-Matrix erhalten werden. Genauer wurde dazu eine Hauptkomponentenanalyse (PCA) durchgeführt, um die Embedding-Matrix auf 2 bzw. 3 Dimensionen zu reduzieren.

Beispiel
Es wird die Darstellung eines Wortes im 200-dimensionalen Vektorraum ausgegeben.
Beispiel
Es wird die auf zwei Dimensionen reduzierte Embedding-Matrix als Punktwolke dargestellt. Jeder der 10 000 Punkte entspricht der Kodierung eines Wortes des Vokabulars.
.label