.get
Die Funktion WordEmbedding.get() erwartet keine (verpflichtende) Argumente.
Es wird die Embedding-Matrix bestehend aus 10 000 Zeilen und 200 Spalten zurückgegeben. Jede Zeile kodiert die Darstellung eines Wortes des Vokabulars im 200-dimensionalen Vektorraum.
Es kann folgende Option verwendet werden:
Variable | Datentyp | Hinweis | Default-Wert |
dimension | Zahl | 2, 3 oder 200 | 200 |
Mittels der Option dimension kann auch eine reduzierte Variante der Embedding-Matrix erhalten werden. Genauer wurde dazu eine Hauptkomponentenanalyse (PCA) durchgeführt, um die Embedding-Matrix auf 2 bzw. 3 Dimensionen zu reduzieren.