WordEmbedding
Das WordEmbedding-Datenpaket beinhaltet eine Embedding-Matrix bezüglich eines Vokabulars bestehend aus 10 000 Wörtern. Jede Zeile der Matrix entspricht der Darstellung eines Wortes des Vokabulars als 200-dimensionalen Vektor. Dabei liegen semantisch ähnliche Wörter im 200-dimensionalen Vektorraum nahe beieinander.
Datenquelle
Die Embedding-Matrix des Datenpakets wurden gemäß der Dokumentation des TensorFlow Projekts TensorBoard Embedding Projector erstellt.
Lizenzhinweis
Das WordEmbedding-Datenpaket wird unter der Creative Commons Public Domain 1.0 Universell License vertrieben:
WordEmbedding.js | 28. Mai 2025 | Copyright © 2025 by Daniel Scholz |
Die genauen Angaben zur Lizenz findest du unter dem folgenden Link: CC0 1.0