WordEmbedding

Das WordEmbedding-Datenpaket beinhaltet eine Embedding-Matrix bezüglich eines Vokabulars bestehend aus 10 000 Wörtern. Jede Zeile der Matrix entspricht der Darstellung eines Wortes des Vokabulars als 200-dimensionalen Vektor. Dabei liegen semantisch ähnliche Wörter im 200-dimensionalen Vektorraum nahe beieinander.

Datenquelle

Die Embedding-Matrix des Datenpakets wurden gemäß der Dokumentation des TensorFlow Projekts TensorBoard Embedding Projector erstellt.

Lizenzhinweis

Das WordEmbedding-Datenpaket wird unter der Creative Commons Public Domain 1.0 Universell License vertrieben:

WordEmbedding.js28. Mai 2025Copyright © 2025 by Daniel Scholz

Die genauen Angaben zur Lizenz findest du unter dem folgenden Link: CC0 1.0

Übersicht
Das WordEmbedding-Datenpaket stellt folgende Funktionen zur Verfügung:
Download
Das WordEmbedding-Datenpaket steht über folgenden Link zum Download bereit.
Beispiel
Es werden die grundlegenden Inhalte und Funktionalitäten des Datenpakets vorgestellt.
Beispiel
Es werden die nächsten Nachbarn eines Wortes ermittelt und ausgegeben.