HousePrices

Das HousePrices-Datenpaket beinhaltet einen Datensatz mit Eigenschaften von 20 433 Häuserblöcken in Kalifornien, die 1990 im Rahmen eines Zensus erhoben wurden. Pro Häuserblock stehen folgende Werte zur Verfügung:

IndexBeschreibung
0Längengrad des Häuserblocks
1Breitengrad des Häuserblocks
2Alter in Jahren
3Anzahl der Zimmer insgesamt
4Anzahl der Schlafzimmer
5Anzahl der Bewohner insgesamt
6Anzahl der Haushalte
7mittleres Jahreseinkommen pro Haushalt in Tausend US-Dollar
8durchschnittlicher Wert pro Haushalt in Tausend US-Dollar

Die Daten können verwendet werden, um eine Regressionsanalyse durchzuführen. Für diesen Anwendungsfall werden die insgesamt 20 433 Objekte (Häuserblocks) in Trainings- und Testdaten aufgeteilt, wobei die zu bestimmende Größe der durchschnittliche Wert pro Haushalt ist:

Trainingsdaten15 324 Objekte (Häuserblöcke)
Testdaten5 109 Objekte (Häuserblöcke)

Wie genau die Daten zu verstehen und zu verwenden sind, wird anhand der folgenden Beispiele erläutert.

Datenquelle

Das HousePrices-Datenpaket wurde anhand von Daten erstellt, die über kaggle zur Verfügung gestellt wurden (abgerufen am 20. November 2022). Diese Daten werden unter der Creative Commons Public Domain 1.0 Dedication License (CC0 1.0) vertrieben. Siehe auch:

R. Kelley Pace, Ronald Barry. 1997. Sparse spatial autoregressions. Statistics & Probability Letters 33. Seiten 291-297.

Lizenzhinweis

Das HousePrices-Datenpaket wird unter der Creative Commons Public Domain 1.0 Dedication License vertrieben:

HousePrices.js29. November 2023Copyright © 2023 by Daniel Scholz

Die genauen Angaben zur Lizenz findest du unter dem folgenden Link: CC0 1.0

Übersicht
Das HousePrices-Datenpaket stellt folgende Funktionen zur Verfügung:
Download
Das HousePrices-Datenpaket steht über folgenden Link zum Download bereit.
Beispiel
Es werden die Daten des HousePrices-Pakets analysiert.
Beispiel
Es werden die Daten des HousePrices-Pakets ausgelesen.