829:-
Uppskattad leveranstid 7-12 arbetsdagar
Fri frakt för medlemmar vid köp för minst 249:-
Datenqualität ist nicht alles, aber ohne Qualität der Daten ist alles nichts. Oft genug werden die Daten vor Analysen gar nicht oder wenn, nur oberflächlich auf Korrektheit überprüft. Dieses Buch versucht, die essentielle Notwendigkeit der Qualität von Daten transparent zu machen und SPSS Anwendern Lösungen zur Behebung häufig auftretender Probleme an die Hand zu geben. Das Buch führt zunächst ein in Kriterien und Maßnahmen zur Gewährleistung einer definierbaren und nachweisbaren optimalen Datenqualität mit SPSS. Das Buch ist so allgemein gehalten, dass die zusammengestellten Kriterien auf SPSS Datensätze, aber im Prinzip auch auf Data Warehouses (z.B. mittels Clementine im Kapitel 16) angewandt werden können. Das Buch durchzieht eine stringente Logik, enthält unzählige Beispiele (z.B. die Rolle von Ausreißern bei der Entdeckung des Ozonloches über der Antarktis) und ist jedem SPSS und Clementine Anwender zu empfehlen. Kapitel 1 führt in die am häufigsten auftretenden Problembereiche ein, z.B. Vollständigkeit, Einheitlichkeit, Doppelte, Missings, Ausreißer und Plausibilität. Ein erstes, schematisches Konzept verdeutlicht die Zusammenhänge der Kriterien untereinander und die grundsätzliche Bedeutung der Qualität von Daten. Weitere Kriterien für die Qualität von Daten, sowie ihre Kommunikation werden in den Kapiteln 13 und 19 vorgestellt.Kapitel 2 skizziert grundsätzliche Rahmenbedingungen zur Herstellung von Datenqualität, u.a. Ressourcen, die Priorisierung von Zielen (Relevanz) und Kontrolle durch Protokolle (SPSS Syntax).Kapitel 3 beschreibt erste Kontrollmöglichkeiten der Vollständigkeit von Datensätzen, Fällen (Zeilen), Variablen (Spalten) und Werten bzw. Missings.Kapitel 4 stellt zahlreiche Möglichkeiten vor, Uneinheitlichkeit zu identifizieren bzw. in numerischen Werten, Zeiteinheiten und Strings zu vereinheitlichen.Kapitel 5 führt in das Problemfeld des Erkennens, Interpretierens und (ggf.) Ausfilterns von mehrfachen Werten bzw. Datenzeilen ein. Kapitel 6 stellt das Umgehen mit fehlenden Daten (Missings) vor. Nach der Beurteilung von Missings im Hinblick auf Ursachen (Muster), Folgen, Ausmaß und Mechanismen werden zahlreiche Methoden der Rekonstruktion und des Ersetzen von Missings beschrieben: U.a. über die Cold deck-Imputation, zufallsbasierte bzw. logische Ansätze, univariate Schätzung, multivariate Ähnlichkeit (Hot deck-Imputation) oder auch multivariate Schätzung (z.B. Missing Value Analysis).Kapitel 7 erläutert das Erkennen, Interpretieren und Umgehen von bzw. mit Ausreißern. Im Zusammenhang mit den Merkmalen von Ausreißern wird zunächst die besonderen Rolle der Erwartungshaltung ("Frames") diskutiert. Im Anschluss an die Identifikation von univariaten bzw. multivariaten Ausreißern über Maße, Regeln, Tests und Diagramme werden Möglichkeiten des Umgehens mit Ausreißern vorgestellt.Kapitel 8 beschreibt qualitative und quantitative Ansätze zur Überprüfung der Plausibilität. Die Überprüfung der Qualität von Daten in der Praxis wird zunächst an einer einzelnen Variablen erläutert (mit Beispielen für eine kategoriale Variable, eine Stringvariable und eine metrische Variable). Im Anschluss daran wird die Überprüfung der multivariaten Qualität von Daten anhand eines qualitativen, sowie eines genuin quantitativen Ansatzes (Anomalie-Ansatz) vorgestellt.Kapitel 9 stellt das effiziente Überprüfen mehrerer Variablen und Kriterien mittels Prüfregeln vor. Dieses Kapitel stellt den seit SPSS 14 verfügbaren (sofern lizenziert), mächtigen Menüpunkt "Validierung" bzw. die SPSS Prozedur VALIDATEDATA vor. Das Kapitel führt zunächst in die
- Format: Pocket/Paperback
- ISBN: 9783486582147
- Språk: Tyska
- Antal sidor: 489
- Utgivningsdatum: 2007-10-01
- Förlag: de Gruyter Oldenbourg