Deutschenglish

Bestimmung und Untersuchung von Dateneigenschaften (BA, MA, WIP)

Interner Betreuer: Matthias Volk

Seit Beginn dieses Jahrzehnts hat sich Big Data als eine vielversprechende Möglichkeit erwiesen um datenintensive Projekte und Anwendung zu entwickeln, die noch vor wenigen Jahren unmöglich erschienen. Unter Verwendung neuartiger Technologien und Techniken können große Mengen an verschiedenartig beschaffenen Daten aus unterschiedlichen Quellen unproblematisch gespeichert, verarbeitet und visualisiert werden. Insbesondere Unternehmen haben die massiven Potentiale erkannt, die sich beispielsweise in der Verbesserung der Wissensschaffung, der Unternehmensagilität, der Geschäftsprozesse und der Erreichung von Wettbewerbsvorteilen, wiederfinden lassen.


Die Durchführung solcher Projekte stellt für Unternehmen, allerdings, häufig eine große Aufwendung dar, die grundlegende Änderungen in vielen Bereiche mit sich ziehen kann, vor allem hinsichtlich der bestehenden Infrastruktur. Daher stellt die Umsetzung solcher Vorhaben eine strategische Entscheidung dar, die auf Basis eines tiefgreifenden Verständnisses getätigt werden muss.


Ausgangsbasis bilden für die Durchführung solcher Projekte die zu verarbeitenden Daten. Die unterschiedliche Beschaffenheit, die sich aus Eigenschaften, wie beispielsweise der Menge, Struktur oder Vertrauenswürdigkeit ergeben, führt dazu das besondere technologische Entscheidungen berücksichtigt werden müssen. In vielen Fällen sind die einzusetzenden Technologien und Tools nicht gleichermaßen für die Daten geeignet. Um ein Unterstützung bei diesem Auswahlprozess gewährleisten zu können ist es nicht nur notwendig zu wissen welche Eigenschaften beachtet werden sollten, auch der Umfang der Ausprägung spielt dabei eine maßgebliche Rolle.


Das Ziel dieser Arbeit soll es sein, einen Überblick über die im Kontext Big Data´s existierenden Datencharakteristiken zu erlangen und dabei geeignete Metriken für deren Bestimmung zu definieren. So lässt sich beispielsweise die Eigenschaften der Menge der Daten über die Dateigröße, deren Anzahl oder beides bestimmen. Zukünftig soll damit ermöglicht werden, dass die Datenbasis noch effektiver für die Auswahl der richtigen Technologien nutzbar gemacht werden kann.
Der Umfang kann abhängig von der gewählten Form abweichen.