Weil es sich meist nur um scheinbar belanglose Informationen handelt, sind Konsumenten aller Welt oft bereit, jegliche Daten mehr oder weniger freiwillig und oft kostenlos zur Verfügung zu stellen – ohne sich darüber Gedanken zu machen. Doch was steckt wirklich hinter dem Wandel von Daten, was für Daten gibt es eigentlich und wie können Sie Ihre Daten optimal verwalten und schützen?
Einige von Ihnen können sich vielleicht noch gut daran erinnern, denn lange ist es noch nicht her: Die Datenerhebung im Büro erfolgte auf Notizzetteln, erreichte per Fax den Adressaten oder wurde von per Schreibmaschine abgetippt. Für die Speicherung dieser Daten musste dann ein Aktenordner oder in Ausnahmefällen auch mal der Rollcontainer unter dem Schreibtisch herhalten.
Doch im heutigen digitalen Zeitalter schaut das Ganze schon ganz anders aus: An nahezu jedem Arbeitsplatz steht ein Computer, beim Einkaufen wird fleißig die Karte zum Punkte sammeln vorgezeigt oder zum Bezahlen schnell die Uhr oder das Smartphone an das Kartenlesegerät gehalten. Egal ob wir uns neue Schuhe im Onlineshop unseres Vertrauens kaufen oder für die Reservierung von Kinokarten am Abend zahlreiche persönliche Daten angeben: Was auch immer wir in der heutigen Zeit machen, wir sind umgeben von Daten. Doch was sind Daten eigentlich genau und welche Arten von Daten gibt es eigentlich?
Das Daten 1×1: Welche Arten von Daten gibt es überhaupt?
Daten können so vielfältig sein. Wussten Sie, dass es verschiedene Arten von Daten gibt? Wir führen Sie einmal durch das Daten 1×1: Welche Daten gibt es eigentlich und wofür werden Sie benötigt?
- Strukturierte Daten: Jeder der schon mal mit Excel gearbeitet hat, hat vielleicht strukturierte Daten gesehen. Daten, die einem vorgegebenen Format folgen, also die Datentypen immer gleich sind. Solche Daten werden häufig in SQL-Datenbanken gespeichert und lassen sich relativ leicht auswerten.
- Semistrukturierte Daten: Für eine Auswertung etwas aufwändiger sind semi-strukturierte Daten wie beispielsweise der Inhalt eines JSON-Objekts. Die Informationen können dabei um weitere Attribute ergänzt oder weggelassen werden, sodass schon eine Art Struktur erkennbar ist. Die Tatsache, die kein Objekt dem anderen gleichen muss macht diese Daten dann eben semi-strukturiert.
- Unstrukturierte Daten: Als dritten Datentypen bilden unstrukturierte Daten die letzte Kategorie. Hier werden alle Daten aus Emails, Bild- oder Tondateien und alle anderen Daten zusammengefasst, bei denen keine Struktur vorhanden oder erkennbar ist.
Doch wie geht man nun richtig mit der Flut an Daten um?
Der richtige Umgang mit Daten – mit den passenden Tools von Microsoft
Selbst als Unternehmen oder gar als Einzelperson kann es teilweise ganz spannend sein, eigene Daten zu erheben (sofern noch nicht geschehen) und später einmal auszuwerten. Microsoft stellt hierfür eine Reihe von Tools zur Verfügung, die allesamt in Azure zu finden sind:
- Datenerfassung: Sind noch keine Daten vorhanden, kann mit Hilfe von „Azure Data Factory“ Daten erhoben werden. Der Datenintegrations- und Transformationsdienst kann mittels Pipelines Daten kopieren, transformieren und ganz ohne Code in die Zielstruktur überführen. Ebenfalls mit wenig bis gar keinem Code lassen sich Daten mit einer „Azure Logic App“, einer Cloud-Plattform für Automatisierungen, umsetzen. Für die Echtzeitdatenerfassung kann ein „Azure Event Hubs“ und für IoT-Geräte ein „Azure IoT Hub“ verwendet werden. Deutlich flexibler, dafür aber auch mit mehr Programmieraufwand verbunden ist man dagegen mit Azure Functions. Hier kann unter anderem in C#, Java oder Python eine API umgesetzt und die Daten so erfasst werden.
- Datenspeicherung: Die Speicherung der Daten erfolgt dann in einem „Azure Data Lake“, welcher für die Speicherung von mehreren Petabytes an Informationen ausgelegt ist oder der NoSQL-Datenbank „CosmosDB“.
- Datentransformation: Nach der Speicherung erfolgt die Präparation der Daten, die Datentransformation. Die Vorverarbeitung kann mit dem Analysediensten „Azure Synapse Analytics“ oder „Azure Data Bricks“. Hier werden inkonsistente Datentypen bereinigt, Fehlende Werte ergänzt oder doppelte gelöscht.
- Analyse der Daten: Nun erfolgt die eigentliche Analyse der Daten. Dafür können im „Azure Machine Learning Studio“ „Jupyter Notebooks“ erstellt werden, die diese Aufgabe übernehmen. IntelliSense dient dabei als internes Tool und erleichtert dem Anwender die Umsetzung durch Informationen zu den Parametern oder Wortvervollständigungen bei der Entwicklung. Weniger Programmieraufwand wird bei „Microsoft Power BI in Azure“ benötigt, welches neben der Analyse auch die Visualisierung übernehmen kann.
Nahezu jedes erdenkliche Datenprojekt lässt sich in Azure abbilden. Und während für den einen die Datenspeicherung irrelevant ist, ist es für den anderen die Analyse, weil es lediglich um die Datenspeicherung geht. Auch wenn es nicht viel ist, die Haltung von Daten kostet Geld. Wieso also nicht den Nutzen oder Profit daraus ziehen und mit den Daten arbeiten? Unsere Experten für alles rund um Daten stehen Ihnen zur Seite!
Eine vorher gut durchdachte Datenspeicherung, welche schon bei der Wahl der richtigen Datenbank beginnt, erspart später mögliche Änderungen und kostspielige Migrationen. Und warum sollte die Datenspeicherung nur Geld kosten? Durch eine Auswertung lassen sich Workflows optimieren, Geschäftsbereiche erweitern oder Geld einsparen. Lassen Sie sich diese Möglichkeit nicht entgehen und melden sie sich bei uns!