Wir leben in einer Welt, in welcher die Sammlung, Aufbereitung und Nutzung von Daten zentraler denn je ist. Das Gebiet des "Data Engineering" deckt die wesentlichen Schritte von der Erhebung der Rohdaten bis zur Bereitstellung der validierten, bereinigten Daten für die Nutzung ab - Voraussetzung für die folgende Interpretation, das Lernen, oder die visuelle Darstellung. In "Data Engineering 1" werden die Grundlagen des Gebiets und die Verarbeitung von unstrukturierten Daten abgedeckt. 1. Einführung (3 Wochen) - Was ist Data Engineering? - Data Engineering im breiteren Kontext der Data Science - Data (Processing) Pipelines - Verschiedene Formen von (Roh-)daten: Big Data, Small Data, Smart Data, ... 2. Arbeiten mit Daten (4 Wochen) - Datenformate und Dateiformate (XML, JSON, CSV, ...) - Navigieren in XML/JSON-Daten (XPath, JSONPath) - Tools - Strukturierte vs. unstrukturierte Daten 3. Verarbeitung verschiedenster Datenarten (7 Wochen) - verschiedene NoSQL Lösungen - Grundlagen des Information Retrievals (IR)