t.BA.DS.DE1.20HS (Data Engineering 1) 
Modul: Data Engineering 1
Diese Information wurde generiert am: 16.09.2021
Nr.
t.BA.DS.DE1.20HS
Bezeichnung
Data Engineering 1
Veranstalter
T InIT
Credits
4

Beschreibung

Version: 2.0 gültig ab 01.08.2020
 

Kurzbeschrieb

Das Gebiet des "Data Engineering" deckt die wesentlichen Schritte von der Erhebung der Rohdaten bis zur Bereitstellung der validierten, bereinigten Daten für die Nutzung ab. In "Data Engineering 1" werden die Grundlagen des Data Engineerings und die Verarbeitung unstrukturierter Daten thematisiert.

Modulverantwortung

Braschler, Martin (bram) (ad interim)

Lernziele (Kompetenzen)

Ziel Kompetenzen Taxonomiestufen
Sie kennen die Grundlagen des Data Engineering F K1
Sie verstehen, wie mittels Data Pipelines die Rohdaten für die spätere Nutzung erhoben, aufbereitet und bereinigt werden, und können solche Pipelines designen und implementieren F K2, K3
Sie wissen, wie mittels Information Retrieval (IR) Information aus unstrukturierten Daten gewonnen wird F K2
Sie können mittels Named Entity Recognition und Mechanismen wie Knowledge Graphs die Brücke zwischen unstrukturierten und strukturierten Daten schlagen F K3

Modulinhalte

Wir leben in einer Welt, in welcher die Sammlung, Aufbereitung und Nutzung von Daten zentraler denn je ist. Das Gebiet des "Data Engineering" deckt die wesentlichen Schritte von der Erhebung der Rohdaten bis zur Bereitstellung der validierten, bereinigten Daten für die Nutzung ab - Voraussetzung für die folgende Interpretation, das Lernen, oder die visuelle Darstellung. In "Data Engineering 1" werden die Grundlagen des Gebiets und die Verarbeitung von unstrukturierten Daten abgedeckt.

1. Einführung (3 Wochen)
- Was ist Data Engineering?
- Data Engineering im breiteren Kontext der Data Science
- Data (Processing) Pipelines
- Verschiedene Formen von (Roh-)daten: Big Data, Small Data, Smart Data, ...

2. Arbeiten mit Daten (4 Wochen)
- Datenformate und Dateiformate (XML, JSON, CSV, ...)
- Navigieren in XML/JSON-Daten (XPath, JSONPath)
- Tools
- Strukturierte vs. unstrukturierte Daten

3. Verarbeitung unstrukturierter Daten (7 Wochen)
- Grundlagen des Information Retrievals (IR)
- Indexierung-Pipelines
- Named Entity Recognition
- Vektorraummodell, probabilistisches Retrievalmodell
- Knowledge Graphs als Brücke zu den strukturierten Daten
- IR Evaluation

 

 

Lehrmittel/Materialien

Foliensatz

Ergänzende Literatur

 

Zulassungs-voraussetzungen 

 

Unterrichtssprache

(X) Deutsch ( ) Englisch

Teil des Internationalen Profils

( ) Ja (X) Nein

Modulausprägung

Typ 3a
  Details siehe unter: T_RL_Richtlinie_Modulauspraegungen_Stundengutschriften

Leistungsnachweise

Bezeichnung Art Form Umfang Bewertung Gewichtung
Leistungsnachweise während Studiensemester Bewertete Praktika schriftlich, Hausarbeit 3 Praktika   20%
Semesterendprüfung   schriftlich 90 Minuten   80%

Bemerkungen

 

Rechtsgrundlage

Die Modulbeschreibung ist neben Rahmenprüfungsordnung und Studienordnung Teil der Rechtsgrundlage. Sie ist verbindlich. Eine in der ersten Unterrichtswoche des Semesters schriftlich festgehaltene und kommunizierte Modulvereinbarung kann die Modulbeschreibung präzisieren. Die Modulvereinbarung ersetzt nicht die Modulbeschreibung.
Kurs: Data Engineering 1 - Praktikum
Nr.
t.BA.DS.DE1.20HS.P
Bezeichnung
Data Engineering 1 - Praktikum

Hinweis

  • Für das Stichdatum 02.08.2099 ist kein Modulbeschreibungstext im System verfügbar.
Kurs: Data Engineering 1 - Vorlesung
Nr.
t.BA.DS.DE1.20HS.V
Bezeichnung
Data Engineering 1 - Vorlesung

Hinweis

  • Für das Stichdatum 02.08.2099 ist kein Modulbeschreibungstext im System verfügbar.