t.BA.DS.DE2.20HS (Data Engineering 2) 
Modul: Data Engineering 2
Diese Information wurde generiert am: 19.04.2024
Nr.
t.BA.DS.DE2.20HS
Bezeichnung
Data Engineering 2
Veranstalter
T InIT
Credits
4

Beschreibung

Version: 2.0 gültig ab 01.08.2021
 

Kurzbeschrieb

Die verschiedenen Themen des Data Engineering sind existenzielle Bausteine erfolgreicher Datenprodukte und Datenanalyseprojekte.
In diesem Modul lernen Sie Voraussetzungen für dessen Einsatz und verschiedene wichtige Methoden des Data Engineering kennen. Es werden theoretische Grundlagen, aber auch praktische Umsetzungen der Methoden gelehrt.

Modulverantwortung

Weiler Andreas (wele) (ad interim)

Lernziele (Kompetenzen)

Ziel Kompetenzen Taxonomiestufen
Sie verstehen die Grundlagen und Besonderheiten des Data Engineering; insbesondere im Gegensatz zu Software Engineering. F, M K1, K2
Sie kennen verschiedene Themen des Data Engineering, inbesondere im Bereich der Transformation und Bereitstellung der Daten, und wenden diese erfolgreich in der Praxis an.  F, M K1, K2, K3
Sie kennen den Unterschied zwischen Data Engineering mit strukturierten, unstrukturierten, Batch und Streaming Daten. Diese werden an Praxisbeispiele mit aktuellen Frameworks angewendet. F, M K1, K2, K3
Sie kennen die Perspektiven und Möglichkeiten der aktuellen Forschung und Entwicklung in den genannten Bereichen. F K1

Modulinhalte

Die Digitalisierung von Prozessen und Umgebungen stellt Informatiker vor neue Herausforderungen. Die Softwareentwicklung steht hierbei nicht mehr im Vordergrund, sondern die fachgerechte Verarbeitung und Analyse von verschiedenen Datenarten und Mengen. Hierzu ist es unerlässlich, einen gewissen Grunderfahrungsschatz im Bereich des Data Engineering und der wichtigsten Methoden aus diesem Bereich zu besitzen.
Dieses Modul bietet eine praktische Einführung in elementares Data Engineering mittels Methoden zur Verarbeitung von strukturierten und unstrukturierten Daten. Der Fokus liegt hierbei auf einem Überblick und sauberer Methodik; Beweise und Details der Verfahren werden späteren Kursen überlassen. Das Gelernte wird von Teilnehmenden selbständig anhand praktischer Arbeiten vertieft.

Folgende Inhalt werden im Modul behandelt:

Storing Structured Data:  
  Relational  
  NoSQL
  Big Data / Hadoop etc.  

Transforming Data:
  ETL  Jobs
  Schedulers
  Cleaning  (Noise removal, Outlier detection, Interpolation) 
  Anonymization  

Sourcing Data:
  APIs
  Web crawling, Web scraping 
  Other Sources  

Querying Data:
  Advanced Queries
  Query Optimization
  Distributed Queries  

Ingesting Data:
  Batch vs. Real-Time Data Streams
  Queues

Begleitende Praktika

Die Vorlesung wird begleitet durch praktische Übungen an realen Datensätzen mittels Python und verwandten Tools und Bibliotheken.
Etwa die Hälfte des Semesters arbeiten die Teilnehmenden in kleinen Gruppen an individuellen praktischen Arbeiten, die am Ende präsentiert und bewertet werden.

Lehrmittel/Materialien

  • Vorlesungsfolien
  • Material zu den Praktika

Ergänzende Literatur

tbd

Zulassungs-voraussetzungen 

tbd

Unterrichtssprache

(X) Deutsch ( ) Englisch

Teil des Internationalen Profils

( ) Ja (X) Nein

Modulausprägung

Typ 3a
  Details siehe unter: T_RL_Richtlinie_Modulauspraegungen_Stundengutschriften

Leistungsnachweise

Bezeichnung Art Form Umfang Bewertung Gewichtung
Leistungsnachweise während Studiensemester Bewertete Praktika schriftlich 2
Praktika
max. 20 Punkte 20%
Semesterendprüfung Klausur schriftlich   max. 80 Punkte 80%

Bemerkungen

 

Rechtsgrundlage

Die Modulbeschreibung ist neben Rahmenprüfungsordnung und Studienordnung Teil der Rechtsgrundlage. Sie ist verbindlich. Eine in der ersten Unterrichtswoche des Semesters schriftlich festgehaltene und kommunizierte Modulvereinbarung kann die Modulbeschreibung präzisieren. Die Modulvereinbarung ersetzt nicht die Modulbeschreibung.
Kurs: Data Engineering 2 - Praktikum
Nr.
t.BA.DS.DE2.20HS.P
Bezeichnung
Data Engineering 2 - Praktikum

Hinweis

  • Für das Stichdatum 02.08.2099 ist kein Modulbeschreibungstext im System verfügbar.
Kurs: Data Engineering 2 - Vorlesung
Nr.
t.BA.DS.DE2.20HS.V
Bezeichnung
Data Engineering 2 - Vorlesung

Hinweis

  • Für das Stichdatum 02.08.2099 ist kein Modulbeschreibungstext im System verfügbar.