Technische Universität Ilmenau

Data Science: Methoden und Techniken - Modultafeln der TU Ilmenau

Die Modultafeln sind ein Informationsangebot zu den Studiengängen der TU Ilmenau.

Die rechtsverbindlichen Studienpläne entnehmen Sie bitte den jeweiligen Studien- und Prüfungsordnungen (Anlage Studienplan).

Alle Angaben zu geplanten Lehrveranstaltungen finden Sie im elektronischen Vorlesungsverzeichnis.

Informationen und Handreichungen zur Pflege von Modulbeschreibungen durch die Modulverantwortlichen finden Sie unter Modulpflege.

Hinweise zu fehlenden oder fehlerhaften Modulbeschreibungen senden Sie bitte direkt an modulkatalog@tu-ilmenau.de.

Modulinformationen zu Data Science: Methoden und Techniken im Studiengang Master Informatik 2013
Modulnummer200042
Prüfungsnummer2200687
FakultätFakultät für Informatik und Automatisierung
Fachgebietsnummer 2254 (Datenbanken und Informationssysteme)
Modulverantwortliche(r)Prof. Dr. Kai-Uwe Sattler
TurnusSommersemester
SpracheDeutsch
Leistungspunkte5
Präsenzstudium (h)45
Selbststudium (h)105
VerpflichtungWahlmodul
Abschlussmündliche Prüfungsleistung, 30 Minuten
Details zum Abschluss
Anmeldemodalitäten für alternative PL oder SL
max. Teilnehmerzahl
Vorkenntnisse

Datenbanksysteme, Statistik, Programmierkenntnisse

Lernergebnisse und erworbene Kompetenzen

Nach Besuch dieser Veranstaltung sind die Studierenden mit fortgeschrittenen Methoden zur Auswertung und Analyse großer Datenbestände vertraut.  Sie verstehen Data-Mining-/Machine Learning-Verfahren zur Analyse klassischer relationaler Geschäftsdaten als auch von raum- bzw. zeitbezogenen Daten,  Graph- und Textdaten.

Weiterhin kennen sie Prinzipien verteilter und paralleler Architekturen inkl. Data Warehouses und moderner Big-Data-Plattfomen zur Verwaltung und Analyse sehr großer Datenbestände. Die Studierenden können die zugrundeliegenden Methoden sowie die technischen Aspekte erklären und hinsichtlich ihrer Vor- und Nachteile für verschiedene Einsatzzwecke bewerten.

Mit den Übungen  können die Studierenden Standardwerkzeuge (Datenbanken, Data Warehouses, interaktive Notebooks) anhand konkreter Aufgabenstellungen zur Datenanalyse praktisch anwenden. Sie können eigene Lösungen entwickeln, bewerten und diese präsentieren, können sich an themenspezifischen Diskussionen beteiligen und sind bereit, Fragen zu beantworten.

Inhalt

Datenanalysepipeline; Big-Data-Architekturen; Data Warehousing und OLAP; Data-Mining-Techniken: Clustering, Frequent Itemset Mining; Analyse von Graph-Daten (Mustersuche in Graphen, Erkennen von Communities, Erkennung häufiger Subgraphen), Mining raum-zeitbezogener Daten (Sequential Pattern Mining, Trajectory Mining); NLP und Text Mining: Relationship-Extraktion, Word Sense Disambiguation, Named Entity Recognition; Sentiment Analyse; Parallelisierung und Verteilung: Partitionierungstechniken, datenparallele Verarbeitung

Medienformen

Vorlesung mit Präsentationen und Tafel, Handouts,

Link zum Moodle-Kurs:

https://www.tu-ilmenau.de/modultafeln/?fnq=200042

Literatur

Köppen, Saake, Sattler: Data Warehouse Technologien: Technische Grundlagen, mitp-Verlag, 2012.

Kumar,Steinbach, Tan: Introduction to Data Mining, Addison Wesley, 2005.

Lehner, Sattler: Web-Scale Data Management for the Cloud, Springer, 2013.

Rahm, Saake, Sattler: Verteiltes und Paralleles Datenmanagement, Springer, 2015.

Lehrevaluation