Technische Universität Ilmenau

Data Science: Methods and Techniques - Modultafeln of TU Ilmenau

The module lists provide information on the degree programmes offered by the TU Ilmenau.

Please refer to the respective study and examination rules and regulations for the legally binding curricula (Annex Curriculum).

You can find all details on planned lectures and classes in the electronic university catalogue.

Information and guidance on the maintenance of module descriptions by the module officers are provided at Module maintenance.

Please send information on missing or incorrect module descriptions directly to modulkatalog@tu-ilmenau.de.

module properties Data Science: Methods and Techniques in degree program Master Informatik 2013
module number200042
examination number2200687
departmentDepartment of Computer Science and Automation
ID of group 2254 (Databases and Information Systems)
module leaderProf. Dr. Kai-Uwe Sattler
term summer term only
languageDeutsch
credit points5
on-campus program (h)45
self-study (h)105
obligationelective module
examoral examination performance, 30 minutes
details of the certificate
signup details for alternative examinations
maximum number of participants
previous knowledge and experience

Datenbanksysteme, Statistik, Programmierkenntnisse

learning outcome

Nach Besuch dieser Veranstaltung sind die Studierenden mit fortgeschrittenen Methoden zur Auswertung und Analyse großer Datenbestände vertraut.  Sie verstehen Data-Mining-/Machine Learning-Verfahren zur Analyse klassischer relationaler Geschäftsdaten als auch von raum- bzw. zeitbezogenen Daten,  Graph- und Textdaten.

Weiterhin kennen sie Prinzipien verteilter und paralleler Architekturen inkl. Data Warehouses und moderner Big-Data-Plattfomen zur Verwaltung und Analyse sehr großer Datenbestände. Die Studierenden können die zugrundeliegenden Methoden sowie die technischen Aspekte erklären und hinsichtlich ihrer Vor- und Nachteile für verschiedene Einsatzzwecke bewerten.

Mit den Übungen  können die Studierenden Standardwerkzeuge (Datenbanken, Data Warehouses, interaktive Notebooks) anhand konkreter Aufgabenstellungen zur Datenanalyse praktisch anwenden. Sie können eigene Lösungen entwickeln, bewerten und diese präsentieren, können sich an themenspezifischen Diskussionen beteiligen und sind bereit, Fragen zu beantworten.

content

Datenanalysepipeline; Big-Data-Architekturen; Data Warehousing und OLAP; Data-Mining-Techniken: Clustering, Frequent Itemset Mining; Analyse von Graph-Daten (Mustersuche in Graphen, Erkennen von Communities, Erkennung häufiger Subgraphen), Mining raum-zeitbezogener Daten (Sequential Pattern Mining, Trajectory Mining); NLP und Text Mining: Relationship-Extraktion, Word Sense Disambiguation, Named Entity Recognition; Sentiment Analyse; Parallelisierung und Verteilung: Partitionierungstechniken, datenparallele Verarbeitung

media of instruction

Vorlesung mit Präsentationen und Tafel, Handouts,

Link zum Moodle-Kurs:

https://www.tu-ilmenau.de/modultafeln/?fnq=200042

literature / references

Köppen, Saake, Sattler: Data Warehouse Technologien: Technische Grundlagen, mitp-Verlag, 2012.

Kumar,Steinbach, Tan: Introduction to Data Mining, Addison Wesley, 2005.

Lehner, Sattler: Web-Scale Data Management for the Cloud, Springer, 2013.

Rahm, Saake, Sattler: Verteiltes und Paralleles Datenmanagement, Springer, 2015.

evaluation of teaching