Abschluss- und Projektarbeiten

Das Fachgebiet bietet zahlreiche Themen für Bachelor- und Masterarbeiten an. Aktuell ausgeschriebene Themen

Sie können sich auch mit einem eigenen Thema an unsere Mitarbeiter:innen wenden. Nachstehend sind im Fachgebiet abgeschlossene, betreute Abschlussarbeiten aufgelistet. In vielen Fällen sind die Themen immernoch relevant. Zögern Sie also nicht mit uns in Kontakt zu treten, wenn  Sie dort für Sie interessant Themen finden.

Abgeschlossene Masterarbeiten
Anzahl der Treffer: 129
Erstellt: Wed, 01 May 2024 23:03:10 +0200 in 0.0885 sec


Winges, Manuel;
Untersuchung und Implementierung von Verfahren zur Klangquellentrennung in Schlagzeugaufnahmen. - 95 S. : Ilmenau, Techn. Univ., Masterarbeit, 2014

Ein wesentlicher Bestandteil des Music Information Retrieval ist die Trennung von Quellen in Klanggemischen. So wurden in den vergangenen Jahren viele Ansätze mittels nichtnegativer Matrixfaktorisierung (NMF) realisiert. Gerade für Echtzeitanwendungen, wie z.B. Online-Schlagzeugtranskription, eignet sich die NMF wegen ihrer geringen Komplexität und benötigten Rechenleistung. Trotz guter Transkriptionsergebnisse wurde deutlich, dass die Qualität der zugrundeliegenden Quellentrennung noch Verbesserungspotenzial hat. Im Rahmen dieser Arbeit wurde sich daher mit echtzeitfähigen Verfahren der Quellentrennung von Schlagzeugklängen beschäftigt, die die bisherigen Ansätze erweitern sollen. So bildeten im Speziellen die Non-Negative Matrix Factor Deconvolution (NMFD) und die Non-Negative Matrix Factorization mit Markov Chained Bases (MNMF) den Kern der Untersuchung und Implementierung. Ihre Algorithmen wurden zur Anwendung in einem echtzeitfähigen Framework modifiziert. Die Evaluation wurde über ein Testset mit synthetisch erzeugten Schlagzeugklängen evaluiert. Besonderes Augenmerk lag bei der Untersuchung auf der Qualität der getrennten Quellen. Dafür wurden bewährte perzeptuelle Evaluationsmaße verwendet. Es konnte festgestellt werden, dass die Qualität gegenüber der NMF für bestimmte Parameterkonstellationen verbessert werden kann. Diese sind jedoch vom Einzelfall abhängig und konnten bisher nur durch aufwendige Parameterraumsuchen bestimmt werden.



Räth, Hans-Jürgen;
Konzeption und Umsetzung eines Systems zur automatischen Evaluation von Annotatoren. - 71 S. Ilmenau : Techn. Univ., Masterarbeit, 2014

Ausgehend davon, dass Mediendateien durch Bearbeitung einer anderen Datei entstehen können, und Metadaten vorliegen, die diese Bearbeitung beschreiben, wird in dieser Arbeit eine Datenbankstruktur erstellt, die diese Metadaten speichern kann. Ebenso beschäftigt sie sich damit, wie diese Informationen abgefragt werden können. Besonderer Wert liegt dabei auf der Abbildung der Vernetzung der voneinander abgeleiteten Dateien, wofür sich die Graphdatenbank OrientDB als bestes Framework zeigte. Die Suche nach Dateien, die bestimmte Parameter haben oder durch bestimmte Operationen erstellt wurden, kann damit performant erfolgen.



Pöpperl, Maximilian;
Design and analysis of dual polarized antenna arrays for channel sounding application. - 111 S. : Ilmenau, Techn. Univ., Masterarbeit, 2014

MIMO Verfahren werden heutzutage in verschiedensten Anwendungen verwendet. Besonders das sogenannte Beam-forming ist weit verbreitet. Mit dieser Methode ist es möglich die Sendequalität von drahtlosen Übertragungssystemen zu verbessern oder eine Lokalisierung des Senders durchzuführen. Dazu gibt es verschiedenste Anwendungsmöglichkeiten. Um einen solchen komplexen Algorithmus anwenden zu können, müssen besondere Vorgaben erfüllt sein. Insbesondere die Hardware muss den Herausforderungen eines MIMO Systems angepasst werden. Dazu gehören auch die verwendeten Antennen. In dieser Arbeit werden verschiedene Antennenkonzepte für den Einsatz in einem zirkularen, dual-polarisierten Antennen-Array für MIMO Anwendungen bei 2,53 und 5,2 GHz erstellt und untersucht unter Verwendung des Simulationstools Ansoft HFSS. Schließlich wird die gefertigte Gruppenantenne vermessen und damit die simulierten Ergebnisse verifiziert.



Hellfritzsch, Mathias;
Untersuchungen und Vergleich zur Definition der Nutzungsumgebung und des Einsatzes von Videokommunikation im professionellen und im privaten Bereich. - 229 S. Ilmenau : Techn. Univ., Masterarbeit, 2013

Immer häufiger ist in Auslagen großer Technikanbieter und -konzerne zu beobachten, dass eine Vielzahl an Kommunikations- und Interaktionssystemen mit der Videokommunikation ausgestattet ist. Mit der Vielzahl an Möglichkeiten, die dem Nutzer hinsichtlich der Videokommunikation geboten werden, entstehen für den Nutzer ebenso viele Nutzungsumgebungen. Ziel der Arbeit ist, die realen Nutzungsumgebungen des Nutzers hinsichtlich der Videokommunikation abbilden zu können. Dabei wird der Fokus auf die private und professionelle Nutzungsumgebung gelegt. Hierzu ergeben sich folgende Forschungsfragen, die im Zentrum der Arbeit stehen: Wie ist der aktuelle Stand der Videokommunikation im privaten und im professionellen Environment? Welche Gemeinsamkeiten und welche Unterschiede bestehen zwischen privatem und professionellem Environment (Nutzungsangelegenheiten, Nutzungsumgebung, Nutzungsverhalten, Nutzungshäufigkeit, Stellenwert, Einflussfaktoren)? Der erste Teil der vorliegenden Arbeit gibt einen Einblick in die theoretischen Grundlagen der Videokommunikation. Neben der Klärung diverser Begrifflichkeiten wird ein Einblick in die Entwicklung der Videokommunikation und ein Überblick der aktuellen Marksituation der Videokommunikation gegeben. Im zweiten Teil der Arbeit wird sich mit den theoretischen Konzepten der jeweiligen Environments sowie deren Analysemöglichkeit auseinandergesetzt. Zentraler Punkt dieses Abschnitts ist, die theoretischen Vorüberlegungen aus dem ersten Teil der Arbeit mit der empirischen Untersuchung aus dem dritten Teil der Arbeit zu verbinden. Ausgehend von den jeweiligen Context-Kategorien werden hypothetisch Szenarien für potentielle Einflussfaktoren in den jeweiligen Environments entwickelt. Die hypothetischen Vorüberlegungen sind Grundlage für die im dritten Teil der Arbeit vorzustellenden Fragebögen. Die Fragebögen dienen der Untersuchung der realen Videokommunikationsgegebenheiten im privaten und im professionellen Environment. Erklärungen zum Aufbau und zur Zusammensetzung der Fragebögen sowie deren Auswertung ist Bestandteil des dritten Teils der Arbeit. Die gewonnenen Ergebnisse der Fragbögen der jeweiligen Environments sollen Antworten auf die Forschungsfragen geben, aus denen wiederum ein Abbild der Videokommunikationsnutzung in den beiden Environments erzielt werden kann. Die Arbeit endet mit einer Schlussbetrachtung, in der eine Einschätzung der Ergebnisse und deren Repräsentativität vorgenommen wird. Zudem wird ein Ausblick für die Nutzung der Videokommunikation gewagt.



Leimeister, Matthias;
Implementation and evaluation of a system for drum pattern detection and retrieval in polyphonic music. - 80 S. : Ilmenau, Techn. Univ., Masterarbeit, 2013

Diese Masterarbeit beschreibt ein System zur Erkennung und Klassifizierung von Schlagzeugpattern in polyphonen Musikstücken. Basierend auf Quellentrennung durch nichtnegative Matrixfaktorisierung (NMF) wird das Vorkommen von Bass und Snare Drums im Eingangssignal erkannt. Das Ergebnis dieser automatischen Transkription wird anschließend einer Mustererkennung unterzogen, die mit Hilfe von Deep Learning den Taktanfang bestimmt und das gefundene Muster anhand einer Datenbank von typischen rhythmischen Stilen klassifiziert. Das System wurde im Hinblick auf die Verwendung in einer elektronischen DJ-Software entwickelt.



Tobian, Denise;
Klassifikation von Videoszenen auf Basis visueller Eigenschaften. - 182 S. Ilmenau : Techn. Univ., Masterarbeit, 2013

Die Anzahl an Multimediadaten wächst stetig, weshalb eine automatisierte Organisation und Verwaltung unumgänglich wird. Ein wichtiger Schritt in diesem Zusammenhang besteht in der automatisierten Klassifikation der Semantik des Datenmaterials. Diese Semantik spiegelt sich jedoch in einer Vielfalt an Konzepten wider, die es nach Möglichkeit individuell zu betrachten gilt. So wurden im Rahmen dieser Arbeit häufig verwendete Konzepte identifiziert und bzgl. ihrer charakteristischen Merkmale untersucht, um im Rahmen des maschinellen Lernens jedes Konzept anhand der jeweils relevanten Merkmale zu repräsentieren. Zur Klassifikation wurden dabei Konzepte genutzt, die unter anderem die Tageszeit bzw. die räumliche Umgebung eines Bildes näher beschreiben. Zusätzlich fanden Stimmungskonzepte sowie detaillierte Beschreibungen Anwendung. Dabei wurde im Rahmen der Evaluationen eine Vielzahl an Farb- und Texturmerkmalen so reduziert, dass bzgl. der Charakteristik eines jeweiligen Konzepts schließlich die Merkmalskombination gefunden wurde, welche die Klassifikationsgüte steigert. Diese Auswahl wurde auf ihre Gültigkeit für unterschiedliche Daten analysiert sowie durch zusätzliche Untersuchungen verifiziert. Darüber hinaus wurden weitere Einflussparameter, die sich auf den Klassifikationsprozess auswirken, identifiziert und anhand unterschiedlicher Evaluationen optimiert, bspw. die Bildauflösung zur Merkmalsextraktion, die Zusammenstellung des Datensatzes bzgl. Video- und Fotodaten sowie die Klassifikation von semantischen Konzepten unter Berücksichtigung von Beziehungen. Weiterhin wurde die Klassifikation und Evaluation von Multi-Labels optimiert, um auch an der Stelle die Klassifikationsgüte zu steigern. Ein wichtiger Punkt dabei bestand darin, Schwellwerte zu ermitteln auf deren Basis die Klassifikation erfolgen kann. Aufbauend auf den Erkenntnissen der durchgeführten Evaluationen wurde ein Framework entwickelt, das die einzelnen Optimierungsschritte berücksichtigt und die weitere Evaluation bzw. Klassifikation von Bilddaten vornimmt. Schließlich konnte die Klassifikationsgüte für die einzelnen Konzepte im Rahmen dieser Arbeit in jedem Fall gesteigert werden. Die Klassifikation von Multi-Labels auf Basis der optimierten Schwellwertbestimmung sowie die Berücksichtigung von Beziehungen erzielten dabei die größte Verbesserung der Klassifikationsgüte.



Li, Wei;
Individuelle Auswahl nicht individueller Außenohrübertragungsfunktionen auf Basis von optimierten Datensätzen. - 75 S. Ilmenau : Techn. Univ., Masterarbeit, 2013

In den letzten Jahren haben sich die Multimedia-Technologien schnell entwickelt. Es werden immer höhere Anforderungen an die Qualität gestellt. Die audiovisuelle Technik zieht immer mehr Aufmerksamkeit auf sich, z.B. die binaurale Technik. In dieser Technik spielt die Außenohrübertragungsfunktion (engl.: Head Related Transfer Function, HRTF) eine wichtige Rolle. Die Richtungsdarstellung kann durch die Faltung des HRIRs bzw. HRTFs mit den Audiosignalen realisiert werden. Die HRTFs sind für jeden Benutzer individuell. Für jeden Benutzer soll ein HRTF-Set aus einer Datenbank individuell ausgewählt werden. Eine große Datenbank führt allerdings zu einer längeren Auswahlprozedur. Das bedeutet erhöhten Zeitaufwand im Auswahlverfahren. Um diesen Zeitaufwand zu beseitigen, legt diese Arbeit den Fokus auf die Gruppierung der HRTF-Sets in einer Datenbank. Vier Gruppierungsmethoden werden in dieser Arbeit entwickelt und vorgestellt. Außerdem wird ein passendes Auswahlverfahren entwickelt, das Auswahl-Tool. Für einen Lokalisierungstest wird ein Test-Tool entwickelt. Alle Programme wurden in MATLAB realisiert. Die Optimierungsmöglichkeiten für bessere Ergebnisse werden in dieser Arbeit vorgeschlagen.



Zahn, Alexandra;
Entwicklung und Evaluation von Verfahren zur Detektion von rhythmischen Mustern in Videos. - 123 S. Ilmenau : Techn. Univ., Masterarbeit, 2013

Die vorliegende Masterarbeit beschreibt die Entwicklung eines Systems zur Detektion und Klassifizierung von rhythmischen Mustern in Videosequenzen. Der äußere visuelle Rhythmus manifestiert sich in Form von Montagestrukturen. Diese entsprechen den Konzepten "regular", "progressive", "alternating" und "random" und werden vom System unter Verwendung von eindeutigen Vorschriften hierarchisch erfasst und differenziert. Einheiten des inneren visuellen Rhythmus kommen in ihrer Ausprägung globalen Bewegungsvarianzen gleich, die den Klassen "no motion", "fluid" und "staccato" gerecht werden. Grundlage für die Erkennung rhythmischer Patterns innerhalb der Einstellungen bildet eine frameweise globale Bewegungsschätzung, die unter Einsatz eines Gaussian Mixture Models (GMM) sowie einer Support Vector Machine (SVM) realisiert wird. Auf Basis dieser Klassifikation können zeitliche Bewegungsänderungen in Art und Tempo in einem Deskriptor festgehalten werden. Das Merkmal dient im Verlauf zur Klassifizierung der rhythmischen Elemente, wiederum mithilfe einer SVM. Um die Teilkomponenten des Systems in ihrem Funktionsumfang hinreichend bewerten zu können, wurde ein Datenset bestehend aus 136 Schnittfolgen und 7953 Einstellungen aus den Kategorien Werbung, Spielfilm, Musik und Sport angelegt. Die besten Parameterkonfigurationen der implementierten Module lieferten diesbezüglich eine maximale mittlere Detektionsgenauigkeit von 79% für die Patterns des äußeren visuellen Rhythmus. Muster innerhalb der Shots konnten mit einer mittleren Genauigkeit von 66,5% klassifiziert werden.



Menzel, Franz;
Entwicklung und Evaluation von Technologien zur verlaufsbezogenen Videoanalyse für cross-modales Mapping. - 136 S. Ilmenau : Techn. Univ., Masterarbeit, 2013

Die Vertonung von Fernseh- oder Kinofilmen stellt für Produktionsfirmen einen zeit- und kostenaufwändigen Prozess dar. Hier sind Verfahren erwünscht, die die Suche nach einer musikalischen Untermalung anhand passender dramaturgischer Eigenschaften aus verfügbaren Musikdatenbanken automatisiert durchführen können. Vor diesem Hintergrund wurde im Rahmen der vorliegenden Arbeit ein entsprechendes System zur Prädiktion zeitlicher Stimmungsverläufe in Bewegtbildfolgen entwickelt. Ein bestehendes Set an visuellen Merkmalen ist diesbezüglich um relevante Methoden zur Erkennung der Stimmung erweitert worden. Zur Evaluation des konzipierten Systemablaufs wurde ein Datensatz aus 200 Videosequenzen zusammengestellt und durch Probanden hinsichtlich der zeitlichen Verläufe bewertet. Dabei erfolgte eine genauere Betrachtung der Stimmungsdimensionen Valence und Arousal sowie der fünf Low-Level Konzepte Helligkeit, Farbigkeit, Farbtemperatur, Detailgrad und Bewegungsintensität. Die Regressionsmethoden Multiple Linear Regression (MLR), Partial Least Square Regression (PLSR) und Support Vector Regression (SVR) wurden zur Prädiktion unbekannter Verläufe herangezogen und miteinander verglichen. Das System erzielte eine maximale Genauigkeit von 35% für Valence und 48% für Arousal. Die beste Vorhersage konnte dabei durch die MLR in Kombination mit einer zeitlichen Glättung sowie Box-Cox-Transformation der Merkmale erreicht werden. Auf Grundlage der geschätzten Verläufe wurde die Möglichkeit zur Erfassung des Stimmungstrends untersucht. Eine Klassifikation in "steigend", "konstant" und "fallend" erreichte eine Genauigkeit von 49% für Valence und 60% für Arousal.



Veit, Quirin;
Softwarearchitektur und -implementierung für ein Werkzeug zur semi-automatischen Annotation von Videos. - 137 S. Ilmenau : Techn. Univ., Masterarbeit, 2013

Am Fraunhofer IDMT werden Anwendungen im Bereich des maschinellen Sehens entwickelt. Hierfür werden \emph{Ground Truth} Daten benötigt, die den semantischen Inhalt, die Struktur oder Eigenschaften einer Mediendatei beschreiben und von einem oder mehreren Menschen erstellt werden. Auf Basis dieser Referenzdaten können Algorithmen semantische Konzepte antrainiert werden. Um die Auswirkungen von Anpassungen während der Entwicklung und/oder die Leistungsfähigkeit unterschiedlicher Algorithmen vergleichen zu können, sind ebenfalls Groud Truth Daten notwendig. Die Verfügbarkeit und Qualität dieser Daten ist dabei von entscheidender Bedeutung, um aussagekräftige Ergebnisse zu erhalten. Während für Bilddaten zahlreiche öffentlich zugängliche und umfangreiche Daten-Sets existieren, besteht für Videos ein Mangel derartiger Datenbanken. Ein Grund dafür ist der hohe zeitliche Aufwand bei der manuellen Erstellung von Annotationen durch die Beschaffenheit von Videodaten. Ein weiterer Grund ist ein Mangel an ausgereiften und flexibel einsetzbaren Annotationswerkzeugen, welche neben zeitlichen örtliche Annotation ermöglichen. Im Rahmen dieser Arbeit wurde ein Werkzeug zur raum-zeitlichen Annotation von Videodaten entwickelt, das flexibel eingesetzt und über Schnittstellen erweitert und angepasst werden kann. Um den zeitlichen Annotationsaufwand zu reduzieren wurden Automatismen integriert, welche dem Nutzer eine effiziente Annotation zeitlicher wie auch örtlicher Eigenschaften ermöglicht. Zur Gewährleistung einer hohen Nutzerfreundlichkeit wurde die Software unter Berücksichtigung von Usability-Aspekten konzipiert.