Anzahl der Treffer: 97
Erstellt: Sat, 27 Nov 2021 00:00:15 +0100 in 0.0924 sec


Kumari, Gunjan;
Implementation and evaluation of a low latency social XR platform featuring 3D pose estimation. - Ilmenau. - 100 Seiten
Technische Universität Ilmenau, Masterarbeit 2021

Das Ziel dieser Arbeit ist die Entwicklung und Evaluation einer Virtual-Reality-Anwendung mit einer geringen Latenz, die eine monokulare 3D-Posenschätzung enthält, mehrere Spieler unterstützt und für die Live-Fernkommunikation verwendet werden kann. Ein 3D Pose Estimation Framework wird verwendet, um die Pose des gesamten menschlichen Körpers zu extrahieren und die extrahierten Pose-Daten werden über ein Server-Client-Netzwerk an eine VR-Anwendung gesendet. Der Prototyp der VR-Anwendung wurde in Unity3D entwickelt und bildet die geschätzten Pose-Daten in Echtzeit auf die einzelnen Gelenke eines Avatars ab. Für das Kopfgelenk werden die Positionsdaten vom Head Mounted Display (HMD) extrahiert, um eine genauere Position und Orientierung zu erhalten. Die Verwendung von menschlichen 3D-Avataren mit voller menschlicher Gestalt ermöglicht ein realistisches Gefühl für die Interaktion mit dem Benutzer im virtuellen Raum. Die Latenz zwischen Bewegung und Wahrnehmung wird ebenfalls gemessen, um die Zeitverzögerung zwischen der vom Benutzer ausgeführten Aktion und dem entsprechenden im HMD angezeigten Inhalt zu berechnen. Zum Schluss wird eine subjektive Evaluationsstudie durchgeführt, um die Benutzererfahrung und die Benutzerfreundlichkeit des entwickelten Anwendungsprototyps zu untersuchen. Die Daten werden in qualitativer und quantitativer Form erhoben und decken verschiedene Aspekte der Erfahrung ab. Es wurden verschiedene Methoden angewandt, um die Daten von den Teilnehmern zu sammeln, wie z.B. Fragebögen, lautes Denken, Feedbacks usw. Insgesamt 26 Teilnehmer nahmen an der Evaluationsstudie teil und gaben trotz vieler Schwierigkeiten kritische Informationen über die Erfahrungen mit der Anwendung. Korrelationen zwischen den Fragebögen und ihren Unterkategorien wurden ebenfalls analysiert. Darüber hinaus werden auch Einschränkungen in der Anwendung diskutiert und zukünftige Arbeiten beabsichtigt.



Geiger, Nico;
Ein Qualitätsvergleich neuronaler Netze bei der Konvertierung von SDR- in HDR-Panoramabilder. - Ilmenau. - 99 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2021

Diese Arbeit evaluiert das Qualitätspotential zweier neuronaler Netze und einem mathematischen Verfahren bei der Inversen Tone Mapping Operation (iTMO) von Panoramabildern. Die Frage, welches der drei iTMO JSI-GAN, ExpandNet und IornsRhee die höchste Qualität bei unterschiedlichen Bildhelligkeits- und Bildsättigungswerten erreicht, wird beantwortet. Dazu werden Hochkontrast-(HDR) Panoramabilder, von der Webseite www.hdrihaven.com, verwendet. Für die Verarbeitung in den drei iTMO werden die Bilder mit vier unterschiedlichen Tone Mapping Operatoren (TMO) in den Standard Dynamik Bereich (SDR) komprimiert. Anschließend werden die SDR-Bilder durch die iTMO zu HDR-Bilder konvertiert. Die konvertierten Bilder werden mit den Analyseverfahren Strukturelle Ähnlichkeit und Spitzen-Signal-Rausch-Verhältnis auf ihre quantitativen Eigenschaften ausgewertet. Es stellt sich heraus, dass das ExpandNet eine hohe Konvertierungsqualität bei hellen Bildern mit mittlerer bis hoher Sättigung zeigt. Die iTMO, JSI-GAN und IornsRhee zeigen gute Ergebnisse bei dunklen Bildern mit mittlerer bis niedriger Sättigung und zudem eine niedrige Qualitätsfluktuation. Auf Basis der quantitativen Resultate werden aus allen konvertierten Bildern Stichproben entnommen und qualitativ auf Artefakte untersucht. Das JSI-GAN zeigt dabei die meisten Bildartefakte. Das ExpandNet erreicht bei hellen, die iTMO JSI-GAN und IornsRhee bei dunklen SDR-Bildern die besten Ergebnisse.



Knutzen, Kathrin;
Me vs. us: the role of group identity on social presence and trust in collaborative virtual reality environments. - Ilmenau. - 133 Seiten
Technische Universität Ilmenau, Masterarbeit 2021

Diese Masterarbeit befasst sich mit dem Einfluss der Theorie der sozialen Identität und möglicher Gruppencharakteristiken in kollaborativen Virtual-Reality-Umgebungen auf Vertrauen und soziale Präsenz. Neben (non)verbaler Kommunikation von Nutzer*innen tragen kontextuelle Informationen wie zwischenmenschliche Beziehungen von Akteur*innen zur sozialen Präsenz und Vertrauen bei. In einem Experiment mit einem Between-Subject-Design (n = 42) kooperierten Zweierteams in einer Multi-User-VR-Umgebung und spielten kooperative Puzzlespiele. Gruppen, die zusätzlichen sozialen Gruppencharakteristiken gemäß der Theorie der sozialen Identität (Informationen über Universitätszugehörigkeit und Nationalität) ausgesetzt sind, werden mit einer Gruppe ohne jene Charakteristiken verglichen. Es werden Effekte auf soziale Präsenz, teambasiertes Vertrauen und interpersonelles Vertrauen vor und nach kooperativen Aufgaben, sozialen Dilemmata, Spaß, Gruppenidentifikation und kooperativer Leistung untersucht. Es konnten keine signifikanten Effekte der Gruppencharakteristiken auf teambasiertes Vertrauen, Gruppenidentifikation, soziale Präsenz (gesamter Wert), Vergnügen, soziale Dilemmata und kooperative Spielergebnisse gefunden werden. Signifikante Unterschiede innerhalb der Proband*innen finden sich für Ergebnisse der kooperativen Aufgaben, teambasiertes Vertrauen und soziale Dilemmata. Die untersuchten Forschungsvariablen korrelieren signifikant miteinander, was darauf hinweist, dass weitere Studien notwendig sind, die sich auf ähnliche Forschungsschemata konzentrieren. Die Anwendbarkeit der Theorie der sozialen Identität im Kontext von VR und in postmodernen Gesellschaften wird diskutiert. Die Operationalisierung von sozialen Identitätsmerkmalen muss in zukünftigen Arbeiten untersucht werden.



Trott, Julian;
Leistungsvergleich von Deep-Learning-Verfahren zum Verfolgen und Rekonstruieren von Händen. - Ilmenau. - 55 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2021

Der Beitrag dieser Arbeit ist der Vergleich von 3 öffentlich zugänglichen HandTracking-Systemen (OpenPose, FrankMocap und MediaPipe Hands), die fähig sind, mehrere Hände in Bild- oder Videodaten zu erkennen und die Pose zu schätzen. Der Vergleich ist auf einem Datensatz durchgeführt, der aus 105 Bildern besteht, in dem unter Anderem sehr komplexe Fingerartikulationen und Handposen vertreten sind. Es wurde die Distanz zwischen manuell und maschinell annotierten Gelenken in Pixeln, sowie die Fehlerrate der falsch erkannten Gelenke pro Bild berechnet. Dabei wird der Datensatz in zwei Perspektiven unterteilt (Ego- und Exo-Perspektive). Das Resultat des Vergleiches ist, dass in der Ego-Perspektive MediaPipe Hands die besten Ergebnisse bietet und in der Exo-Perspektive FrankMocap und OpenPose ungefähr gleich gut abschneiden, wobei OpenPose einen kleinen Vorteil erringen kann.



Sharma, Rajat;
3D object detection : representation of objects using distance regression. - Ilmenau. - 81 Seiten
Technische Universität Ilmenau, Masterarbeit 2020

Die Objekterkennung ist eines der fokussiertesten und anspruchsvollsten Themen der Computer Vision. Anwendungen wie das autonome Fahren, medizinische Bildgebung usw. sind stark davon abhängig. Traditionell werden für die Erkennung von Objekten unter anderem Merkmale wie Kanten oder Konturen verwendet, welche von klassischen Algorithmen beispielsweise SIFT, SURF, HoG usw. abhängig sind. Forschungsthemen wie Deep Learning zur Objekterkennung haben die Genauigkeit im Vergleich zu klassischen Algorithmen um ein Vielfaches gesteigert. Dabei werden im Gegensatz zu klassischen Ansätzen diese neuronalen Netze für die Objekterkennung trainiert. Region Proposal Networks (RPN) sind die modernsten neuronalen Netze für Klassifikations- und Standortregressionsaufgaben. RPNs leiden jedoch unter der bedeutenden Einschränkung, dass sie mehrere Regionen für dasselbe Objekt erzeugen, was zu mehrfachen Vorhersagen von Klassifizierungsergebnissen, Orts- und Größenwerten führt. Dies kann korrigiert werden, indem bei diesen Vorhersagen der Einsatz der Non-Maximum Suppression (NMS) durchgeführt wird. In dieser Masterarbeit stellen wir das Konzept einer Distanzregression zur Grenzbestimmung der Bounding Box für jeden Regionsvorschlag vor. Dies bedeutet, dass wir die Koordinaten der Box zusätzlich zu den Parametern lernen. Der Ansatz wird vor der eigentlichen Bestimmung der Box durchgeführt, was bei der Abschätzung der resultierenden Bounding Box hilft. Zur Ermittlung nutzen wir die räumliche Lage um das Objekt, um die Lage und Größe des Objekts vorherzusagen. Wir untersuchen verschiedene Architekturen auf der Grundlage einstufiger und zweistufiger Methoden, wobei wir uns auf die Bounding Regression und deren Auswirkung konzentrieren. In dieser Arbeit zeigen wir, dass einige unserer Methoden gegenüberaktuellen Ansätzen im Falle eines synthetischen Datensatzes 2 % bis 9 % und im Falle des Kitti-Datensatzes 1 % bessere Ergebnisse liefern.



Samimi, Niloofar;
Designing and evaluating user interfaces for moderators to control augmented reality applications in TV production. - Ilmenau. - 134 Seiten
Technische Universität Ilmenau, Masterarbeit 2020

Die neuste Entwicklung von Augmented Reality für TV-Produktionen ermutigte die Rundfunkveranstalter, die Interaktion mit den virtuellen Inhalten für Moderatoren zu verbessern. Sie haben jedoch die vordefinierte Berührung ausprobiert und die Moderatoren abgelenkt, und sie wurden nicht basierend auf den Objektgrößen in Hauptkamera-Aufnahmeszenarien definiert. Die genannten Probleme wurden vom Autor dieser Arbeit angesprochen, um einen benutzerdefinierten Satz von Handgesten in der Luft für TV-Moderatoren in Bezug auf Kameraaufnahmen zu finden. Die Arbeit verfolgte zwei Hauptansätze: (1) Eine Erhebungsstudie, in der Zweigruppensätze, die aus 8 Gesten bestehen, für zwei Kameraaufnahmen abgeleitet wurden. (2) Eine Bewertungsstudie, in der die Gesten bewertet wurden, um ihre soziale Akzeptanz bei Fernsehzuschauern und Moderatoren, die von den Moderatoren erforderlichen körperlichen und Konzentrationsanstrengungen und die Art der AR-HMD zu ermitteln, die sozial verträglicher ist. Die Ergebnisse dieser Arbeit zeigten, dass die abgeleiteten Gesten einen geringen Aufwand von Moderatoren erfordern, für die Verwendung im Fernsehen geeignet sind und keine Ablenkung verursachen. Kleinere AR-Brillen wurden sowohl für Fernsehzuschauer als auch für Moderatoren gegenüber HoloLens bevorzugt. Die Verwendung dieser Gesten würde es Moderatoren ermöglichen, AR-Inhalte im Fernsehen zu steuern und den Zuschauern die Geschichten auf moderne und klare Weise zu demonstrieren



Elbehery, Mostafa Ahmed Mostafa;
Presence : virtual hands as rigid bodies & real objects. - Ilmenau. - 96 Seiten
Technische Universität Ilmenau, Masterarbeit 2020

"Präsenz" und "User Experience" sind zwei Aspekte der virtuellen Realität (VR), die einen starken Hinweis darauf geben können, wie gut die virtuelle Welt wahrgenommen wurde. Die Art und Weise, wie der Benutzer in der VR dargestellt wird, ist ein wesentlicher Faktor, der diese beiden Aspekte beeinflusst, und in den letzten Jahrzehnten wurde eine Vielzahl dieser Darstellungen streng untersucht. Es gibt jedoch eine Wissenslücke in Bezug auf Darstellungen von Benutzern in VR, bei denen die Interaktion mit physischen Objekten Teil der Erfahrung ist. In dieser Forschung haben wir uns auf die Wirkung der Darstellung von Händen als starre Körper in einer VR-Erfahrung konzentriert, die den Umgang mit Objekten aus der realen Welt beinhaltet. Das Experiment wurde mit Objekten unterschiedlicher Größe geplant, und in der Erwartung, dass ein Teilnehmer die verschiedenen Objekte auf verschiedene Weise handhaben könnte. Es wurde eine Erzählung über den Teilnehmer erstellt, der in den Weltraum geschickt wurde, um Asteroiden zu zerstören, was zur Unterstützung der Präsenz getan wurde. Es wurde eine geeignete zweistufige VR-Erfahrung implementiert, bei der die Teilnehmer mit ihren Händen mit den realen Objekten interagieren und die Auswirkungen auf die VR-Welt betrachten konnten. Als Teil des immersiven Erlebnisses wurden Anweisungen an die Teilnehmer innerhalb der VR übermittelt, und sie erhielten auch reaktive Sprachaufforderungen, wenn sie einen Asteroiden zerstörten, um das Gefühl der Anwesenheit zu verstärken. Die 45 Teilnehmer wurden in drei Gruppen (je 15) aufgeteilt: NoHands, RigidHands, RigidHands+. Sie wurden per Fragebogen zu ihren Erfahrungen befragt Slater-Usoh-Steed (SUS) und iGroup Presence Questionnaire (IPQ) für "Presence", und VR-Erfahrungsprofilerstellung. User Experience Questionnaire (UEQ) short version für ein Maß der hedonischen und pragmatischen Qualitäten der verschiedenen Modi. Darüber hinaus wurden Protokolle gesammelt, um die Genauigkeit und Effizienz jeder Gruppe zu messen. Zusammenfassend lässt sich sagen, dass die Daten einen signifikanten Unterschied zur Präsenz zeigen, da die Hände ausgeschaltet wurden. Nur die Benutzererfahrung wechselte zwischen 'RigidHands' und 'RigidHands+'.



Seifert, Martin;
Detailreduktion in Foveated Rendering Systemen unter Nutzung von Level of Detail. - Ilmenau. - 60 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2020

Foveated Rendering nutzt Eye Tracking um den Blickpunkt des Nutzers zu erfassen und reduziert rechenaufwendige Details wie die Auflösung in der Peripherie um die Performanz deutlich zu erhöhen. Im besten Fall ist diese Reduktion für den Nutzer nicht wahrnehmbar, da die periphere Sicht des Auges nur ein niedriges Auflösungsvermögen besitzt. Jedoch kann eine ungeeignete Verringerung von Details zu störenden Fehlern führen. Ziel der Arbeit ist es die Reduktion der Polygonzahl in der Peripherie unter der Nutzung herkömmlicher Level of Detail - Verfahren zu implementieren und zu evaluieren. Dabei soll untersucht werden inwieweit und unter welchen Bedingungen ein Performanzgewinn ohne Beeinträchtigung der visuellen Qualität möglich ist. Dies wurde auch mithilfe einer Nutzerstudie geprüft. Es hat sich gezeigt, dass es unter bestimmten Bedingungen möglich ist die Gesamtzahl der Dreiecke in einer Szene auf ein Viertel zu reduzieren. Dabei werden jedoch hohe Anforderungen an das Eye Tracking gestellt, da Ungenauigkeit, Streuung und Latenz des Trackings die Benutzererfahrung negativ beeinflussen. Weiterhin erfordert die hier gezeigte Implementierung, dass Objekte nicht zu groß im Sichtfeld erscheinen, da sie sonst sehr häufig zumindest teilweise im Zentrum des Blickfeldes liegen und dementsprechend in höchster Qualität dargestellt werden müssen.



Seggedi, Franzi;
Die Darstellung von Figuren mit Behinderung in Videospielen - eine Figurenanalyse am Beispiel der Spielreihe Sly Cooper. - Ilmenau. - 125 Seiten
Technische Universität Ilmenau, Masterarbeit 2019

Die vorliegende Studie befasst sich mit der Darstellung der Figur Bentley und ihrer Behinderung aus der Videospielreihe Sly Cooper. Die theoretischen Grundlagen bezüglich der Charakterisierung und Darstellung von Figuren wurden auf das Medium der Videospiele bezogen und hier angewendet. Videospielfiguren können sowohl als Spiel- und auch als Erzählfiguren, als auch hinsichtlich verschiedener Aspekte bezüglich Eders Uhr der Figur analysiert werden. Sie besitzen Artefakt Eigenschaften und können als fiktives Wesen und als Spielfigur verstanden werden. Geprüft wurde, ob und in welchem Maß sich die Darstellung der Figur Bentley im Laufe der Spielreihe aufgrund ihrer erlangten Behinderung verändert und welchen Einfluss die körperliche Veränderung auf die Charakterisierung der Figur hat. Dafür wurde zum einen ein Sequenzprotokoll der beiden Spiele angefertigt, welches anschließend anhand der deduktiven Kategorien mit einer qualitativen Inhaltsanalyse untersucht wurde. Um der Subjektivität in dieser Studie etwas entgegen zu wirken, wurden außerdem 22 Probanden mit Hilfe eines Fragebogens befragt, wie sie die Figur vor dem Unfall (ohne Behinderung) und nach dem Unfall (mit Behinderung) einschätzen und den Charakter bewerten. Es zeigte sich, dass die Figur selbst scheinbar keine (psychischen) Probleme aufgrund ihrer Behinderung hat und in den meisten Situationen mit sich selbst im Reinen ist. Bentley baut sich dennoch im Verlauf des Spiels immer wieder selbst Verbesserungen an seinen Rollstuhl, die ihm verschiedenste Dinge ermöglichen und ihm das tägliche Leben erleichtern. Sowohl aus narrativer als auch aus ludischer Sicht überwindet die Figur so ein Stück weit ihre Behinderung und zieht sogar ihren Nutzen daraus. Sie ist also im Gegensatz zu der Zeit vor dem Unfall nun mit Rollstuhl schneller unterwegs, kann Sprünge vollführen und Taschendiebstähle begehen. Auch die Probanden konnten die subjektiven Einschätzungen der qualitativen Figurenanalyse stützen und bewerteten die Figur weiterhin als eine ausgeglichene Persönlichkeit. Obwohl der Umgang mit Behinderungen hier im Gegensatz zu vielen anderen Medien relativ pragmatisch und nicht in Stereotypen verläuft, so ist dennoch offensichtlich, dass sich die Figur ihrem Umfeld anpasst und ihre Behinderung extrem überwindet, sodass sie letztlich im Rollstuhl mobiler unterwegs ist, als sie dies vor ihrer Behinderung war.



Rudolph, Zoe;
Einsatzpotenzial von Virtual Reality in der Messeplanung. - Ilmenau. - 72 Seiten
Technische Universität Ilmenau, Bachelorarbeit 2019

Im Rahmen der Bachelorarbeit wird der Einsatz von Virtual Reality in der Messestandplanung betrachtet und analysiert. Es wird mithilfe von qualitativen Experteninterviews hinterfragt, ob und wie die Einbindung von Virtual Reality zur Steigerung der Ressourceneffizienz im Unternehmen beitragen kann. Es wird sowohl die Seite des Messeveranstalters, als auch die Seite des Ausstellers betrachtet. Die Interviews belegen, dass bei der Messestandplanung durch den Einsatz von Virtual Reality insbesondere von einer Ersparnis bezüglich der Zeitkomponente ausgegangen wird. Diese Ersparnis ist unter anderem begründet durch die optimierten und beschleunigten Prozesse. Weiterhin können auch humanen Ressourcen eingespart werden. In gewissen Fällen lässt sich auch der Einsatz von finanziellen Ressourcen effizienter gestalten.