Projektdaten

 

Gefördert durch: ScaleHub

Laufzeit: 2020 - 2022

Ansprechpartner: Jun.-Prof. Dr. Matthias Hirth, Edwin Gamboa, M. Eng., Dan Dubiner (ScaleHub)

Projektbeschreibung

Human-AI Collaboration for Scalable and High-Quality Segmentation of Visual Media

Künstliche Intelligenz (KI) ist heute einer der führenden Wirtschaftstreiber. Die jüngsten Fortschritte in der Algorithmenforschung und Hardwareentwicklung ermöglichen neuartige Anwendungen, die vor einigen Jahren noch undenkbar waren und bestehende Industrien dramatisch verändern. Bezogen auf die traditionellen deutschen Industriezweige dürfte die Digitalisierung und Anwendung von KI im Automobilbereich eines der prominentesten Beispiele sein. Waren deutsche Automobilhersteller jahrzehntelang für ihre Innovationen und technische Qualität bekannt, so treten nun neue Global Player wie Tesla, Google oder andere Unternehmen aus der IT-Branche in diesem Bereich auf. Im Gegensatz zu den traditionellen Herstellern liegt die Stärke dieser Unternehmen in der Entwicklung von Software und KI-Lösungen, die Komfortfunktionen wie (teil-)autonomes Fahren ermöglichen.

Die entscheidende Voraussetzung für die Entwicklung von KI-Lösungen für das autonome Fahren, und KI-Lösungen im Allgemeinen, sind sehr große und sehr gut kuratierte Trainingsdatensätze. In manchen Fällen sind solche Datensätze bereits vorhanden, z.B. wenn sie aus Sensorwerten abgeleitet werden können. Manchmal ist es auch möglich, dass KI-Lösungen automatisch Datensätze generieren und diese zum Training und zur Verbesserung wiederverwenden. Dieser Ansatz wurde z. B. von Googles AlphaGo Zero verwendet. In den meisten Fällen und vor allem bei Anwendungen im audiovisuellen Bereich, muss der Mensch die Datensätze jedoch immer noch manuell erzeugen. Google nutzt Mechanismen wie reCaptcha, um die Arbeitskraft von Hunderttausenden von Internetnutzern für die Kategorisierung und Segmentierung von Bildern kostenlos zu nutzen. Die meisten anderen Unternehmen, wie z.B. Amazon, setzen auf manuelle Annotation mit eigenen Mitarbeitern oder auf Crowdsourcing-basierte Ansätze, um ähnliche Dienste anzubieten. Diese sind jedoch oft mit hohen Personalkosten verbunden.

In diesem Zusammenhang verfolgt dieses Projekt zwei Ziele. Das erste Ziel ist es, bestehende Crowdsourcing-basierte Ansätze für die Segmentierung von Bildern und Videos in Bezug auf Kosten und Genauigkeit zu verbessern. Das zweite Ziel ist die Entwicklung von KI-Lösungen zur Unterstützung der Crowdworkers während des Segmentierungsprozesses.