SpaRel - Using Spatial Relations for parts-based scene recognition and prediction


 

Das Ziel des vorgeschlagenen Projekts ist es, das Wissen eines Systems über die räumlichen Beziehungen von Objekten oder Objektteilen zu nutzen, um das visuelle Scannen der aktuellen Szene zu leiten. Dabei können charakteristische Muster genutzt werden, um z. B. die visuelle Suche zu beschleunigen, Objekte zu erkennen oder den Kontext der gegebenen Szene zu bestimmen.

Das Hauptaugenmerk dieses Projekts liegt auf der Erkennung und Interpretation einer visuellen Szene, die durch die Einbeziehung räumlicher Beziehungen von Szenenteilen sehr profitieren wird. Wenn man zum Beispiel ein Auto rechts von der Straße sieht, kann man davon ausgehen, dass es geparkt ist, während das gleiche Auto auf der Straße als fahrend angenommen werden kann. Darüber hinaus kann der Prozess des Scannens einer visuellen Szene auch durch die Einschränkung des räumlichen Suchraums verbessert werden. Das bedeutet, dass bei der Erkennung einer Gabel in der Szene ein Tisch darunter angenommen werden kann, sowie Geschirr oder ein Messer rechts von dieser Gabel. Es muss eine geeignete Repräsentation gefunden werden, die das Speichern und Lernen dieser räumlichen Beziehungen zwischen Objektteilen oder Objekten selbst ermöglicht.