Datenreduktion mit geringem Datenverlust in der Videobilderkennung

Überblick von Ähnlichkeitsmaßen bewertet von Mensch und Maschine [aus: Ritter et al: Simplifying Accessibility Without Data Loss: An Exploratory Study on Object Preserving Keyframe Culling, S.9]

In Zusammenarbeit mit Prof. Dr. Dr. Gisela Susanne Bahr vom Florida Institute of Technology führte die Stiftungsprofessur Media Computing unter der Leitung von Jun.-Prof. Dr. Marc Ritter eine explorative Studie im Bereich der Bilderkennung in Videomaterial durch. Insbesondere geht es um die Reduzierung von Video-Keyframes unter Erhaltung aller relevanten Objektinstanzen, welche im Rahmen des TrecVid Instance Search Wettbewerbs 2015 [Link] ausgewählt wurden und in vier Stunden Videomaterial der BBC Serie “East Enders” erkannt werden sollten.

Bei der Analyse von Videomaterial erfolgt zunächst eine Auswahl von einzelnen Keyframes, die repräsentativ für die jeweilige Szene stehen. Um redundante Bilderinhalte zu vermeiden ist die Anzahl der ausgewählten Keyframes pro Szene so gering wie möglich zu halten, was durch eine fehlende Trainigsmöglichkeit des Algorithmus’ erschwert wird. Im Gegensatz zu anderen Forschern, die eine starre Anzahl von Keyframes auswählen (z.B. ein Keyframe pro Sekunde), entschieden sich die Forscher für eine Auswahlmethode, die sich an der Länge der Szene orientiert, da sich Objektpositionen innerhalb längerer Szenen verändern können. In ihrer Studie sortierten die Forscher dann manuell die übrigen Duplikate aus und versuchten die angewandten Auswahlkriterien objektiv zu evaluieren und mit computergestützten Maßen maschinell nachzustellen. Dabei erreichten sie eine Reduzierung der repräsentativen Keyframes um 84% bei Erhalt von 82% aller Instanzen der auftretenden Objektklassen.

Die Vorstellung der Ergebnisse der Studie erfolgt im Juli diesen Jahres auf der Conference on Human-Computer Interaction International (HCII) in Toronto, Kanada.

Publikation: Ritter, Marc; Kowerko, Danny; Hussein, Hussein; Heinzig, Manuel; Schlosser, Tobias; Manthey, Robert & Bahr, Gisela Susanne: Simplifying Accessibility Without Dataloss: An Exploratory Study on Object Preserving Keyframe Culliung. In: Universal Access in Human-Computer Interaction. Part of Human Computer Interaction International (HCII) 2016, At Toronto, Canada, Volume: LNCS, 12 S. [Link]

Dieser Artikel wurde eingestellt am 2016-07-20 um 09:00 und ist unter Publikation eingeordnet. Du kannst den Reaktionen auf diesen Artikel über den RSS 2.0-Feed folgen. Kommentare und Pings sind deaktiviert.

localizeIT

Datenreduktion mit geringem Datenverlust in der Videobilderkennung

Kommentare