2017-10-21 | Anmelden
 
 

Datenreduktion mit geringem Datenverlust in der Videobilderkennung

Überblick von Ähnlichkeitsmaßen bewertet von Mensch und Maschine [aus: Ritter et al: Simplifying Accessibility Without Data Loss: An Exploratory Study on Object Preserving Keyframe Culling, S.9]

Überblick von Ähnlichkeitsmaßen bewertet von Mensch und Maschine [aus: Ritter et al: Simplifying Accessibility Without Data Loss: An Exploratory Study on Object Preserving Keyframe Culling, S.9]

In Zusammenarbeit mit Prof. Dr. Dr. Gisela Susanne Bahr vom Florida Institute of Technology führte die Stiftungsprofessur Media Computing unter der Leitung von Jun.-Prof. Dr. Marc Ritter eine explorative Studie im Bereich der Bilderkennung in Videomaterial durch. Insbesondere geht es um die Reduzierung von Video-Keyframes unter Erhaltung aller relevanten Objektinstanzen, welche im Rahmen des TrecVid Instance Search Wettbewerbs 2015 [Link] ausgewählt wurden und in vier Stunden Videomaterial der BBC Serie „East Enders“ erkannt werden sollten.

Bei der Analyse von Videomaterial erfolgt zunächst eine Auswahl von einzelnen Keyframes, die repräsentativ für die jeweilige Szene stehen. Um redundante Bilderinhalte zu vermeiden ist die Anzahl der ausgewählten Keyframes pro Szene so gering wie möglich zu halten, was durch eine fehlende Trainigsmöglichkeit des Algorithmus‘ erschwert wird. Im Gegensatz zu anderen Forschern, die eine starre Anzahl von Keyframes auswählen (z.B. ein Keyframe pro Sekunde), entschieden sich die Forscher für eine Auswahlmethode, die sich an der Länge der Szene orientiert, da sich Objektpositionen innerhalb längerer Szenen verändern können. In ihrer Studie sortierten die Forscher dann manuell die übrigen Duplikate aus und versuchten die angewandten Auswahlkriterien objektiv zu evaluieren und mit computergestützten Maßen maschinell nachzustellen. Dabei erreichten sie eine Reduzierung der repräsentativen Keyframes um 84% bei Erhalt von 82% aller Instanzen der auftretenden Objektklassen.

Die Vorstellung der Ergebnisse der Studie erfolgt im Juli diesen Jahres auf der Conference on Human-Computer Interaction International (HCII) in Toronto, Kanada.

Publikation: Ritter, Marc; Kowerko, Danny; Hussein, Hussein; Heinzig, Manuel; Schlosser, Tobias; Manthey, Robert & Bahr, Gisela Susanne: Simplifying Accessibility Without Dataloss: An Exploratory Study on Object Preserving Keyframe Culliung. In: Universal Access in Human-Computer Interaction. Part of Human Computer Interaction International (HCII) 2016, At Toronto, Canada, Volume: LNCS, 12 S. [Link]

 

Kommentare

Keine Kommentare ... bis jetzt.
 
Projektgeber

Gef M BMBF

Gef M BMBF

LocalizeIt wird durch das Bundesministerium für Bildung und Forschung BMBF und die BMBF Innovationsinitiative Unternehmen Region von August 2014 bis Juli 2019 gefördert und durch den Projektträger PtJ betreut.

Projektnehmer

Logo TU trans cropp

Logo MI

Logo MC TRANS

localizeIT ist ein Projekt der
Stiftungsjuniorprofessur Media Computing und der Professur Medieninformatik der Technischen Universität Chemnitz

Forschungspartner

Intenta Logo

3D MicroMag Logo

IBS Logo

Kontakt

Dr. rer. nat. Danny Kowerko
Tech­ni­sche Uni­ver­si­tät Chem­nitz
Fakul­tät für Infor­ma­tik
Juniorpro­fes­sur Medi­a Computing
Straße der Natio­nen 62
09111 Chemnitz