2018-05-23 | Anmelden
 
 

Erfolgreiche Teilnahme beim TRECVID Instance Search

Im Rah­men ein­er Koop­er­a­tion von Mitar­beit­ern der Stiftungsju­nior­pro­fes­sur Media Com­put­ing und der Pro­fes­sur Medi­en­in­for­matik der Tech­nis­chen Uni­ver­sität Chem­nitz ist es den Nach­wuch­swis­senschaftlern unter Leitung von Jun.-Prof. Dr. Marc Rit­ter zwis­chen April und August 2014 gelun­gen, ein Sys­tem zur Teil­nahme an der wis­senschaftlich renom­mierten Eval­u­a­tion­skam­pagne TREC Video Retrieval Eval­u­a­tion (TRECVID) in der Kat­e­gorie Instance Search zu entwer­fen und zu imple­men­tieren.

Die seit 2001 jährlich vom amerikanis­chen Nation­al Insti­tute for Stan­dards and Tech­nolo­gies (NIST) organ­isierten TRECVID Eval­u­a­tion­skam­pag­nen befassen sich mit topak­tuellen Forschung­sprob­le­men, die im all­ge­meinen Kon­text des Infor­ma­tion Retrieval (IR) beson­ders auf inhalts­basierte Suche und Nutzbar­ma­chung dig­i­taler Videos fokussiert. Das Ziel beste­ht darin, die Forschung auf diesen The­menge­bi­eten voranzutreiben, indem große Testkollek­tio­nen zusam­men mit real­is­tis­chen Auf­gaben­stel­lun­gen und einem ein­heitlichen Bew­er­tungsver­fahren veröf­fentlicht und ein Forum zum inter­na­tionalen Ver­gle­ich der Ergeb­nisse gestellt wird.

Für die diesjährige Auf­gaben­stel­lung im Bere­ich Instance Search wurde ein Kor­pus von 464 Stun­den Video­ma­te­r­i­al der BBC Dai­ly-Soap Eas­t­en­ders zur Ver­fü­gung gestellt. Das Ziel bestand darin, bis zu 1.000 ver­schiedene Instanzen (Beispiele) von 30 ver­schiede­nen Objek­ten, Per­so­n­en oder Orten im Kor­pus aufzufind­en. Wis­senschaftlich inter­es­sant wird das Ganze bei genauer­er Betra­ch­tung der Struk­tur der Suchan­frage und der Train­ings­dat­en, die sich von üblichen Objek­t­de­tek­tionsver­fahren deut­lich abgren­zen, da hier statt Tausender an Train­ings­beispie­len eine sehr geringe Anzahl von vier Beispie­len vor­liegt und kein zuvor erlerntes Objek­t­mod­ell zur Anwen­dung gelan­gen darf. Darüber hin­aus ist die Klasse des zu find­en­den Objek­ts oft­mals nur grob definiert: Wird beispiel­sweise nach ein­er roten Plas­tik­flasche gesucht, die Ketchup enthält, muss eine vari­able Objek­terken­nung sowohl bauchige als auch längliche Flaschen iden­ti­fizieren kön­nen, wohinge­gen visuell sehr ähn­lich beschaf­fene Glas­flaschen mit Ketchup nicht erkan­nt wer­den dür­fen.

Das achtköp­fige Team von Nach­wuch­swis­senschaftlern hat dabei vielfältige Ansätze und Lösungsstrate­gien ver­fol­gt und intern evaluiert. Am erfol­gver­sprechend­sten erschien der Ansatz ein­er Git­ter-Pyra­mide von MPEG-7 Deskrip­toren, die auf ein bis fünf aus­gewählten repräsen­ta­tiv­en Bildern pro Kam­er­ae­in­stel­lung berech­net wur­den. Durch diesen dynamis­chen Ansatz war es möglich, die Anzahl der zu analysieren­den Einzel­bilder von fast 42 Mil­lio­nen auf etwa 1,1 Mil­lio­nen zu reduzieren. Weit­ere Verbesserun­gen ließen sich durch eine Analyse des Audio-Mate­ri­als erzie­len, so dass für ver­schiedene Szenen automa­tisiert eine Aus­sage getrof­fen wer­den kon­nte, ob es sich dabei um Innen- oder Außen­szenen han­delt. Verbliebene Fehlde­tek­tio­nen wur­den unter Beach­tung ein­er max­i­mal 15 minüti­gen Nach­lese händisch ent­fer­nt.

Die Ergeb­nisse wur­den von Jun.-Prof. Dr. Marc Rit­ter vom 10.–12. Novem­ber 2014 auf dem TRECVID Work­shop an der Uni­ver­si­ty of Cen­tral Flori­da in Orlan­do, Flori­da, USA vorgestellt. Dabei kon­nten viele neue Erken­nt­nisse gewon­nen wer­den, welche die zukün­fti­gen Forschun­gen und Entwick­lun­gen im Pro­jekt local­izeIT maßge­blich bee­in­flussen wer­den.

Pub­lika­tion: Rit­ter, Marc ; Heinzig, Manuel ; Herms, Robert ; Kahl, Ste­fan ; Richter, Daniel ; Man­they, Robert & Eibl, Max­i­m­il­ian: Tech­nis­che Uni­ver­sität Chem­nitz at TRECVID Instance Search 2014. In: TRECVID Work­shop, 10.–12.11.2014, Orlan­do, Flori­da, USA, 8 S. [Link]

 

localizeIT gestartet

Startklappe_localizeITNach­dem zum 1. Juli 2014 die Stiftungsju­nior­pro­fes­sur Media Com­put­ing an der Tech­nis­chen Uni­ver­sität Chem­nitz durch Jun.-Prof. Dr. Marc Rit­ter beset­zt wurde, kon­nte am heuti­gen 1. August 2014 das zuge­hörige und mit Hil­fe der Pro­fes­sur Medi­en­in­for­matik konzip­ierte Begleit­pro­jekt starten: die Inno­Pro­file-Trans­fer-Ini­tia­tive “local­izeIT — Lokalisierung visueller Medi­en” mit ein­er geplanten Laufzeit bis 31. Juli 2019. Damit ein­herge­hend nehmen auch die ersten vier Wis­senschaftlichen Mitar­beit­er Dr. Mar­cel Heinz, Dr. Hus­sein Hus­sein, Robert Man­they und Daniel Richter ihre Tätigkeit in den entsprechen­den Arbeits­ge­bi­eten auf. Wir freuen uns auf eine erfol­gre­iche und frucht­bare Zusam­me­nar­beit mit unseren Forschungspart­nern.

 
 
Projektgeber

Gef M BMBF

Gef M BMBF

LocalizeIt wird durch das Bundesministerium für Bildung und Forschung BMBF und die BMBF Innovationsinitiative Unternehmen Region von August 2014 bis Juli 2019 gefördert und durch den Projektträger PtJ betreut.

Projektnehmer

Logo TU trans cropp

Logo MI

Logo MC TRANS

localizeIT ist ein Projekt der
Stiftungsjuniorprofessur Media Computing und der Professur Medieninformatik der Technischen Universität Chemnitz

Forschungspartner

Intenta Logo

3D MicroMag Logo

IBS Logo

Kontakt

Dr. rer. nat. Danny Kowerko
Tech­ni­sche Uni­ver­si­tät Chem­nitz
Fakul­tät für Infor­ma­tik
Juniorpro­fes­sur Medi­a Computing
Straße der Natio­nen 62
09111 Chemnitz