Mitarbeiter der Juniorprofessur Media Computing und der Intenta GmbH reichten eine Forschungsarbeit zum Thema der Klassifizierung von Audioereignissen, wie Sprache und für den Pflegebereich typische Geräusche, auf der Konferenz für Elektronische Sprachsignalverarbeitung (ESSV) in Leipzig von 2. bis 4. März 2016 ein.
![Frequenzspektren von Sprach- sowie nicht-Sprachereignissen [aus: Hussein et al: Acoustic Event Classification for Ambient Assisted Living and Health Environments]](https://localize-it.de/files/2016/08/paper-300x155.png)
Frequenzspektren von Sprach- sowie nicht-Sprachereignissen [aus: Hussein et al: Acoustic Event Classification for Ambient Assisted Living and Health Environments]
Im Rahmen der Forschung zeichneten die Forscher typische Sprach- sowie nicht-Sprachsequenzen, wie Schreie, brechende Scheiben, Möbelverrücken, etc. mit 58 Probanden auf und annotierten diese manuell. Die Extrahierung der Sprachmerkmale, unterteilt in zeitabhängige und frequenzabhängige Merkmale, ergab, dass Sprachereignisse aufgrund ihrer spektralen Strukturen besser klassifiziert werden können als nicht-Sprachereignisse. Anschließend nutzten die Forscher vielversprechende Klassifikatoren zur Einteilung der akustischen Ereignisse in verschiedene Klassen. Die besten Ergebnisse erreichte dabei der Klassifikator SMO (engl.: sequential minimal optimization) mit 92,5%.
Publikation: Hussein, Hussein; Ritter, Marc; Manthey, Robert & Heinzig, Manuel: Acoustic Event Classification for Ambient Assisted Living and Healthcare Environments. In: Konferenzpaper auf der 27. Konferenz Elektronische Sprachsignalverarbeitung 2016, Leipzig. [Link]
Kommentare