Unité mixte de recherche Ircam-cnrs



Yüklə 1,72 Mb.
səhifə263/312
tarix02.01.2022
ölçüsü1,72 Mb.
#15570
1   ...   259   260   261   262   263   264   265   266   ...   312

4.9.1.13Projet HOULE


Hierarchical Object based Unsupervised Learning

houle.ircam.fr



Équipes concernées : Analyse et synthèse des sons, Perception et design sonores, Représentations musicales



Financement: ANR Programme Jeunes Chercheurs

Période de réalisation : septembre 2011 – août 2014

Coordinateur : Mathieu Lagrange (STMS-CNRS)
Dans le cadre du projet HOULE, nous proposons des techniques originales d’apprentissage non supervisé pour résoudre le problème de la structuration des scènes auditives (Computational Auditory Scene Analysis : CASA), problème consistant à identifier et décrire les objets sonores constituant une scène. CASA est un domaine très actif du traitement du son ayant de nombreuses applications. Les points bloquant les méthodes actuelles sont :

• Ne pouvant faire d’hypothèse sur la nature des objets traités, on ne peut les modéliser a priori

• Les objets mélangés dans la scène ne peuvent être observés en isolation ;

• Leur structure est gouvernée par de nombreuses relations dont la priorité est difficile à établir.

Les caractéristiques dont nous tirons parti pour notre approche sont, l’organisation hiérarchique des scènes audio (atomes rassemblés en objets qui sont des instances de classes comme «La4 de piano», elle-même un exemple de «Note de piano»), et la redon- dance présente à tous les niveaux de cette hiérarchie. Cette redon- dance nous permet d’identifier des motifs récurrents sur lesquels fonder une représentation riche et robuste.

À cette nouvelle approche de la représentation de scènes audio correspond un algorithme d’apprentissage non supervisé spéciale- ment conçu pour traiter ces données. Le système est structuré en deux composants : le Regroupement Multi-Niveaux (RMN) opère la structuration des données, tandis que le «Superviseur» (module d’adaptation réflexive) incarne l’aspect «apprentissage» en optimisant à la volée le fonctionnement de RMN en référence à une mémoire d’exécutions passées.

L’originalité de notre proposition tient dans son détachement des approches traditionnelles à CASA, en commençant par le paradigme de représentation des scènes et objets. L’innovation est principalement présente dans les méthodes d’apprentissage non supervisé que nous allons développer, dont les applications dépassent largement le cadre de CASA.


Yüklə 1,72 Mb.

Dostları ilə paylaş:
1   ...   259   260   261   262   263   264   265   266   ...   312




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin