• Aucun résultat trouvé

De nombreux travaux ont donc déjà été menés dans le domaine de l'OMR, conduisant à des méthodologies très différentes, concurrentes ou complémentaires, mais ne résolvant pas encore tous les problèmes.

Une caractéristique commune aux systèmes présentés est leur architecture, constituée globalement des étapes suivantes : prétraitements, détection des lignes de portée, segmentation,

Chapitre 1

reconnaissance des primitives, analyse syntaxique et interprétation sémantique.

De nombreux articles ont été consacrés à l'extraction des lignes de portée. Leur localisation précise, faisant face aux défauts courants (biais, courbure), s'est avérée indispensable. On peut retenir comme méthodes simples qui semblent bien fonctionner le calcul de l'interligne et de l'épaisseur des lignes de portée par l'analyse des histogrammes des empans noirs et blancs [Kato, Inokuchi 90]. Réaliser une projection horizontale de l'image redressée semble également pertinent, si le résultat est complété par une analyse fine de la position des lignes de portée, plus robuste aux symboles interférents que ce qui a été proposé jusqu'à présent.

Les méthodes pour la segmentation et la reconnaissance des symboles sont ensuite extrêmement variées, bien que la segmentation soit presque toujours amorcée par l'effacement des lignes de portée. On peut remarquer que segmentation et reconnaissance sont souvent imbriquées, sans unité de formalisation. Cela est dû à la difficulté de segmenter l'image en entités musicales, sans aucune connaissance préalable sur son contenu. Cette méthodologie est très certainement source d'erreurs. Elle ne permet pas, en tout cas, de gérer toute l'ambiguïté, car des décisions sont prises sur la base de connaissances incomplètes, voire erronées. Un axe d'investigation important sera donc de trouver des procédures qui permettent de bien séparer la segmentation de l'analyse des primitives, et de définir des méthodes de reconnaissance qui permettent de faire face à l'ambiguïté provenant des imprécisions de segmentation.

Concernant l'analyse proprement dite, beaucoup de propositions ont également été faites. La plupart d'entre elles sont fondées sur les rectangles englobants et l'extraction de caractéristiques géométriques et structurelles. Beaucoup moins d'auteurs ont exploré les méthodes qui analysent directement les pixels de l'image, comme le template matching. Cette voie semble cependant très intéressante, car elle ne nécessite pas une segmentation précise des formes. Elle semble en outre plus robuste aux défauts d'impression (symboles fractionnés ou qui se touchent). Les ambiguïtés de classification sont généralement traitées par des procédures ad hoc, utilisant des connaissances sur la notation musicale. De nouveau, il faut souligner le manque d'unité de formalisation, qui ne permet probablement pas de résoudre correctement l'ambiguïté. Un objectif, qui doit par conséquent être fixé, est de n'introduire dans la phase de reconnaissance que les connaissances relatives aux symboles eux-mêmes, indépendamment des autres, les règles musicales définissant les relations entre les symboles ne devant intervenir que dans les phases d'interprétation de haut niveau.

La dernière étape, l'analyse syntaxique, a été beaucoup moins développée dans la littérature que les précédentes. Il s'agit surtout de reconstruire les symboles à partir des primitives, et de restituer l'interprétation de haut niveau, par des méthodologies fondées sur des grammaires. Celles- ci formalisent les contraintes sur la position relative des primitives ou des symboles. Les règles syntaxiques, portant sur les altérations, les groupements de notes, ne sont pas introduites, probablement à cause des difficultés suivantes : leur flexibilité, et le fait qu'elles concernent un nombre quelconque de symboles pouvant être distants dans la partition. Les imprécisions sur la position des objets, dues aux erreurs de segmentation et d'analyse, la souplesse de la notation musicale elle-même, ne sont pas non plus modélisées. De nombreux problèmes restent donc ouverts au niveau de la modélisation de la notation musicale et de son intégration dans la méthode de

Principales méthodes de lecture automatique de partitions musicales reconnaissance.

Enfin, on peut remarquer que les systèmes ne gèrent généralement pas l'ambiguïté de classification, ou alors insuffisamment. Beaucoup d'auteurs soulignent la nécessité de remédier à cette lacune (e.g. [McPherson 02]). La méthodologie proposée dans [Fahmy, Blostein 98], procédant par génération d'hypothèses et décision, semble la plus appropriée pour prendre en compte simultanément toutes les sources d'ambiguïté.

En résumé, cette étude montre que certaines voies ont encore été insuffisamment explorées : − modéliser l'imprécision et l'incertitude liées aux informations extraites de l'image.

− modéliser et intégrer dans le système de reconnaissance l'ensemble des règles musicales régissant les relations entre les symboles, en allant au-delà des règles graphiques locales. En particulier, les règles syntaxiques relatives aux altérations, à la tonalité, à la métrique, doivent être considérées, au même titre que les règles graphiques.

− modéliser l'imprécision et la flexibilité de ces règles.

− fusionner toutes ces informations de manière à prendre une décision par optimisation globale (par opposition à des décisions locales successives).

Ces différents points devraient permettre de mieux gérer l'ambiguïté et d'accéder à une plus grande fiabilité. Nous essaierons donc de proposer des solutions à ces problèmes qui restent très ouverts.

Les autres objectifs importants que nous nous fixons, et qui sont encore insuffisamment atteints dans la littérature, sont les suivants :

− proposer une méthodologie qui sépare bien les différentes étapes du système de reconnaissance, et qui formalise de manière rigoureuse les connaissances a priori pouvant être utilisées pour rendre le système plus robuste.

− proposer des méthodes de segmentation qui surmontent au mieux les défauts d'impression, en particulier les problèmes de fragmentation et de connexion entre symboles.

− proposer des méthodes d'analyse des symboles, capables de faire face à ces défauts, ainsi qu'aux imprécisions de segmentation. L'analyse par template matching, très peu appliquée en OMR, semble une voie intéressante.

Un autre axe de recherche innovant concerne les différentes procédures qui permettraient de gagner en robustesse et en souplesse d'utilisation, comme l'indication automatique d'erreurs potentielles, ou l'apprentissage supervisé d'une partition spécifique. Nous tenterons également d'apporter des éléments de réponse à ces questions, très peu étudiées jusqu'à présent.

CHAPITRE 2

Structure du système de reconnaissance

proposé

Dans ce chapitre, nous rappelons les objectifs de notre étude, et nous en précisons le cadre : type de partitions analysées et constitution de la base d'images. Ensuite, nous présenterons la structure générale de notre système de reconnaissance, et nous discuterons de l'intérêt de cette architecture par rapport à celles qui ont déjà été proposées.