• Aucun résultat trouvé

Dans ce deuxième chapitre, nous avons effectué un état de l’art de la vidéo de football pour reconnaitre les événements importants. Cet état de l’art nous a permis de distinguer trois types de caractéristiques de la vidéo classées par niveaux. Les caractéristiques de haut niveau sont les événements importants dans la vidéo de football tels que : les buts,

les penalties, les corners, les fautes, les cartons jaune/rouge et les tentatives pour mar- quer un but. Ces événements importants sont caractérisés par l’apparition de certaines unités sémantiques. Une unité sémantique est composée d’une suite de plans du même événement. En fait, un événement est constitué de plusieurs unités sémantiques et la présence de certaines unités sémantiques spécifiques indique l’existence d’un événement important particulier. A ce propos, le domaine de connaissance montre qu’il y’a neuf unités sémantiques [2] : les ralentis, les cadres du goal, les zones de penalty, les coins du terrain, les légendes, les plans proches, le public, l’arbitre et les plans proches avec légende. Le traitement de ces unités sémantiques est réalisé via un ensemble de descrip- teurs de bas niveau comme la couleur, la texture, les bords, le logo, la zone de la tête, la taille des objets, etc.

Ainsi, l’étude des unités sémantiques du niveau intermédiaire se focalise sur la classifi- cation de plans. Cette opération est intéressante dans la reconnaissance des événements importants dans la vidéo de football. En effet, les séquences vidéo importantes se com- posent d’images clés de classes différentes : loin, médium et proche et elles sont ordonnées de façon particulière. Pour cette raison la classification des images clés ou plans est une technique critique dans l’analyse de la vidéo. A ce sujet, un grand nombre d’algorithmes de classification des plans a été proposé. Nous avons présenté dans ce chapitre les tech- niques qui utilisent : 1) la carte de blocs du terrain [19], 2) l’arbre de décision [20], 3) les SVMs [4], 4) les SVMs et les histogrammes de projections [5], 5) l’apparition les lignes du terrain [6], 6) la règle de la Golden Section Spatial Composition [7] et 7) la méthode haut-bas [8].

Modélisation des séquences vidéos

de matches de football

Dans le chapitre 2, nous avons effectué une analyse de la vidéo de football. L’analyse de la vidéo de football est une étape très importante dans la reconnaissance des événements importants. A ce propos, nous avons présenté les différents types de descripteurs dans la vidéo de football. De plus, nous avons exposé un ensemble d’outils de classification de plans. Cette opération permet de classifier les images clés des séquences vidéos. Le chapitre courant parle de la modélisation des séquences vidéos de football afin de re- connaitre les événements importants. Ainsi, nous présentons dans la première section les deux grandes classes d’approches pour modéliser les événements importants dans la vidéo de football. Ensuite, nous exposons les MMCs dans la deuxième section. Ils repré- sentent un bon outil de modélisation des événements de football grâce à leur habilité à modéliser les événements spatiaux temporels. Et dans la troisième et dernière section, nous proposons un ensemble de techniques de reconnaissance des événements importants dans la vidéo de matches de football, que nous avons trouvé dans la littérature.

3.1

Classes d’approches de modélisation des séquences vi-

déos

La reconnaissance des événements importants nécessite la modélisation des séquences vidéo. Dans la littérature, nous trouvons deux grandes classes d’approches pour modéliser les séquences vidéos de football [14] : les approches basées sur les règles et les approches statistiques.

3.1.1 Approches basées sur les règles

Les approches basées sur les règles utilisent le domaine de connaissance pour définir un ensemble de règles de classification sémantique des séquences vidéos [15,16]. A ce sujet, Xu et al. [15] ont défini des règles heuristiques pour étudier les transitions d’images dans les séquences vidéos en vue d’en extraire des informations dites de structure. Ces informations de structure permettent de définir les états de jeu play et break. L’état play correspond à un segment vidéo où le jeu est en cours tandis que l’état break répond à un segment où le jeu est arrêté. Encore, Duan et al. [16] ont défini des règles pour tracer une carte de caractéristiques visuelles et audio des séquences vidéos. Au fait, les approches basées sur les règles sont distinguées par la facilité de gestion des règles c- à-d en cas d’ajout d’une nouvelle règle, de suppression et de modification des règles existantes. Cependant, quand le type de la vidéo traité change, les règles doivent être refaites manuellement.

3.1.2 Approches statistiques

Les approches statistiques représentent la deuxième classe d’approches de modélisation des séquences de football. Ces approches utilisent des méthodes d’apprentissage pour classifier les séquences de la vidéo de sport [43]. Nous citons dans ce qui suit quelques techniques trouvées dans la littérature.

3.1.2.1 Les Machines à Vecteurs de Supports (SVMs)

Les SVMs ont été annoncés dans les années 1990 par V ladimir V apnik qui a développé une théorie statistique d’apprentissage appelée la Théorie de Vapnik-Chervonenkis. Les SVMs ont rapidement été adoptés pour leur capacité à manipuler des données de grandes dimensions et à leur propriété de généralisation des résultats de la classification des don- nées multimédia. A ce propos, plusieurs études ont été réalisées pour analyser la vidéo de sports avec les SVMs. Nous citons l’étude de Y. Ma et al. [44] qui ont utilisé les SVMs pour modéliser les caractéristiques du mouvement dans la vidéo afin de distinguer les différents types de clips. Et dans [16,45], L.-Y. Duan et al. et M. Xu et al. ont exploité les SVMs pour créer des mid − level sports audio keywords. En liaison avec les SVMs, l’extension SVMs hiérarchiques est développée pour traiter le cas où un simple SVM ne peut pas distinguer toutes les classes requises en une seule étape [45]. De manière géné- rale, les SVMs peuvent être utilisés dans la résolution des problèmes de discrimination pour décider à quelle classe appartient un échantillon. De même, les SVMs traitent des problèmes de régression pour prédire la valeur numérique d’une variable.

3.1.2.2 Les réseaux de neurones (RNs)

Les réseaux de neurones représentent une deuxième approche statistique pour classifier les événements de la vidéo de football. Les RNs sont utilisés dans divers domaines tels que le traitement du signal, le traitement d’image et de la parole, la robotique, etc. Les réseaux de neurones utilisent l’algorithme perceptron multicouche, développé en 1985 [46]. L’algorithme perception multicouche est un algorithme de rétro propagation du gra- dient. Ce dernier détermine l’erreur commise par chaque neurone du réseau lors de la phase d’apprentissage et il modifie la valeur du poids de chaque neurone pour minimi- ser cette erreur. Les rétro propagations sont itérées jusqu’à ce que l’erreur quadratique moyenne devienne inférieure à un certain seuil. Diverses études sur le traitement de la vidéo de sport avec les réseaux de neurones ont été réalisés. J. Assfalg et al. [12] ont utilisé deux RNs pour classifier les plans de la vidéo de football. Les RNs permettent la reconnaissance des bords du terrain et de la couleur verte. Aussi, V. Kobla et al. [47] ont employé les réseaux de neurones pour segmenter la région du texte dans la vidéo de sport.

3.1.2.3 Les Modèles de Markov Cachés (MMCs)

D’autres approches statistiques de modélisation des séquences vidéos reposent sur les MMCs. Les MMCs sont utilisés lors de l’apprentissage et la reconnaissance des événe- ments importants dans la vidéo de football. Leur popularité est due à leur habilité à modéliser les motifs spatiaux temporels dans les séquences vidéos. Les MMCs seront détaillés à la section3.2.

3.1.2.4 Autres algorithmes

En plus des algorithmes déjà cités, il y’a d’autres approches statistiques telles que les Chaînes de Markov Contrôlées [48], le maximum d’entropie [49], le classifieur bayesien naïf [50] et le réseau de confiance bayesien [51].

Documents relatifs