3.2 Notre méthode de classification
3.3.5 Expériences 3 : classification des segments en catégories d’inter-
tableau 3.8. Ces performances ont été calculées sur les journées de 8h du matin à 1h
le lendemain matin. C’est, en effet, sur cette période de la journée que l’extraction des
programmes est évaluée.
PL A ∅
Programme long (PL) 1479 152 0
Autre (A) 241 6775 0
PL A ∅
Programme long (PL) 1070 385 0
Autre (A) 121 11827 0
(a) France 2 (b) TF1
Tableau 3.8 – Matrices de confusion de notre classification des segments en segments de
programme long sur les journées des jours des 3 semaines de test.
Comme dans la section 3.3.3 précédente, la majorité des erreurs sont dues à des
seg-ments de séparation. L’impact de ses performances dans le processus de délinéarisation
est évalué dans le chapitre 4 suivant.
3.3.5 Expériences 3 : classification des segments en catégories
d’inter-programmes
Notre approche a été conçue dans un premier temps pour classer les segments de
pro-gramme et les segments d’inter-propro-gramme. Néanmoins, les inter-propro-grammes se divisent
en plusieurs catégories. Les publicités, les bandes annonces et les parrainages sont les
prin-cipales catégories d’inter-programmes. Nous avons donc cherché à classer les segments en
ces différentes catégories en conservant notre approche.
La classification des inter-programmes apporte une description plus complète du flux
TV. Elle n’est pas sans applications. Selon notre étude des méthodes existantes du
cha-pitre 1, nous avons déjà vu que de nombreux travaux se sont intéressés à la publicité. Les
publicités constituent en effet un point crucial dans le système économique des chaînes
de télévision. En effectuant une classification des inter-programmes en catégories, nous
proposons ainsi une méthode originale de détection de la publicité. En plus des
publici-tés, nous proposons de détecter les parrainages. Comme ces derniers portent des messages
commerciaux, ils rejoignent les publicités en ce qui concerne les applications. Ainsi, la
pige des parrainages est tout aussi importante que la pige des publicités. Cependant les
techniques actuelles de détection de publicités ne proposent pas de système de détection
des parrainages. Enfin, la classification des inter-programmes détecte les bandes annonces.
Les bandes annonces extraites peuvent être associées aux programmes qu’elles annoncent.
Ces bandes annonces fournissent alors des aperçus pertinents déjà construits qui peuvent
alimenter des catalogues de programmes TV dans un service de télévision à la demande.
La classification des inter-programmes en différentes catégories est une tâche annexe
dans la délinéarisation automatique des flux TV. Elle ne contribue pas directement à
l’extraction des programmes ou à la délimitation des inter-programmes.
Nous présentons rapidement notre méthode de classification des segments en catégories
d’inter-programmes, puis nous donnons quelques résultats.
3.3.5.1 Méthode de classification des segments en catégories d’inter-programmes
Notre méthode de classification des segments en catégories d’inter-programmes est la
même que la méthode précédente de classification des segments. La seule différence est que
nous manipulons plus de deux classes. Le système de vote présenté dans la section 3.2.5.3
reste valide pour plus de deux classes. Il permet bien de choisir une catégorie
d’inter-programme pour chaque segment à classer. Au final, l’algorithme d’application des règles
de classification s’exécute normalement.
Nous réalisons, malgré tout, un changement dans la méthode de classification. Nous
ajoutons, en effet, une propriété logique pour la création des règles de classification. La
propriété que nous ajoutons est la caractérisation possible d’un segment en tant que bande
annonce à partir de l’analyse duclusteringutilisé lors de la détection des répétitions. Nous
avons déjà expliqué cette exploitation possible des répétitions pour la détection de bande
annonce dans la section 2.6.
Cette propriété logique spécifique à certaines bandes annonces est ajoutée au module
de description logique. Pour un segment S
A, nous obtenons ainsi le prédicat simple
sup-plémentaire défini en extension :
EstBandeAnnonce(S
A)≡
« Le segment S
Aest une occurrence d’une
bande annonce détectée grâce à l’analyse
du clustering utilisé lors de la détection
des répétitions. »
Ce nouveau prédicat permet d’apprendre des règles spécifiques aux bandes annonces
avec un niveau de pertinence élevé. Par la suite, d’autres règles relationnelles peuvent
s’appuyer sans risques sur les résultats de classification fournis par ces règles fiables.
3.3.5.2 Résultats
Nous ne proposons qu’une étude préliminaire de la classification des segments en
ca-tégories d’inter-programmes. Nous avons limité notre corpus aux semaines n°1 et n°2 sur
la chaîne France 2. Nous avons utilisé la première semaine pour l’apprentissage et la
vali-dation. Nous avons ensuite testé notre méthode sur la deuxième semaine de test.
Les résultats sont présentés dans la matrice de confusion du tableau 3.9. Ces résultats
correspondent aux mesures de précision et de rappel données dans le tableau 3.10.
Les performances de notre méthode sont mitigées. Cette dernière souffre de la difficulté
à classer les segments de séparation. Ainsi aucun parrainage n’est correctement classé. Les
parrainages se répartissent presque équitablement entre les publicités et les programmes.
La propriété spécifique à certaines bandes annonces issues de la détection des répétitions
permet néanmoins de détecter les bandes annonces avec une bonne précision. Nous notons
qu’il y a moins de segments de bande annonce que de bandes annonces dans la vérité
terrain. Cela provient principalement des bandes annonces « dans un instant . . . » non
découpées par les répétitions, car celles-ci ne se répètent pas.
Pub Bande Parrainage Autres Programme Programme
annonce IP court
Pub 1744 4 5 19 38 2
Bande annonce 131 194 5 17 32 23
Parrainage 36 6 0 0 39 10
Autres IP 48 0 2 197 24 11
Programme 34 4 7 10 983 5
Programme court 54 2 0 2 83 63
Tableau 3.9 – Matrice de confusion de la classification des segments en différentes
caté-gories d’inter-programmes.
Précision Rappel
Pub 85,20 % 96,25 %
Bande annonce 92,38 % 47,43 %
Parrainage 0 % 0 %
Tableau 3.10 – Mesures de précision et de rappel de la classification des segments en
différentes catégories d’inter-programmes.
3.3.6 Synthèse
Nous avons proposé une méthode de classification de segments audiovisuels. Cette
méthode repose sur les propriétés de distribution des répétitions des segments. Elle emploie
également des informations relationnelles et contextuelles. Ces informations sont apprises
à partir d’un ensemble d’apprentissage. Elles traduisent l’agencement des programmes et
des inter-programmes dans un flux TV, c’est-à-dire la structure sous-jacente du flux.
Nous avons évalué à travers des expériences les performances de notre méthode de
classification. Ces expériences ont confirmé l’intérêt des informations contextuelles et
re-lationnelles. Notre méthode fournit ainsi de bons résultats généraux pour la classification
des inter-programmes et des programmes.
Extraction des programmes TV
Sommaire
Dans le document
Délinéarisation automatique de flux de télévision
(Page 117-120)