• Aucun résultat trouvé

Expériences 3 : classification des segments en catégories d’inter-

3.2 Notre méthode de classification

3.3.5 Expériences 3 : classification des segments en catégories d’inter-

tableau 3.8. Ces performances ont été calculées sur les journées de 8h du matin à 1h

le lendemain matin. C’est, en effet, sur cette période de la journée que l’extraction des

programmes est évaluée.

PL A ∅

Programme long (PL) 1479 152 0

Autre (A) 241 6775 0

PL A ∅

Programme long (PL) 1070 385 0

Autre (A) 121 11827 0

(a) France 2 (b) TF1

Tableau 3.8 – Matrices de confusion de notre classification des segments en segments de

programme long sur les journées des jours des 3 semaines de test.

Comme dans la section 3.3.3 précédente, la majorité des erreurs sont dues à des

seg-ments de séparation. L’impact de ses performances dans le processus de délinéarisation

est évalué dans le chapitre 4 suivant.

3.3.5 Expériences 3 : classification des segments en catégories

d’inter-programmes

Notre approche a été conçue dans un premier temps pour classer les segments de

pro-gramme et les segments d’inter-propro-gramme. Néanmoins, les inter-propro-grammes se divisent

en plusieurs catégories. Les publicités, les bandes annonces et les parrainages sont les

prin-cipales catégories d’inter-programmes. Nous avons donc cherché à classer les segments en

ces différentes catégories en conservant notre approche.

La classification des inter-programmes apporte une description plus complète du flux

TV. Elle n’est pas sans applications. Selon notre étude des méthodes existantes du

cha-pitre 1, nous avons déjà vu que de nombreux travaux se sont intéressés à la publicité. Les

publicités constituent en effet un point crucial dans le système économique des chaînes

de télévision. En effectuant une classification des inter-programmes en catégories, nous

proposons ainsi une méthode originale de détection de la publicité. En plus des

publici-tés, nous proposons de détecter les parrainages. Comme ces derniers portent des messages

commerciaux, ils rejoignent les publicités en ce qui concerne les applications. Ainsi, la

pige des parrainages est tout aussi importante que la pige des publicités. Cependant les

techniques actuelles de détection de publicités ne proposent pas de système de détection

des parrainages. Enfin, la classification des inter-programmes détecte les bandes annonces.

Les bandes annonces extraites peuvent être associées aux programmes qu’elles annoncent.

Ces bandes annonces fournissent alors des aperçus pertinents déjà construits qui peuvent

alimenter des catalogues de programmes TV dans un service de télévision à la demande.

La classification des inter-programmes en différentes catégories est une tâche annexe

dans la délinéarisation automatique des flux TV. Elle ne contribue pas directement à

l’extraction des programmes ou à la délimitation des inter-programmes.

Nous présentons rapidement notre méthode de classification des segments en catégories

d’inter-programmes, puis nous donnons quelques résultats.

3.3.5.1 Méthode de classification des segments en catégories d’inter-programmes

Notre méthode de classification des segments en catégories d’inter-programmes est la

même que la méthode précédente de classification des segments. La seule différence est que

nous manipulons plus de deux classes. Le système de vote présenté dans la section 3.2.5.3

reste valide pour plus de deux classes. Il permet bien de choisir une catégorie

d’inter-programme pour chaque segment à classer. Au final, l’algorithme d’application des règles

de classification s’exécute normalement.

Nous réalisons, malgré tout, un changement dans la méthode de classification. Nous

ajoutons, en effet, une propriété logique pour la création des règles de classification. La

propriété que nous ajoutons est la caractérisation possible d’un segment en tant que bande

annonce à partir de l’analyse duclusteringutilisé lors de la détection des répétitions. Nous

avons déjà expliqué cette exploitation possible des répétitions pour la détection de bande

annonce dans la section 2.6.

Cette propriété logique spécifique à certaines bandes annonces est ajoutée au module

de description logique. Pour un segment S

A

, nous obtenons ainsi le prédicat simple

sup-plémentaire défini en extension :

EstBandeAnnonce(S

A

)≡

« Le segment S

A

est une occurrence d’une

bande annonce détectée grâce à l’analyse

du clustering utilisé lors de la détection

des répétitions. »

Ce nouveau prédicat permet d’apprendre des règles spécifiques aux bandes annonces

avec un niveau de pertinence élevé. Par la suite, d’autres règles relationnelles peuvent

s’appuyer sans risques sur les résultats de classification fournis par ces règles fiables.

3.3.5.2 Résultats

Nous ne proposons qu’une étude préliminaire de la classification des segments en

ca-tégories d’inter-programmes. Nous avons limité notre corpus aux semaines n°1 et n°2 sur

la chaîne France 2. Nous avons utilisé la première semaine pour l’apprentissage et la

vali-dation. Nous avons ensuite testé notre méthode sur la deuxième semaine de test.

Les résultats sont présentés dans la matrice de confusion du tableau 3.9. Ces résultats

correspondent aux mesures de précision et de rappel données dans le tableau 3.10.

Les performances de notre méthode sont mitigées. Cette dernière souffre de la difficulté

à classer les segments de séparation. Ainsi aucun parrainage n’est correctement classé. Les

parrainages se répartissent presque équitablement entre les publicités et les programmes.

La propriété spécifique à certaines bandes annonces issues de la détection des répétitions

permet néanmoins de détecter les bandes annonces avec une bonne précision. Nous notons

qu’il y a moins de segments de bande annonce que de bandes annonces dans la vérité

terrain. Cela provient principalement des bandes annonces « dans un instant . . . » non

découpées par les répétitions, car celles-ci ne se répètent pas.

Pub Bande Parrainage Autres Programme Programme

annonce IP court

Pub 1744 4 5 19 38 2

Bande annonce 131 194 5 17 32 23

Parrainage 36 6 0 0 39 10

Autres IP 48 0 2 197 24 11

Programme 34 4 7 10 983 5

Programme court 54 2 0 2 83 63

Tableau 3.9 – Matrice de confusion de la classification des segments en différentes

caté-gories d’inter-programmes.

Précision Rappel

Pub 85,20 % 96,25 %

Bande annonce 92,38 % 47,43 %

Parrainage 0 % 0 %

Tableau 3.10 – Mesures de précision et de rappel de la classification des segments en

différentes catégories d’inter-programmes.

3.3.6 Synthèse

Nous avons proposé une méthode de classification de segments audiovisuels. Cette

méthode repose sur les propriétés de distribution des répétitions des segments. Elle emploie

également des informations relationnelles et contextuelles. Ces informations sont apprises

à partir d’un ensemble d’apprentissage. Elles traduisent l’agencement des programmes et

des inter-programmes dans un flux TV, c’est-à-dire la structure sous-jacente du flux.

Nous avons évalué à travers des expériences les performances de notre méthode de

classification. Ces expériences ont confirmé l’intérêt des informations contextuelles et

re-lationnelles. Notre méthode fournit ainsi de bons résultats généraux pour la classification

des inter-programmes et des programmes.

Extraction des programmes TV

Sommaire