• Aucun résultat trouvé

Video defect detection MMSPG

1.1.2 Éditer des concerts et extraire des morceaux de musique : zoom, tâtonnement et équipement

1.1.2.3 Première ébauche du morceau

L’indexation consiste en son cœur à ajouter des balises (tags) aux fichiers numérisés pour marquer le début et la fin de chaque événement identifié sur l’avatar audio de la bande d’enregistrement. Le timecode (repère temporel) de ces balises pourra ensuite servir à guider l’extraction des morceaux comme à faciliter la recherche et la lecture des concerts enregistrés devenus listes de morceaux. Pour y arriver, les étudiants ingénieurs doivent construire les songs. Ils le font en partant de la Festival-setlist et d’une première exploration visuelle du fichier sonore. Vient alors le moment de déterminer les limites physiques de ces songs.

Ayant repéré sur le fichier audio à l’écran un premier morceau correspondant à la

Festival-setlist, Thomas place le curseur et fixe une balise à la fin du paquet d’onde. Cette fin

est aussi l’exact début de la transition suivante qu’il crée dans la foulée, à savoir une séquence « applause » et dont la fin est fixée d’abord provisoirement. Elle ne deviendra définitive qu’une fois le début du second morceau clairement identifié quelque part entre la fin possible de l’« applause » et le paquet d’ondes suivant. Dans cette zone, encore floue, Thomas promène le curseur de sa souris, par petites touches, sur la représentation graphique du signal audio ; chaque arrêt génère le son correspondant dans son casque. Il teste ainsi quelques débuts possibles jusqu’à en marquer un provisoirement, ouvrant automatiquement une nouvelle plage temporelle (range) qu’il étend vers la fin du paquet d’ondes en passe de devenir le second morceau. Le marqueur de fin est placé grossièrement vers la fin du paquet d’onde. Thomas déplace alors son curseur de souris, à l’intérieur de ce paquet qui pourrait constituer le second morceau, en faisant quelques sauts pour procéder à une écoute rapide. Il s’assure ainsi que le morceau ne comprend rien d’inattendu qu’il ne pourrait pas « voir » autrement.

Le paquet d’onde est en train de devenir un morceau recherché. Thomas revient alors sur ses frontières pour les définir avec plus de précision. Il retrouve le marqueur de début et zoome sur ce début provisoire. Il produit alors une représentation du détail des ondes afin d’y démêler les sons en zoomant à l’intérieur de la zone identifiée. Il tâtonne et teste deux ou trois possibilités plus plausibles en travaillant à une échelle différente de ce qu’il utilisait au moment de la fixation provisoire. Il cible maintenant un point (sample) définit à un 48000ième de seconde

près (taux d’échantillonnage de 48 kHz) sur le fichier audio. L’opération est guidée par l’œil car une écoute au ralenti déformerait trop le son. Les décisions sur le son sont ainsi prises en grande partie de manière visuelle.

127 Comment les opérateurs déterminent le sample le plus approprié pour matérialiser le début du morceau ? L’indexation user guide, dont ils ont toujours un exemplaire à portée de main, insiste sur le fait qu’un bon début de morceau se situe dans la première demi-seconde avant la première note. Cette règle fait explicitement référence à l’industrie musicale et plus particulièrement à l’édition de CD live et à la radio. C’est dans cet intervalle que Thomas et ses collègues doivent arbitrer pour définir le petit bout d’onde sonore sur lequel fixer la balise. À l’échelle de ce sample de 1/48000ème de seconde, la demi-seconde est finalement très vaste31, il

s’y mélange du bruit, les applaudissements du public, des sifflements, des cris, etc. auxquels se superposent les paroles d’un artiste (remerciements ou annonce du nom du morceau jouée et/ou du suivant). Il y a parfois des silences relatifs, distincts du « silence » indexé en tant que rupture du signal. Ce dernier peut se montrer retord, impossible de négocier avec lui du fait de l’absence de matière sonore (tracé plat de l’onde à l’écran) sur laquelle prendre appui, renvoyant l’indexeur à ses extrémités. Les silences relatifs entre les songs, par contre, sont appréciés par les indexeurs car ils permettent d’établir les limites de manière plus fluide ; l’opération est plus rapide lorsqu’ils ne doivent pas s’assurer de l’accord d’un petit bout de son concernant son découpage. Les cas de silences relatifs sont toutefois rares, c’est presque toujours un applaudissement qui articule deux morceaux. Il n’y a donc pas de table rase sur laquelle ils pourraient fixer la balise de manière purement arbitraire. Zoomer devient alors stratégique pour les indexeurs, afin de pouvoir choisir le sample qui accueillera la balise du début du morceau ; la seconde, étirée par le zoom, occupe alors le quart de l’écran 22’. La dimension visuelle de l’activité s’accentue alors que même la temporalité des pièces musicales est appréhendée de manière graphique.

Le bruit (qualifié comme tel relativement au fait qu’il gêne l’action mais qui peut être estimé et que les opérateurs cherchent à mettre à l’écart) est aussi une ressource pour les indexeurs. Ils le traitent comme une zone tampon, une matière martyre dans laquelle ils peuvent tailler sans trop d’état d’âme a priori. Cette zone tampon, qui devait servir de ressource, les oblige à zoomer et à transformer la seconde de bruit en une sous-séquence aux multiples possibilités. Thomas la scrute pour connaître sa composition et en détailler un par un les sons qui pourraient gêner l’entrée en scène de la première note de la pièce qu’il vise. Les opérateurs

Le devenir songs de la collection

128

choisissent, par exemple, d’attendre qu’un cri ou un sifflement s’estompe et disparaisse pour placer le marqueur sous peine, autrement, de donner l’impression auditive de commencer sur quelque chose qui termine. Se rapprocher ainsi au plus près de la première note ne va donc pas de soi. Les indexeurs déploient nombre de ruses, leurs connaissances du logiciel d’édition, leurs oreilles affutées et une maîtrise du corps qui assure une coordination fine entre, l’œil, la main, la souris, le curseur, les représentations graphiques et la vue. S’y mêlent aussi leurs connaissances acoustiques acquises sur le tas concernant le comportement du signal : la vélocité propre de chaque son ou la nécessité d’attendre que le son retombe pour pouvoir l’isoler sans perturber l’écoute. Ce travail d’indexation, en fait, ouvre une nouvelle série d’incertitudes que le découpage en séquences distinctes doit négocier avec le flux sonore et la dynamique du concert. Rien n’est évident ; le son doit être très finement qualifié pour pouvoir décider où poser les marques de balisage.

Alors que le marqueur a pratiquement trouvé sa place définitive après une série de tâtonnements et d’hésitations, Thomas vérifie encore une fois en écoutant ce que ça donne en mimant le départ du morceau comme s’il était dans une playlist. Il refait l’écoute une fois, souvent deux, en actionnant les boutons du lecteur intégré au logiciel d’édition. Parfois, insatisfait, il décale encore un peu le curseur pour sauter un infime passage jugé finalement mauvais. Il recommence l’écoute à la manière du player jusqu’à ce qu’il soit satisfait du résultat ; le morceau a dès lors un début et une fin, tout au moins provisoirement. Ce travail sera repris ultérieurement dans la biographie du fichier, lors d’une étape dite « de contrôle de qualité » consistant à vérifier la qualité esthétique des bornes, en particulier pour s’assurer de ne pas avoir oublié des notes avant le début du morceau, d’avoir laissé suffisamment, mais pas trop, d’applaudissements à la fin du morceau et de ne pas avoir oublié un vrai silence dans le morceau.

129

Le devenir songs de la collection

130

1.1.2.5 Former l’objet, équiper ses frontières : extraction et équipement des songs

Outline

Documents relatifs