• Aucun résultat trouvé

Annexe V. Code de procédure de l’International Association for Forensic Phonetics (IAFP)

II. L A VOIX COMME INDICE MATERIEL

2.3. Collecte de l’indice matériel

2.3.8. Influence du locuteur

Dans le domaine commercial, l’utilisation d’un système de contrôle d’accès est régulière et fréquente, la langue utilisée est déterminée et le locuteur désire être reconnu. Il coopère, d’une part en contrôlant son énoncé de manière à diminuer la variabilité intralocuteur et d’autre part en s’exprimant dans la langue demandée.

Dans le domaine forensique par contre, le locuteur n’est pas forcément coopératif et la langue parlée dépend uniquement des connaissances de chacun des interlocuteurs. D’autre part, l’intervalle de temps entre l’enregistrement de l’échantillon de parole inconnue et l’enregistrement de comparaison peut être long, de plusieurs mois à plusieurs années, selon les résultats de l’enquête et l’échéance de la prescription de l’infraction poursuivie [HOLLIEN, 1995].

2.3.8.1. Enregistrement dans le cadre d’un abus de téléphone

Dans ce premier cas, la voix peut être modifiée de façon involontaire, par les conditions psychologiques particulières de stress et de peur que peut engendrer le fait de commettre une telle infraction. La consommation de substances psychotropes et de tabac, ainsi que l’état de santé du locuteur, ont aussi une influence sur sa voix [HOLLIEN, 1990 ; BRAUN, 1994 ; HOLLIEN ET MARTIN, 1996]. Le locuteur peut aussi procéder à une modification volontaire du fonctionnement de l’un des organes participant à la production de la parole [HOLLIEN ET AL. ; 1982 ; GFROERER, 1994 IN :

MASTHOFF, 1996]. LOCARD propose « l’introduction de tampons de coton enveloppant le gros bout

d’une plume de coq dans les narines » ou « l’utilisation d’un dispositif de filtrage mécanique comme le mouchoir sur le combiné du téléphone » comme moyens de déguisement. Il est aussi possible de recourir à des dispositifs plus modernes de filtrage et de brouillage, analogiques ou numériques [LOCARD, 1932 ; MASTHOFF, 1996].

Les modifications qu’un locuteur peut apporter à un énoncé dans un but de déguisement peuvent porter sur la voix : respiration, registre, mode de phonation ; sur la parole : articulation, intonation, accent, vitesse d’élocution, stress, modification du tractus vocal par un corps étranger ou encore sur le contenu : jargon, dialecte étranger [GFROERER, 1994 IN : MASTHOFF, 1996 ; KÜNZEL, 1994A]. Certaines caractéristiques sont cependant plus difficiles à modifier que d’autres comme le montre le tableau récapitulatif d’une étude concernant les stratégies de déguisement présentée par

PARTIE I : APPROCHE THEORIQUE CHAPITRE II : LA VOIX COMME INDICE MATERIEL 25

Facile à modifier

Difficile à modifier Caractéristiques générales

Sens : choix des mots

construction de la phrase Style du langage Dynamique de la parole Caractéristiques individuelles Articulation Accentuation: mélodique dynamique Régularité du débit Vitesse d'élocution Tonalité Intensité Timbre Rythme Plénitude

Figure II.6. Comparaison de la difficulté de modification de différentes caractéristiques de l’élocution [FÄHRMANN, 1966A]

Lorsque la stratégie de déguisement est laissée au libre choix du locuteur, on voit que, si la modification porte sur un seul paramètre, il s’agit d’un paramètre de la voix dans 30 % des cas et si elle porte sur plusieurs paramètres, la proportion qu’un paramètre de la voix soit modifié s’élève à 60 %. Dans 42 % des cas un ou plusieurs paramètres de la parole sont modifiés, mais le contenu n’est affecté que dans 22 % des cas. Dans 10 % des cas, des moyens de filtrage électroniques complètent les modifications intrinsèques [GFROERER, 1994 IN : MASTHOFF, 1996].

0% 10% 20% 30% 40% 50% 60%

Voix et parole Voix et contenu Parole et contenu

Deux moyens de déguisement Phonation

Articulation Contenu

Un moyen de déguisement

MASTHOFF confirme ces résultats ; il montre que lorsque le contenu est court, une seule

phrase, le locuteur opte pour la modification d’un seul paramètre dans 55 % des cas. Le mode de phonation, paramètre lié à la voix, est modifié dans 30 % des cas et l’articulation, paramètre lié à la parole, dans 25 % des cas ; le contenu n’est jamais modifié seul. Dans 45 % des cas, deux déguisements sont utilisés, répartis en trois groupes de 15 % : phonation et articulation, phonation et contenu et articulation et contenu [MASTHOFF, 1996] (Figures II.6. et II.7., tableau II.2).

Moyen de déguisement % Particularités

Détails de la modification de la phonation

Murmure 38

Fréquence fondamentale rehaussée 31 Tous des hommes

Fréquence fondamentale abaissée 23 Toutes des femmes

Inspiration 8 Intelligible

Détails de la modification de l’articulation

Imitation d’un dialecte 20

Imitation d’un accent étranger 10

Modification du tractus vocal 40

Immobilisation de la langue 20

Simulation d’une pathologie 10

Détails de la modification du contenu

Intonation non grammaticale 50 Modification du niveau d’intonation

Pauses non grammaticales 33 Pas de pauses ou pauses longues

Durées non grammaticales 17 Durée extrême des voyelles

Tableau II.2. Détails des moyens de déguisement [MASTHOFF, 1996]

Le résultat d’une étude de MCCLELLAND montre par contre que, lorsque le texte est long, le déguisement du contenu est la forme de déguisement préférée par les locuteurs. Malgré une liberté de choix totale, les locuteurs exploitent une douzaine de moyens de déguisement qu’ils combinent dans un peu moins de la moitié des cas, pour élaborer leur stratégie [MCCLELLAND, 1994 IN :

MASTHOFF, 1996].

Selon [KÜNZEL, 1994A], il est clairement possible de déterminer qu’il y a déguisement dans environ 15 % des cas traités par le Bundeskriminalamt de Wiesbaden (BKA). REICH ET DUKE

montrent qu’à partir d’un enregistrement, 89 % des auditeurs inexperts et 93 % des auditeurs experts détectent un déguisement librement choisi par des locuteurs 11 [REICH ET DUKE, 1979].

Ceux-ci admettent toutefois que les instructions données permettent aux locuteurs de choisir des réalisations extrêmes qui ne sont pas naturelles.

PARTIE I : APPROCHE THEORIQUE CHAPITRE II : LA VOIX COMME INDICE MATERIEL 27

Pourtant, « tout déguisement n’implique pas comme résultat une élocution en dehors des variations produites par la population ‘normale’. Le locuteur a un grand nombre de moyens d’altérer son élocution sans pour autant imiter consciemment un autre locuteur ou outrepasser les limites de la variation ‘normale’ de la population... Dès lors, aucune base ne laisse à penser, a

priori, que les auditeurs sont capables d’évaluer de façon fiable, si l’élocution d’un locuteur est

habituelle ou non pour un énoncé donné, mais, à un certain degré, chacune de ces modifications

est susceptible de gêner l’identification de locuteurs » [NOLAN, 1983].

2.3.8.2. Enregistrement dans le cadre d’une mesure de surveillance

Dans ce second cas, l’ignorance d'être enregistré dans laquelle se trouve le locuteur n’induira vraisemblablement pas les modifications volontaires ou involontaires de la voix décrites supra. Par contre, la spontanéité qui découle de cette ignorance laisse au locuteur une substantielle faculté d’adaptation de son discours au contexte, à son humeur et aux différentes relations interpersonnelles qu’il entretient avec son interlocuteur [NOLAN, 1983 ; BROEDERS, 1995].

Dans un contexte formel, le locuteur tend à modifier les variables sociolinguistiques de son discours dans le sens de celles de personnes d’un statut supérieur [LABOV, 1972]. Un autre aspect du contexte est la notion sociologique d’étiquetage, qui dépend des rôles définis dans l’échange et de l’interprétation par le locuteur de son statut relatif dans cette interaction ; cet étiquetage va amener le locuteur à rapprocher ou à éloigner la forme de son discours de celle de son interlocuteur [GILES ET AL.,1979]. Une large variété d’informations peut aussi être introduite par le locuteur dans le discours, dans le but de présenter une personnalité correspondant à l’image qu’il veut montrer de lui-même [ARGYLE, 1976].

Ces informations sociolinguistiques ne sont pas invariantes, mais dépendent de l’interprétation que fait le locuteur des aspects sociaux de l’interaction [BROWN ET LEVINSON, 1979]. Le caractère formel des rapports que le citoyen peut entretenir avec l’autorité policière ou judiciaire, les rôles définis intrinsèquement liés à ces relations et l’image de soi-même qui peut vouloir être présentée dans de telles circonstances, permettent d’estimer l’étendue des différences entre une conversation se déroulant dans le cadre d’un interrogatoire ou d’une séance d’enregistrement de comparaison et une conversation téléphonique privée.

2.4. Conclusion

La plupart des éléments qui influencent négativement la qualité finale de l’indice matériel enregistré, comme la réponse en fréquence du transducteur ou l’état psychologique du locuteur, ne peuvent être améliorés dans le cadre de la procédure de collecte de cet indice. L’effort doit donc être concentré autour du seul élément sur lequel il est possible d’influer, le système d’enregistrement. Or, comme le relevait déjà BOLT en 1979, c’est malheureusement souvent le

maillon le plus faible [BOLT, 1979]. Les forces de police de Suisse sont encore largement équipées de matériel d’enregistrement analogique obsolète, mais le moment est judicieux pour un passage à une stratégie d’enregistrement numérique, avec comme base des standards de qualité et des protocoles d’acquisition communs dans tout le pays.

L’avènement de l’ère de la transmission numérique de l’information sur les réseaux de télécommunication offre par contre la possibilité pour l’utilisateur final de recourir au cryptage de l’information transmise avec des algorithmes de cryptage puissants (strong encryption), inviolables par la seule puissance de calcul des ordinateurs actuels en un temps raisonnable. L’encryptage puissant des données informatiques est possible avec des algorithmes de cryptage de type Data

Encryption System (DES) dont certains, comme Pretty Good Privacy (PGP), sont disponibles

gratuitement sur le réseau Internet. Le cryptage des données audio est encore réservé à une certaine catégorie d’utilisateurs, mais des solutions commerciales, comme le concept de Total

Information Security© développé par l’entreprise suisse Crypto AG, offrent des possibilités

d’encryptage puissant non seulement aux armées, à la diplomatie et aux polices, mais aussi aux entreprises et aux personnes privées, pour leurs communications vocales et informatiques sur les différents réseaux téléphoniques, RTPC, RNIS, GSM et satellitaires.

Ce type de technologie est considéré comme sensible dans certains pays, dont la France et les Etats-Unis, et sa mise à disposition de tout utilisateur sans contrôle risquerait à moyen terme de rendre inopérante toute mesure officielle de surveillance des télécommunications. Dans un exposé intitulé « Impact of Encryption on Law Enforcement and Public Safety », présenté le 25 juillet 1996 devant la commission sur le commerce, les sciences et le transport du Sénat des États-Unis, le directeur du Federal Bureau of Investigation (FBI) constate que la dissémination sans contrôle de ce type de technologie d’encryptage peut être préjudiciable au travail des autorités chargées de l’application des lois et représenter à terme un risque majeur pour la sécurité publique [FREEH,

1996].

Des pays comme la France ont pris des mesures pour limiter l’utilisation de ce type d’algorithmes, par l’intermédiaire d’autorités de surveillance ; en Suisse par contre, ce type de problème semble absent du débat politique et des préoccupations des autorités chargées de faire respecter les lois.

III. METHODOLOGIE

3.1. Introduction

Le développement d’une méthode de reconnaissance automatique de locuteurs en vue d’une utilisation forensique implique des choix méthodologiques guidés par les exigences légales en matière de preuve scientifique, une connaissance des différentes méthodes de reconnaissance de locuteurs et des moyens de les évaluer. Il nécessite aussi l’adoption d’un processus d’inférence de l’identité du locuteur qui respecte à la fois la logique, l’approche scientifique et le rôle de l’expert dans le cadre du procès pénal.