• Aucun résultat trouvé

Nous présentons ici les différents axes de recherche que nous avons suivis dans le but d’améliorer la

qualité perçue de la parole restituée par le GSM. Les dégradations de la parole envisagées sont toutes

liées aux erreurs de transmission.

Malgré la diversité de leur point de vue, deux aspects fédèrent les méthodes présentées. Le premier aspect est d’ordre pratique, ces méthodes s’appliquent toutes en réception, sans nécessiter de

modifications des codeurs parole et canal du GSM. Le deuxième aspect correspond à l’idée d’exploiter

un modèle a priori de la source (parole) pour réduire l’impact qualitatif des dégradations entraînées par les erreurs de transmission.

1.4.1 Post-traitement du signal de parole en sortie du décodeur

Notre première approche était d’effectuer un post-traitement du signal de parole en sortie de la chaîne de réception du GSM. Un exemple de post-traitement appliqué au contexte du GSM est le post-filtrage proposé par [Sereno, 1991]. Celui-ci était destiné à masquer l’effet des erreurs introduites sur les bits codant l’excitation (Classe 2) et qui peut être assimilé à du bruit de quantification. Cependant, ce post-filtre était activé conditionnellement à une mesure d’erreur estimée par le décodeur canal.

Ceci illustre bien le principal problème du post-traitement appliqué aux dégradations introduites par les erreurs de transmission. En effet, ces dégradations sont non-stationnaires et non-linéaires, il est donc très difficile de les estimer à partir du signal reçu. En particulier, les estimateurs linéaires classiquement utilisés pour le rehaussement de la parole [Beaugeant, 1999] ne peuvent être appliqués. Dans ce contexte, on ne peut effectuer de post-traitement du signal de parole que si l’on dispose d’un modèle a priori du défaut à traiter ou d’un modèle a priori du signal de parole à reconstruire. De plus, les « traitements » appliqués au signal ne peuvent être, dans le cas général, de simples opérations de filtrage linéaire. Les techniques à envisager relèvent du masquage ou du schéma plus général15 d’analyse - modification - synthèse [Laroche, 1995].

Nous abordons un premier aspect du post-traitement au Chapitre 2, en étudiant la détection d’artefacts sur le signal en sortie de décodeur parole. Cependant, il est progressivement apparu que l’intérêt des post-traitements pour les dégradations associées aux erreurs de transmission se limitaient à celles dues aux erreurs binaires dans les Classes 1b et 2 (cf. paragraphe 1.3.2.3). Ces dégradations ne nous paraissent pas être les plus déterminantes pour la qualité de la parole GSM transmise en présence

15 Les techniques fréquentielles d’analyse-modification–synthèse du signal pourraient être utilisées pour le

Classe 1a (ou à la procédure de masquage enclenchée par le décodeur).

Ceci nous a conduit à envisager d’autres approches, situées au niveau des décodeurs parole et canal du GSM EFR.

1.4.2 Décodage parole à entrées souples

Si l’on vise une amélioration significative de la qualité de la parole restituée par le GSM en présence d’erreurs de transmission, il convient de minimiser la distorsion entraînée par le décodage des erreurs binaires résiduelles. Une idée, déjà esquissée par la technique du masquage, est d’utiliser pour ce faire la redondance résiduelle laissée par le codeur parole. Cette approche se rattache aux développements récents [Duhamel et al., 1997] sur le codage et décodage conjoint source-canal. Elle part du constat que le schéma idéal (Figure 1.5) justifiant la séparation du codage/décodage source et canal n’est jamais atteint dans la pratique et qu’il vaut mieux dès lors faire interagir ces 2 étapes plutôt que de les idéaliser.

Le principe du décodage parole à entrées souples est illustré Figure 1.9. La sortie binaire du décodeur canal est ici complétée par une information de fiabilité (ou probabilités d’erreur associées aux bits ). Le couple

(

forme la « sortie souple » du décodeur canal (resp. « entrée souple » du décodeur parole). Cette information souple issue du canal est utilisée conjointement au niveau du décodeur de parole avec une information a priori sur les paramètres du codeur de parole. Ceci permet

l’estimation optimale du paramètre transmis [Hedelin et al., 1995], c'est-à-dire la valeur minimisant le

critère utilisé pour mesurer la distorsion.

ˆb e p ˆb ˆ,b pe

)

Décodeur source Décodeur canal ˆb Canal Equivalent A priori e p

Figure 1.9 : Principe du décodage source à entrées souples

Une telle approche sera développée dans les chapitres 4 et 5 pour le GSM EFR. Notre principale contribution sera d’élaborer un modèle a priori des paramètres permettant de réduire la complexité de l’estimation et offrant une caractérisation plus fine de la redondance résiduelle.

1.4.3 Décodage Canal Contrôlé par la Source (SCCD)

Dans le schéma de la Figure 1.9, la sortie du décodeur canal est vue comme celle d’un canal équivalent donné et la redondance résiduelle laissée par le codeur parole sert à compenser les erreurs résiduelles observées en sortie de ce canal. En prolongeant l’idée d’exploiter la redondance résiduelle du codeur parole pour compenser les imperfections du décodeur canal, il paraît intéressant d’utiliser cette redondance résiduelle de « source » conjointement avec la redondance « systématique » introduite par le codeur canal. C’est l’idée à la base du décodage canal contrôlé par la source [Hagenauer, 1995] dont le schéma de principe est illustré Figure 1.10. Le canal équivalent correspond ici au récepteur interne de la Figure 1.3 et les probabilités d’erreur associées aux sorties binaires y ne sont autres que les probabilités de transition de ce canal, estimées par le récepteur interne (cf. Annexe C).

e p Décodeur source Décodeur canal Égaliseur e p Canal Equivalent A priori y

Figure 1.10 : Principe du décodage canal contrôlé par la source

L’information a priori issue de la redondance résiduelle est alors exploitée au niveau du décodeur canal. L’objectif étant ici de minimiser le taux d’erreurs résiduelles en sortie du décodeur canal plutôt que de minimiser un critère de distorsion sur les paramètres « corrompus » reçus par le décodeur parole. Nous avons jugé intéressant d’étudier l’application de ce principe au GSM EFR, dans le but d’identifier lequel de ces deux points de vue sur l’utilisation de la redondance résiduelle était le plus judicieux et si ils pouvaient éventuellement être complémentaires. Nous nous attacherons à la fois à améliorer l’exploitation de la redondance résiduelle par les algorithmes de SCCD et à les adapter aux contraintes pratiques du codage canal mis en œuvre pour les communications radio-mobiles. Ces développements sont présentés au Chapitre 7.

Pour conclure, on notera qu’on s’est restreint ici aux méthodes situées en réception puisque l’une de nos contraintes était de ne pas modifier la partie codage du système GSM. Cependant de nombreuses voies de recherches s’offrent à ce niveau pour rendre les paramètres transmis par le codeur parole plus robustes aux erreurs de transmission [Duhamel et al., 1997]. On citera notamment les techniques d’optimisation de l’étiquetage des centroïdes du dictionnaire de quantification (Index Assignement ). L’objectif visé par ces techniques étant de minimiser la distorsion induite dans l’espace des centroïdes16 par une erreur de transmission sur l’index du centroïde.