• Aucun résultat trouvé

4 Théorie de l'imitation vocale

4.5 Imitation directe (non-médiée) et indirecte (médiée)

La convergence en général et vocale en particulier peuvent aussi être directes ou indirectes. Par « directe », nous entendons un acte qui a lieu en présentiel, c’est-à-dire en face à face, sans aucun intermédiaire. Par opposition, l’accommodation indirecte se déroule au travers d’un média. Le téléphone, les applications de visioconférence, la radio, la télévision, etc. en sont quelques exemples. Ainsi, les études sur la convergence en général portent en majorité sur des situations directes parce que les liens sont plus faciles à établir que dans les situations indirectes. Les difficultés liées à l’étude de la convergence indirecte résident dans le fait que celle-ci est différée, ses conséquences ne sont donc pas mesurables « à chaud ». Nous situant dans le cadre de l’imitation à travers les médias, et en particulier la télévision, il nous semble important de mentionner une étude qui avait relevé il y a cinquante ans, l’impact de la télévision sur le comportement. Dans leur étude, Bandura, Ross & Ross (1963) ont mis en place une situation expérimentale (pré-test, test, post-test) en vue d’examiner le comportement des enfants qui s’exposent aux actes violents et agressifs dans la vie réelle et à travers les films et dessins animés. Ces auteurs ont ainsi apporté les premières preuves de l’imitation à travers la télévision et ont conclu en ces termes :

Filmed aggression, not only facilitated the expression of aggression, but also effectively shaped the form of the subjects’ aggressive behavior. The finding that children modeled their behavior to some extent after the film characters suggest that pictorial mass media particularly television, may serve as an important source of social behavior (p.9).

Ils ont également trouvé que l’imitation de comportement était plus importante suite à l’exposition télévisuelle que dans les autres conditions :

In fact, a possible generalization of responses originally learned in the television situation to the experimental film may account for the significantly greater amount of aggressive gun play displayed by subjects in the film condition as compared to subjects in the other conditions (ibid.).

Si les études sur l’imitation vocale directe sont très nombreuses dans la littérature (Trudgill, 1986 ; Kuhl et al., 2008 ; Pepperberg & Wilkes, 2004 ; Pickering & Garrod, 2004 ; Chambers, 1998 ; Kail, 2015), la convergence phonético-phonologique indirecte est rarement mise en évidence. Il a été longtemps supposé que l’imitation vocale, plus précisément l’imitation d’accents, n’est possible qu’au travers d’interactions directes (présence physique d’interlocuteurs), mais comme nous

119

l’avons montré au sein du chapitre I, l’accommodation vocale indirecte est elle aussi attestée. D’une part, sur l’impossibilité de l’imitation vocale médiée, nous pouvons par exemple citer les travaux de Kail (2015) : « […] si le vocabulaire peut être acquis par exposition à des programmes télévisuels, en revanche, les aspects plus complexes du langage comme la phonétique ou la grammaire ne peuvent pas l’être. » (p. 43). Kuhl et al. (2008), confirment cette hypothèse : « Intriguingly, recent work testing infants’ perception of a foreign-language phonological contrast

suggests that live interaction with a speaker of the language gives rise to learning where equivalent exposure via video fails to ». (p. 979) Dans une autre étude plus récente, Kuhl (2010) montre

l’importance de l'interaction sociale dans l'apprentissage-acquisition des langues étrangères. Elle étudie deux groupes de nourrissons de neuf mois : l’un a suivi 12 séances de chinois mandarin au travers d’interactions naturelles (présentielles donc) avec un locuteur chinois, et l’autre groupe a reçu les mêmes informations linguistiques pendant les mêmes durées, mais transmises par les médias. Les résultats ont montré que le groupe en interaction physique a acquis des éléments linguistiques, contrairement au groupe audiovisuel. Elle rappelle que : « […]referential information

is present in both the live and televised conditions, but it is more difficult to pick up via television, and is totally absent during audio-only presentations. Gaze following is a significant predictor of receptive vocabulary » (Kuhl, 2010, p. 720). Ces résultats sont fort intéressants, mais il nous semble que les

enfants (surtout de cet âge) imitent mieux en présentiel, car ils ont besoin de suivre les mouvements des adultes pour comprendre108

. Aussi, les informations présentées dans les vidéos engendrent probablement de la surcharge cognitive109

, puisqu’il y a beaucoup d’animations (Chanquoy, Tricot & Sweller, 2007 ; Amadieu & Tricot, 2006). Ils seraient donc incapables de sélectionner des informations parmi toutes celles présentées (souvent simultanément) à la télévision. Les adultes parviennent à effectuer des tris d’informations selon leurs besoins.

108 C’est pourquoi ils regardent souvent la main plutôt que l’objet qui est pointé.

109 Leur cerveau n’est pas encore entraîné à gérer plusieurs informations (animations) à la fois et leurs mouvements moteurs sont encore très lents.

120

Figure 11 : conditions expérimentales de l’étude de Kuhl : à gauche l’exposition interactive directe, à droite l’exposition indirecte110 (Kuhl, 2010, p. 720).

Plusieurs études récentes ont montré le contraire des observations faites par les recherches que nous venons de mentionner : l'interaction directe n'est pas la seule condition de l’acquisition du langage. Nous renvoyons le lecteur au chapitre 1 au sein duquel plusieurs recherches ont montré les influences des médias sur la prononciation, notamment celles de Stuart-Smith et al., 2007, 2011, 2013 ; Stuart-Smith et Ota (2014) ; Ota et Takano (2014) ; Sanchez, Miller & Rosenblum (2010), pour n’en citer que quelques-unes.

Si l’imitation phonétique audio-visuelle est prouvée dans les conditions expérimentales, pour des unités de sons plus petites, il serait intéressant de mener des recherches en conditions non- expérimentales, c’est-à-dire en l’absence de stimuli. Nous pouvons imaginer les mêmes processus dans le cadre de l’apprentissage informel de l’anglais en ligne (Sockett, 2014 ; Toffoli & Sockett, 2015), où un apprenant, après le visionnage d’une série, imite un accent particulier lorsqu'il interagira avec un locuteur anglophone. Par conséquent, un auditeur peut imiter phonétiquement et phonologiquement après un temps d'exposition aux médias, car l’imitation vocale est un « phenomenon that could be facilitated by audio-visual congruence » (Nguyen & Delvaux, 2015 : 47). Dans la section suivante, nous allons nous intéresser à quelques théories/modèles de l’acquisition phonétique et phonologique qui expliquent comment l’apprenant acquiert les sons d’une L2. Parmi les modèles existants, nous en présenterons quatre, qui, à nos yeux, sont les plus connus et les plus représentatifs.

110 Remarquons la luminosité de la pièce et celle de l’écran, la taille de l’écran et la distance entre l’écran et les yeux de l’enfant.

121