• Aucun résultat trouvé

Application du constat Zipf après la lemmatisation

Deuxième Partie : Étude empirique

Chapitre 4 : Statistique quantitative de notre corpus de textes

4.1.2. Application du constat Zipf après la lemmatisation

Après avoir utilisé les dictionnaires des lemmes, l’analyse quantitative de notre corpus de texte nous donne les informations suivantes :

26 À titre exemple, dans une phrase un interviewé emploie le mot « agence » au lieu d’« agence de voyage » et dans la phrase après, il emploie le mot « agence » pour parler d’une « agence réceptive ». Nous verrons également que le mot « voyage » dans l’expression « agence de voyage », peut induire en erreur les logiciels comme IRAMUTEQ. Afin de lever une telle ambiguïté, nous avons commencé notre démarche d’analyse par un travail de lemmatisation et d’harmonisation de nos transcriptions.

Figure 21 : La statistique quantitative de notre corpus de texte (après avoir procédé à sa lemmatisation)

 Notre corpus de texte contient toujours 20 textes. C’est-à-dire nos 20 entretiens semi-directifs.

 Le corpus de texte contient 164664 occurrences. Si on se réfère au nombre d’occurrences sans la lemmatisation (172930), nous constatons que son nombre d’occurrences est diminué : (172930-164664=8266). Ce chiffre ne correspond pas seulement à notre propre opération de lemmatisation. Il s’agit le plus souvent de lemmes composés de plusieurs formes.

o Par exemple, IRAMUTEQ ne considérera plus « là-bas » comme deux formes à part entière mais une seule forme (« là_bas »).

 Son nombre de formes est 4254. C’est-à-dire que les 164664 formes sont elles-mêmes constituées de 4254 formes distinctes.

 Le nombre d’hapax est égal à1500. Ce qui signifie que parmi les 164664 formes employées, il existe 1500 formes qui ne sont mentionnées qu’une seule fois :

1500 ∗ 100

164664 = 0.91%

 Sa moyenne d’occurrences par texte est égale à 8646. Ce qui signifie qu’en moyenne, chaque entretien est constitué de 8233 formes :

164664

20 = 8233

La Figure 22 montre qu’après avoir procédé à la lemmatisation, notre corpus de texte suit toujours bien la constante de Zipf.

Figure 22 : Le graphique Zipf de notre corpus de texte après avoir procédé à sa lemmatisation.

4.2. Nuage de mots

Figure 23 : Nuage de mots de notre corpus de textes

Même si la Figure 23 n’offre pas de réel apport scientifique, nous pouvons facilement distinguer que les formes comme « aller », « client », « agence_de_voyage » « voyage », « internet » et « tour_opérateur » ressortent remarquablement. Dans un deuxième temps, ces sont les formes comme « expertise », « problème », « prix », « hôtel », « agence_réceptive », « destination », « vendre », « produit », « sur_mesure », « passer », …qui sont repérables. Cette image n’est en effet rien d’autre qu’une représentation graphique du tableau de fréquence des formes employées dans notre corpus de texte. Plus la forme est employée, plus sa fréquence sera élevée et naturellement l’outil « Nuage de mots » d’IRAMUTEQ la présentera plus grande.

4.3. Tableau de fréquences des formes

contenu de nos entretiens (Tableau 17 : les formes actives et leur nombre d’occurrences (400 premières formes les plus fréquentes) :

Tableau 17 : les formes actives et leur nombre d’occurrences (400 premières formes les plus fréquentes)

Forme Fréq. Forme Fréq. Forme Fréq. Forme Fréq. Forme Fréq.

Client 2126 produire 210 répondre 113 Monter 81 envie 59 Aller 1559 donner 206 important 113 Brochure 80 développer 58 agence_de_voyage 1439 essayer 203 avion 113 Meilleur 79 choix 58 voyage 959 groupe 202 partie 111 Programme 77 semaine 57 internet 877 assurance 192 spécialiste 109 Fournisseur 77 chambre 57 tour_opérateur 540 demander 188 packagé 109 Distribution 77 avis 57 Prix 389 monde 169 permettre 108 Avenir 77 selectour_afat 56 Voir 370 réseau 167 nouveau 108 Affaire 76 production 56 chose 356 place 163 billet 108 Compliqué 74 marmara 56 hôtel 350 forcément 163 sûr 107 Egalement 73 local 56 intermédiaire 348 circuit 159 niveau 107 Propre 72 informer 56 agence_réceptive 345 information 158 créer 107 Nombre 72 fram 56 vendre 344 année 158 service 106 Contact 71 souhaiter 55 valeur 318 directement 154 prestation 105 Simplement 70 ouvrir 55 trouver 317 partir 151 physique 105 Départ 70 confiance 55 travailler 316 apporter 147 métier 105 conseiller_voyage 69 acteur 55 mettre 310 parler 143 seul 104 Club 69 obliger 54 Etc 309 besoin 142 entreprise 102 Argent 69 différent 54 passer 307 jour 141 chercher 102 Voyager 68 plein 53 penser 303 question 137 changer 101 Hôtelier 68 adapter 53 sur_mesure 295 moment 137 touristique 100 Compte 68 volume 52 Site 289 heure 137 façon 98 Importer 67 ville 52 prendre 282 rester 136 marque 97 Dernier 67 vacance 52 produit 281 plutôt 136 direct 96 Raison 66 mois 52 VRAI 280 offrir 136 rôle 95 Qualité 66 dépendre 52 exemple 274 part 135 revenir 94 Outil 65 économique 51 destination 274 aérien 131 possible 94 Justement 65 vivre 51

expertise 273 compagnie 128 grand 94 en_ligne 65 vendeur 51 connaître 263 pays 127 premier 93 Spécialiser 64 terme 51 acheter 255 réserver 126 fonction 93 Organiser 64 regarder 51 problème 249 effectivement 125 type 92 Activité 64 envoyer 51 rapport 234 france 123 travail 91 Rendre 63 différence 51 vraiment 226 vol 121 français 91 Perdre 63 formation 50 venir 226 marché 120 coup 90 Moyen 62 difficile 50 proposer 224 exister 118 marge 89 Mail 62 budget 50 petit 224 payer 117 tourisme 87 Achat 62 sentir 49 temps 222 appeler 117 devenir 83 Ecouter 61 guide 49 Cas 220 gros 115 côté 83 Prestataire 61 bout 49 Fois 219 cher 114 séjour 82 Partenaire 61 base 49 arriver 212 vente 113 professionnel 82 Gagner 60 nouvelles_frontières 48 complètement 48 commercial 42 jouer 35 Genre 29 principalement 25 aimer 48 étranger 41 énormément 34 Famille 29 oublier 25 utiliser 47 responsable 41 réservation 34 Enfant 29 main 25 simple 47 pari 41 précis 34 Commission 29 lier 25 possibilité 47 marcher 41 amener 34 Evolution 28 laisser 25 nouvelle 47 expliquer 41 évidemment 33 Système 28 individuel 25 correspondre 47 endroit 41 uniquement 33 Social 28 forfait 25 choisir 47 connaissance 41 proposition 33 Siège 28 fermer 25 attendre 47 carte 41 pareil 33 Réponse 28 facilement 25 suite 46 suivre 40 général 33 Personnel 28 décider 25 revendre 46 distributeur 40 capable 33 Notion 28 débrouiller 25 retour 46 création 40 servir 32 Disparaître 28 deuxième 25 occuper 46 assurer 40 remplir 32 Conséquence 28 association 25 exactement 46 transport 39 producteur 32 Communication 28 accepter 25 poser 45 train 39 porte 32 Traiter 27 maximum 24 plongée 45 organisation 39 financier 32 Société 27 expert 24 kuoni 45 nuit 39 beau 32 Informatique 27 début 24 finalement 45 généraliste 39 assuré 32 du_coup 27 coût 24 centrale_de_réservation 45 facile 39 retrouver 31 Date 27 bureau 24

Vie 44 entendre 39 conseiller 31 Créateur 27 accès 24 technologie 44 accord 39 appel 31 Contacter 27 âge 23 coûter 44 thématique 38 tellement 30 Concurrence 27 voiture 23 comprendre 44 renseigner 38 spécifique 30 Clairement 27 travers 23 chiffre 44 relation 38 richou_voyages 30 Baisser 27 tenir 23 évoluer 43 phénomène 38 près 30 Aspect 27 taille 23 téléphone 43 jeune 38 package 30 Tui 26 régulièrement 23 sortir 43 impliquer 38 look_voyages 30 pure_player 26 responsabilité 23 recherche 43 considérer 38 gérer 30 Numéro 26 rassurer 23 modèle 43 chaîne 38 final 30 Impression 26 présent 23 intéressant 43 arrivée 38 ensemble 30 Généralement 26 obligation 23 intégrer 43 squeezer 37 désintermédiation 30 Forme 26 marchand 23 idée 43 préférer 37 dossier 30 Fin 26 limite 23 concurrent 43 là_dessus 37 cadre 30 Fidèle 26 interlocuteur 23 commencer 43 low_cost 37 aéroport 30 Extrêmement 26 indépendant 23 éventuellement 42 entier 37 état 29 Croisière 26 humain 23 quasiment 42 rentrer 36 spécialisation 29 Chance 26 garder 23 projet 42 frais 36 secteur 29 Attente 26 crise 23 manière 42 fonctionner 36 particulier 29 Visiter 25 comparer 23 innovation 42 autocar 36 nom 29 Tendance 25 allemand 23 continuer 42 recevoir 35 minute 29 Solution 25 équipe 22

Il n’est jamais évident de s’exprimer à partir d’un tableau ne contenant qu’une mesure quantitative de corpus de texte. Surtout quand il s’agit de mettre en relation plusieurs milliers de formes. En effet, ces données ne nous procurent pas d’autres renseignements que les fréquences des formes employées. En conséquence, l’interprétation à partir d’un tel tableau de données est loin d’apporter une conclusion définitive. À vrai dire, nous pouvons comparer le tableau d’occurrences des formes avec un dessin que son auteur vient juste de commencer à réaliser. Nous pouvons peut-être deviner ce qu’il va dessiner, sans en être jamais sûrs. Comme ce dessin non achevé, nous pouvons également essayer de lire quelques renseignements à partir du Tableau 17 :

« Internet » aussi haut nous donne cette impression que les interviewés lui accordent beaucoup d’importance. Ce qui est tout à fait compréhensible vu l’impact révolutionnaire qu’il a sur le marché touristique.

En ce qui concerne le terme « tour-opérateur », nous constatons que ses occurrences sont trois fois moins élevées que celles d’ « agence de voyage », alors que nous avons interrogé un nombre équivalent (10 chacun) de ces deux types d’intermédiaires. Ce fait s’explique par deux constats que nous avons faits durant nos entretiens : tout d’abord, certains tour-opérateurs, de temps en temps, parlent d’eux-mêmes en utilisant le mot « agence de voyage ». C’est surtout vrai pour les tour-opérateurs pure-player et les tour-opérateurs spécialistes ; d’autre part, l’autre raison de cet écart entre les deux formes « agence_de_voyage » et « tour-opérateur » est liée au fait que les tour-opérateurs parlent plus des agences de voyage que l’inverse.

Nous pouvons également constater que les intermédiaires interrogés parlent beaucoup du « prix » (389 occurrences). Après cette forme, et toujours par ordre d’occurrence, les formes suivantes figurent parmi les 100 premières formes les plus fréquentes : « agence_réceptive », « valeur », « expertise », « problème », « sur_mesure », « connaître », « assurance », « information », « directement », « cher », « spécialiste », « packagé », « service », « marque », « direct » et « marge ».

Comme l’« expertise », l’« assurance » et le « problème » (sous-entendu « le souci ») arrivent nettement en tête de cette liste, nous pouvons peut-être en déduire que nos interviewés estiment que leur valeur ajoutée provient de leurs fonctions d’expertise et assurantielle. Si nous relisons nos entretiens, nous pouvons constater que c’est effectivement le cas pour la majorité d’entre eux.

D’autre part, nous pouvons nous interroger sur la fréquence élevée de la forme « agence_réceptive ». Pouvons-nous déduire que l’agence de voyage tente de contourner le tour-opérateur en achetant directement les différentes prestations touristiques chez l’agence réceptive ? Ou peut-être, comme le monde académique le dit souvent, est-ce parce qu’Internet permet au client d’acheter directement les prestations touristiques auprès de l’agence réceptive ? Encore une fois, en explorant notre corpus de textes, nous pouvons soutenir la première hypothèse ; c’est-à-dire que comme le tour-opérateur vend directement ses offres touristiques sur Internet, l’agence de voyage est contrainte de devenir un fabriquant de voyage. Et effectivement, toutes les agences de voyage que nous avons interrogées, à l’exception d’une, font en quelques sortes le même travail qu’un tour-opérateur. C’est-à-dire qu’elles se donnent la possibilité de passer directement par les agences réceptives, pour créer des voyages sur mesure pour leurs clients.

a) « agence_réceptive », un premier contre-exemple dans le tableau de fréquence de formes

Revenons maintenant à la deuxième hypothèse, c’est-à-dire l’achat direct du touriste auprès des prestataires touristiques et surtout des agences réceptives locales. En effet, les intermédiaires

interrogés reconnaissent que le touriste peut acheter directement sur Internet les voyages simples. Mais pour ce qui est d’un voyage sortant de l’ordinaire, le client a besoin d’être rassuré par l’expertise de l’intermédiaire. C’est alors que nos interviewés jugent rare et risqué pour le client de passer directement par l’agence réceptive locale :

« Pour moi le client, il n’enverra jamais l’argent un mois ou deux mois avant son départ à l’autre bout du monde. Ou s’il le fait c’est qu’il a déjà des contacts et des gens sérieux. Mais il aura toujours les doutes de se dire « ce que mon argent va bien là-bas, est-ce que j’aurai bien quand j’arriverai là-bas mon circuit, mon séjour ? etc. »

« … quand le client peut acheter directement auprès d’une agence_réceptive, effectivement, là, il ne sait pas ce qu’il y a derrière, il n’y a rien, il n’a pas de certitude. Donc, le risque est à 50-50, tout dépend de ce que le client achète. Si le client achète un voyage itinérant qui le confie à une agence_réceptive qui n’est pas immatriculée dans son pays d’origine, et s’il y a un recours, ça sera un recours devant les tribunaux du pays de destination. Là, il y a un vrai risque et l’assurance de l’intermédiaire est très importante… Mais si c’est juste une chambre d’hôtel ou juste un billet d’avion, dans ce cas, pour moi, il n’y pas de la valeur ajoutée de la part de l’agence_de_voyage sur l’aspect assurance. »

b) « prix » un autre contre-exemple dans le tableau de fréquence de formes

Revenons maintenant au mot « prix », qui ressort avec une fréquence très élevée. Son score est même plus élevé que des formes comme « assurance » ou «expertise ». À en croire son rang et comme c’était le cas pour ces deux dernières formes, nous pouvons peut-être déduire que les intermédiaires interrogés misent beaucoup sur leur fonction économique. Mais notre jugement s’avère faux, puisque la plupart de nos interviewés pensent autrement. C’est-à-dire qu’aucun d’entre eux ne pense qu’avec le prix ils peuvent faire la différence. Même si certains déclarent que les prix sur Internet ne sont pas forcément plus avantageux que les leurs, ils ne comptent pas entrer dans la guerre des prix pour assurer leur avenir :

« On ne peut même pas dire que la valeur ajoutée d’un intermédiaire est le prix puisque finalement il n’y a pas tant de différences que ça ».

« … dans la coexistence de l'écoute et de la vente, on sera obligé de se battre sur le prix et ça, ça amène au cimetière. »

« notre valeur ajoutée n’est absolument pas là »

« On est sorti de la logique industrielle en fait, de petit prix pour vendre, essayer de rogner aux maximum … »

Encore une fois, la limite d’une telle approche quantitative de texte est avérée. C’est la preuve que seul, tableau d’occurrences de formes est loin d’être un élément de renseignement suffisant.

Pour pouvoir exploiter ce genre de données, il s’avère nécessaire d’explorer manuellement le corpus de texte en examinant les paroles des interviewés. Dans ce cas, on revient aux mêmes problématiques qui sont :

1. Une telle analyse quantitative de corpus de texte ne facilitera pas vraiment le travail du chercheur. Il lui faut toujours l’exploration manuelle de ses textes.

2. L’influence du chercheur restera toujours un sujet de discussion. C’est lui qui cherche et c’est lui qui déduit. Surtout dans notre cas où nous avons besoin d’être appuyés par un outil pour confirmer notre travail théorique.

4.4. Conclusion de la section

Les outils d’analyse quantitative d’IRAMUTEQ nous offrent un premier aperçu de nos entretiens sans pour autant pouvoir en tirer une conclusion précise.

Grâce au graphique Zipf (Figure 20) nous avons pu mesurer la richesse du vocabulaire de nos entretiens et celui-ci nous a permis de démontrer que nos transcriptions suivent très bien le constat de Zipf.

Le tableau de fréquences des formes (Tableau 17) est une autre mesure quantitative qui nous permet de visualiser les formes actives les plus fréquemment employées dans nos entretiens. Celui-ci nous a montré notamment que les formes « client », « agence_de_voyage », « voyage », « tour_opérateur », « prix », « hôtel » et « agence_réceptive » arrivent en tête du classement du tableau de fréquences de formes. Les exemples des formes « prix » et « agence_réceptive » nous ont démontré qu’on ne peut en aucun cas tirer une conclusion définitive d’une analyse quantitative et du tableau de fréquences des formes en particulier. En effet, ce n’est pas pour les mesures purement quantitatives que nous faisons appel à un logiciel comme IRAMUTEQ. IRAMUTEQ nous offre des outils très précieux qui vont au-delà d’un simple décompte de formes dans le texte. C’est pourquoi, nous nous n’attardons pas sur l’analyse des résultats de nos mesures quantitatives pour discuter davantage les analyses statistiques auxquelles nous avons fait appel pour étudier nos entretiens.

Chapitre 5 : Propositions de valeur des intermédiaires