• Aucun résultat trouvé

Transcription de nos entretiens semi-directifs

Deuxième Partie : Étude empirique

ALCESTE SPAD-T IRAMUTEQ Production manuelle de lexique Non Oui Oui

3.5. Analyse de données textuelles, quel texte ?

3.6.1. Transcription de nos entretiens semi-directifs

La première étape dans le traitement des réponses ouvertes à l’aide d’un logiciel d’analyse statistique est d’effectuer la transcription de chacun de nos entretiens. Pour réaliser cela, nous nous somme imposé les exigences suivantes :

 Nous avons choisi d’effectuer manuellement cette étape afin d’éviter toute erreur de transcription. Les outils de transcription automatisés font apparaître de nombreuses erreurs qu’on ne pourrait se permettre pour l’analyse de données comme les nôtres.

 Ayant eu l’exigence d’avoir des corpus de texte qui correspondent intégralement aux propos tenus par nos interviewés, nous avons effectué nous-mêmes leur transcription sans passer par un tiers ; ce qui a, par ailleurs, deux avantages non négligeables en ce qui concerne la nécessité de rester fidèle dans les transcriptions :

o Nous connaissons les contextes dans lesquels les transcriptions ont été effectuées. Donc nous sommes dans une position idéale pour apporter une modification, si nécessaire, sans compromettre la fidélité au sens des propos tenus.

o À notre avis, au-delà de la culture générale requise pour les transcriptions de nos entretiens, elles nécessitent une bonne culture dans le domaine. Les noms propres, les vocabulaires et les expressions utilisés dans les entretiens, ne nous permettaient pas de risquer d’éventuelles erreurs en confiant ce travail à une personne n’ayant pas les connaissances sur le sujet.

 Chaque phrase dans l’entretien a fait l’objet de plusieurs contrôles afin de s’assurer de sa juste saisie.

 Les transcriptions de nos entretiens correspondent donc à des transcriptions intégrales des propos tenus par nos interviewés. Pour y arriver, nous avons tenu à saisir mot par mot leurs réponses et respecter les règles suivantes :

o Préserver les répétitions et certaines tournures employées. Quand un mot, ou une partie de la phrase, est répété plusieurs fois, nous avons choisi de ne pas y toucher ou de ne pas le remplacer par un synonyme ;

o Préserver les mots, adverbes et verbes qui n’existent pas en bon français mais sont employés tels quels par nos interlocuteurs ;

o Enlever, dans certains cas, les hésitations et les interjections ;

o Essayer d’éviter, autant que possible, l’ajout de mots par nous-mêmes, sauf dans les cas où les phrases n’avaient pas de sens sans cet ajout. Ayant vécu les contextes de nos entretiens, nous sommes le mieux placé pour effectuer une telle opération par rapport à une personne extérieure qui ne connaît ni le contexte ni forcément le sujet de l’entretien.

o Préserver les phrases et les écrire mot par mot de la manière dont elles ont été dites par les personnes interrogés. Même quand il aurait été préférable de reformuler certaines phrases, nous avons préféré ne pas y toucher, sauf dans les cas où sans une reformulation de notre part, la phrase n’était pas du tout compréhensible.

o Puis, dans de rares cas où nous étions amenés à effectuer les corrections citées ci-dessus, nous avons veillé à ne pas modifier le sens de la phrase.

o « agence » par « agence de voyage », quand il s’agit du mot « agence de voyage » ;

o « agence » par « agence réceptive » dans les quelques cas où l’interviewé parle d’une « agence réceptive » ;

o « réceptive » par « agence réceptive » ;

o « réceptif » par « agence réceptive » ;

o « opérateur » par « tour-opérateur » dans les quelques cas où l’interviewé parle d’un « tour-opérateur » ;

o « gens » par des mots comme « collègues », « agences de voyage », « professionnels » dans une vingtaine de cas pour ne pas le confondre avec le mot « gens » qui sous-entend « client » . Nous savons que ceci est particulièrement risqué, puisque les mots employés en remplacement en sont éloignés, au sens propre du terme. Mais, rien ne remplaçant l’intelligence humaine, nous avons procédé ainsi pour lever cette ambiguïté ;

o Quand nous y étions vraiment contraints, l’ajout d’un mot manquant entre [] pour compléter la phrase : il s’est agi le plus souvent de l’expression « agence de voyage » ou « tour-opérateur ».

 En ce qui concerne la saisie informatique de nos textes, il n’y a pas eu de procédure à proprement parler. Néanmoins, comme IRAMUTEQ traite les corpus de texte au format « .txt », nous avons suivi les démarches suivantes :

o L’utilisation des logiciels « Microsoft Word » et « LibreOffice Writer » pour ce qui est de la transcription manuelle de nos entretiens. Ceci s’explique par le fait que ces éditeurs de saisie de texte sont munis des modules qui nous aident à identifier les éventuelles erreurs de frappe (pas complètement fiables mais susceptibles d’aider à la détection d’éventuelles erreurs).

o Le rétablissement des fichiers qui contiennent les transcriptions au format « .txt ». Pour cela nous avons suivi le conseil de Ratinaud (Ratinaud 2013b) et avons, d’une part, utilisé un logiciel type « notepad++ », éditeur de texte intermédiaire, afin de rendre le format des transcriptions en texte brut, d’autre part, nous avons utilisé l’encodage recommandé, à savoir UTF8, au moment de la conversion de format (pour éviter tout problème de compatibilité entre ces différents formats).

 Enfin, nous nous sommes assuré que les formes employées existent dans le dictionnaire lexical du logiciel. Il devient bien évidemment nécessaire d’adapter celui-ci aux besoins de la recherche et d’y ajouter les formes manquantes.

o Prenons l’exemple d’une forme comme « etourisme » qui n’existe pas dans le dictionnaire de vocabulaire d’IRAMUTEQ. Pour qu’elle ne soit pas considérée

comme une forme « non reconnue », il est nécessaire de l’ajouter au dictionnaire de vocabulaire.

La transcription de nos entretiens résultant de ce travail se trouve dans un fichier qui est considéré comme le fichier d’entrée pour les logiciels d’analyses statistiques textuelles. Ce fichier, appelé dans le jargon « le corpus de texte » (Gauzente et Peyrat-Guillard 2007; Lebart et Salem 1994; Ratinaud et Marchand 2012; Reinert 1983) doit être au format exigé par le logiciel employé. En effet, chaque logiciel impose ses propres règles pour ce qui est du format du fichier, de l’encodage et de la manière dont le corpus de texte est introduit23.

23 En ce qui concerne IRAMUTEQ, le fichier d’entrée doit être au format texte brut (.txt) avec l’encodage UTF8. Le fichier qui représente notre corpus de texte contient nos différents entretiens. Chaque entretien (appelé « texte ») doit être introduit par quatre étoiles (****) suivies d’une série de variables étoilées.

3.6.2. Lemmatisation

La lemmatisation est un processus permettant de considérer les différentes flexions d’une forme comme une seule forme, avec pour conséquence de reconnaître, par exemple, le féminin d’un adjectif au lieu du masculin (chère  cher) ; le pluriel au lieu du singulier (chers  cher) ; un verbe conjugué au lieu de son infinitif (vendait  vendre). Ce travail est également applicable aux termes qui sont synonymes et à leurs abréviations, etc. Par exemple :

 Un interviewé emploie les termes « email », « mél » « mail » durant la même interview tandis que son collègue utilise une expression comme « courrier électronique » ;

 Un « produit packagé » peut être appelé également par la même personne « produit standardisé » tandis qu’une autre utilise les termes : « produit standard », « pack », « package », « packaging » ou encore un « voyage packagé » :

o « Non, on vend des produits qui sont packagés par les tour-opérateurs… »

o « … parce que finalement l'agence-de-voyage, elle peut acheter directement son

pack auprès des agences réceptives… »

o « …c'est vrai qu'on a senti … une certaine limitation dans les produits à vendre,

on était un peu tourné vers les ventes un peu standards et vendre toujours la même chose »

o …

 Un « voyage sur-mesure », appelé par une personne « du sur-mesure » ou « à la demande » tandis qu’une autre emploie le terme « voyage personnalisé » ou « voyage à la carte » ;

o « … trouver un voyage sur mesure, organisé vraiment à la carte, en fonction de

nos envies, en fonction de notre budget, en fonction de notre temps qu'on veut consacrer à telle ou telle visite… »

o « … après on fait une offre personnalisée pour chaque personne qui nous fait une

demande et on envoie cette offre par Internet et les clients nous le renvoient soit par mail, soir par courrier avec un chèque … »

o …

 Deux interviewés qui emploient deux formes différentes pour parler de la même chose : « le voyage moyen de gamme » et « le voyage milieu de gamme » ;

o « …il y a eu des stratégies de diversification, vers du volume, qui a fait que X est

resté dans les voyages haut de gamme mais a été ouvert à une clientèle de milieu de gamme, ce qui a nui à son image. »

o « Le [produit] moyen de gamme est en crise et quel que soit le moyen de

distribution, quel que soit le métier… »

o « …après, qu'est-ce qu'on a vendu, des packs moyen de gamme. Ça veut dire

quoi ?, ça veut dire que c'est la mentalité qui a changé, j'achète le même circuit qui m'aurait coûté … »

 Une personne parle d’« agence réceptive » en utilisant une expression anglaise : « Destination Management Company » ou son abréviation « DMC ». Tandis qu’une autre personne utilise seulement le terme « réceptif » ;

o « X aujourd’hui change complètement le modèle économique et se spécialise sur

trois segments d’activité : d’abord, l’agence_réceptive, [à savoir] la DMC [Destination Management Company], par tout dans le monde et ça, ça marche… »

o « [Un voyage sur mesure] est un voyage qu'on va monter étape par étape, en

direct avec le client, que nous derrière, on va monter soit avec un de nos partenaires réceptifs, voire en direct … »

o …

 Le terme « garantie » est utilisé au même titre que le mot « assurance » :

o « …c'est-à-dire que comme avant de repasser par un tour-opérateur pour être sûr d'avoir de l'assurance, la garantie que leurs clients… »

o « … on préfère travailler avec des agences réceptives qui sont déjà référencées, parce qu'on sait qu'il y a une garantie financière derrière… »

o « … si demain vous partez et que pour une raison ou l'autre l'agence-de-voyage ferme sa porte, les gens n'ont pas à se soucier, ils ont la garantie, ils sont assurés, … »

Si nous explorons méticuleusement nos transcriptions, il existe plusieurs cas similaires dans lesquels les personnes interrogés ont fait usage de vocabulaires/expressions très varié(e)s pour exprimer la même chose. Au vu de cette divergence, il devient nécessaire de conduire un travail préalable qui est la reconnaissance de ces vocabulaires/expressions synonymes afin de canaliser, en quelque sorte, les différentes terminologies utilisées. Ce travail n’est autre que la lemmatisation des formes, ce qui nous permet d’« augmenter les liaisons statistiques impliquées

par les co-occurrences des formes » (Gauzente et Peyrat-Guillard 2007).

En ce qui concerne IRAMUTEQ, il est livré avec deux dictionnaires qui ne sont autre chose que des dictionnaires de lemmatisation24. Le premier est « le dictionnaire des vocabulaires » qui

24 Les logiciels comme ALCESTE et SPAD proposent une lemmatisation plus radicale, à savoir que leur opération de lemmatisation réduit chaque mot à sa forme canonique (c’est-à-dire à leurs chaînes de caractères communs). Par

lemmatise les mots selon les procédures suivantes : un verbe conjugué revient à son infinitif, un adjectif féminin/pluriel à sa forme masculine au singulier et les adverbes restent inchangés.

Figure 14 : Le dictionnaire de vocabulaire d’IRAMUTEQ : nous voyons ici que la

conjugaison du verbe « abandonner » revient à son infinitif et le mot « abandons » sera lemmatisé à sa forme masculine au singulier « abandon ».

Le second dictionnaire, nommé « dictionnaire des expressions », est proposé au chercheur pour les expressions courantes composées de deux ou plusieurs formes. Tout comme le dictionnaire des vocabulaires, il appartient au chercheur de le compléter, en fonction de ses besoins, par les expressions qui n’y figurent pas.

Figure 15 : Quelques expressions prises dans le dictionnaire des expressions d’IRAMUTEQ

À titre d’exemple, le terme « agence de voyage », n’est pas listé dans le dictionnaire des expressions. Écrit tel quel, sans être mentionné dans ce dictionnaire, ce terme sera considéré comme trois formes distinctes « agence », « de » et « voyage ». Tandis qu’en l’ajoutant dans le dictionnaire des expressions, il sera évalué par IRAMUTEQ comme une seule forme qui est « agence_de_voyage ». Pour cela, il faut ajouter le terme « agence de voyage » et sa forme au pluriel dans le dictionnaire des expressions d’IRAMUTEQ (comme montré dans la Figure 16 : Les termes « agence de voyage » et « agences de voyage » seront transcrits « agence_de_voyage » et « agences_de_voyage »). À leur tour, « agence_de_voyage » et sa forme au pluriel « agences_de_voyage » doivent être ajoutées dans le dictionnaire des vocabulaires (Figure 17 : Les termes « agence_de_voyage » et « agences_de_voyage » seront ensuite lemmatisés dans la forme au singulier « agence_de_voyage ».) pour être lemmatisées dans la forme au singulier qui est « agence_de_voyage ».

Figure 16 : Les termes « agence de voyage » et « agences de voyage » seront transcrits « agence_de_voyage » et « agences_de_voyage ».

Figure 17 : Les termes « agence_de_voyage » et « agences_de_voyage » seront ensuite lemmatisés dans la forme au singulier « agence_de_voyage ».

Cette opération de lemmatisation est un travail qui demande beaucoup d’investissement en temps et en patience, pour s’assurer de ne rien prendre au hasard. D’abord parce que le dictionnaire mis à disposition n’est pas exhaustif (ce qui est tout à fait logique et compréhensible, car on ne peut pas satisfaire les besoins de tous les chercheurs à la fois). Et surtout parce que, comme on vient de le mentionner, il existe une pluralité considérable de termes utilisés par les interviewés.

nous révisons son entretien, il a utilisé beaucoup plus le mot « gens » que le mot « client ». Dans ce cas, la question se pose légitimement : comment faire interpéter au logiciel que ces deux mots sont en réalité identiques ? Ce cas devient encore plus délicat quand les interviewés emploient le mot « gens » pour parler de leurs collègues agences de voyage/tour-opérateurs. Dans le premier cas, nous pouvions faire appel à la lemmatisation du mot « gens » afin qu’il soit considéré par le logiciel comme le mot « client ». Néanmoins, en procédant ainsi, nous serons sans doute moins pertinents pour le deuxième cas de figure. Dans ce cas précis, il n’existe aucune autre solution que de procéder au changement manuel de ce mot (ou de le laisser tel qu’il est au risque d’induire le logiciel en erreur). Nous avons donc décidé de remplacer le mot « gens » par « agences_de_voyage » quand on parle d’une agence_de_voyage (dans 11 cas) ou par le mot « tour-opérateurs » quand l’interviewé parle d’un tour-opérateur (2 cas). Précisons encore que c’est l’unique cas où nous ne sommes pas restés fidèles dans notre travail de transcription. Pour le reste, quand nous avons eu recours à l’ajout d’un mot, nous l’avons bien évidemment mis entre arcades [].

Le Tableau 16 rassemble les formes lemmatisées et leurs synonymes que nous avons ajoutés nous-mêmes dans les dictionnaires d’IRAMUTEQ. Ce tableau ne mentionne pas les noms propres tels qu’ « Air France », « hotel.com », « booking.com », etc.

Tableau 16 : La lemmatisation personnalisée des mots/expressions à laquelle nous avons eu recours

Forme Forme lemmatisée Forme Forme lemmatisée

à_l_abri Assuré feed-backs feedback

à_la_carte sur_mesure fiabilité assurance

à_la_demande sur_mesure flight vol

affrét% affréter flights vol

affrétaient Affréter forfaitiste forfaitiste

affrètement Affrètement forfaitistes forfaitiste

affrètement Affrètement franchisées franchiser

affrètements affrètement fusionnées fusionner

agence_de_voyage agence_de_voyage garant% assurer

agence_réceptive agence_réceptive garantie assurance

agences_de_voyage agence_de_voyage garanties assurance

agences_réceptives agence_réceptive garants garant

agent_de_voyage conseiller_voyage gens client

agents_de_voyage conseiller_voyage grain_de_sable problème

agrégation Agrégation hic problème

agrégations Agrégation hôtels_clubs hôtels_clubs

allotement Allotement hôtels_couples hôtels_couples

allotements Allotement hotline hotline

apporteur_d_affaires apporteur_d_affaires hottier agrégateur

apporteur_de_business apporteur_d_affaires hottiers agrégateur

apporteurs_d_affaires apporteur_d_affaires imprévu problème

bas de gamme bas_de_gamme imprévus problème

bénéfice_client Valeur individu client

bénéfices_client Valeur info information

broker Courtier infos information

brokers courtiers kit_à_vendre packagé

cahier_des_charges cahier_des_charges logistiquement logistiquement cahier-des-charges cahier_des_charges long_courrier long_courrier

cannibaliser Cannibaliser long_courriers long_courrier

centrale_d_achat centrale_de_réservation mainstream package

centrale_d_achat centrale_de_réservation margé marger

centrale_de_comptabilité centrale_de_réservation margeaient marger centrale_de_comptabilité centrale_de_réservation margent marger centrale_de_réservation centrale_de_réservation margeons marger centrale_de_réservation centrale_de_réservation market_place market_place

chiffre_d_affaires chiffre_d_affaires mass_market packagé

chiffres_d_affaires chiffre_d_affaires masse volume

click_and_mortar click_and_mortar masses volume

clientèle Client mauvaise_expérience problème

clientèles Client mauvaises expériences problème

clique Clique milieu de gamme milieu_de_gamme

cliquent cliquer mortar mortar

co-créer co_créer moyen_courrier moyen_courrier

commissionnaient commissionner moyen_courriers moyen_courrier

commissionne Commissionner moyen_de_gamme milieu_de_gamme

commissionné Commissionner net internet

commissionnée Commissionner opérateur tour_opérateur

commissionnement Commission pack package

commissionnements Commission package package

commissionnés commissionner packagé packagé

commissionnez commissionner package_dynamique package_dynamique

compétence Expertise packagée packagé

compétences expertise packages package

concurrencées Concurrencer packagés packagé

concurrencent Concurrencer packages_dynamiques package_dynamique

concurrencés Concurrencer packaging package

concurrentielle Concurrentiel packs package

concurrentielles concurrentiel personnalisé sur_mesure

conseiller_de_tourisme conseiller_voyage personnalisée sur_mesure conseiller_de_voyage conseiller_voyage personnalisées sur_mesure conseiller_en_voyage conseiller_voyage personnalisés sur_mesure conseiller_voyage conseiller_voyage place_de_marché place_de_marché

conseillers Conseiller point_de_vente agence_de_voyage

conseillers_de_voyage conseiller_voyage prennent en charge prendre_en_charge conseillers_en_voyage conseiller_voyage pris_en_charge assuré

conseillers_voyage conseiller_voyage prise_en_charge prendre_en_charge

conseilleurs Conseilleur promesse valeur

consommateur Client promesses valeur

consommateurs Client promotion réduction

consommatrice client pure_player pure_player

consommatrices Client pure_players pure_player

contrainte Problème quantité volume

contraintes problème quantités volume

contrepartie Contrepartie rassurer assurer

contreparties Contrepartie réassurance assurance

cooperating Coopération réassurances assurance

coopération Coopération réintermédiation réintermédiation

court_circuit% Squeezer réseaux sociaux réseau_sociaux

couverture Assurance réseaux-sociaux réseau_sociaux

couvertures Assurance sauter% squeezer

créneaux Thématique sécurisé assuré

déflanet Déflanet sécurisée assuré

déflation Déflation sécurisées assuré

déflations Déflation sécurisés assuré

délocalisée Délocaliser sécurité assurance

délocalisées Délocaliser sécurités assurance

dématérialisée Dématérialiser smiles bonus

dépackager Dépackager souci problème

déresponsabilisent Déresponsabiliser soucis problème

déresponsabiliser Déresponsabiliser standard packagé

désintermédiation Désintermédiation standardisé packagé

destination_management agence_réceptive standardisée packagé

déstockage Déstockage standardisées packagé

déstockages Déstockage standardisés packagé

difficulté Problème standards packagé

difficultés Problème tarif prix

dimensionné Dimensionnées tarification prix

dimensionnée Dimensionnées tarifications prix

dimensionnées Dimensionnées tarifs prix

dimensionnement Dimensionnement technicien_de_voyage conseiller_voyage dimensionner dimensionner techniciens_de_voyage conseiller_voyage

dimensionnés dimensionnées test_and_learn test

dispatchent Dispatcher testing test

dispatcher Dispatcher tour_opérateur tour_opérateur

dynamic_packaging package_dynamique tour_opérateurs tour_opérateur

e_tourisme e_tourisme touriste client

écotourisme Ecotourisme touristes client

éco-tourisme Ecotourisme traditionnel physique

éco-tourisme Ecotourisme traditionnelle physique

éductour Eductour traditionnelles physique

éductours Eductour traditionnels physique

elearning Formation tranquille assuré

e-mails e_mail tranquilles assuré

en_lignes en_ligne voyageur client

en_packagé Packagé voyageurs client

entrée de gamme bas_de_gamme voyageuse client

etourisme e_tourisme voyageuses client

e-tourisme e_tourisme voyagiste tour_opérateur

expér_ience Expertise voyagistes tour_opérateur

expér_iences Expertise web internet

expérience Expérience web_to_store web_to_store

expériences Expérience webmarketing webmarketing

externalisé Externaliser webmarketings webmarketing

Feedback Feedback webmaster webmaster

feed-back Feedback yield_management yield_management