• Aucun résultat trouvé

Constituer un corpus représentatif de la presse associative de quartier toulousaine a été une entreprise laborieuse. Il a fallu d’abord identifier cette presse dispersée, certains titres ayant disparu, d’autres s’étant créés récemment. Puis, la possibilité de récolter les différentes édi- tions a été assujettie à plusieurs éléments. D’abord la disponibilité de ces titres sur Internet. La plupart des associations éditant ces journaux disposent désormais d’un site internet qui leur permet de diffuser à moindre coût et pour un lectorat potentiellement plus large (Blan- chard, 2013 ; Raoul, 2013). Le site leur permet également de proposer aux lecteurs les ar- chives des éditions papier agrémentées d’informations complémentaires, plus « chaudes » (Bousquet & Smyrnaios, 2013) à propos de la vie du quartier ou de l’association. Il a ainsi été possible de récolter une partie des éditions composant ce corpus via Internet, en téléchargeant les numéros accessibles en format PDF.

Mais tous les numéros n’étaient pas nécessairement disponibles. Il était dès lors nécessaire de contacter les associations éditrices afin de nous procurer les numéros manquants. Certaines n’ont pas répondu à notre sollicitation. D’autres, nous ont volontiers transmis les éditions pa- pier et ont d’ailleurs accepté de répondre à quelques questions concernant le fonctionnement du journal, son histoire, sa vocation. Ce fut le cas pour les Coursives d’Empalot, les Echos de

Rangueil et le Comité de Quartier de Borderouge. Nous avons d’ailleurs transmis les éditions

numérisées par nos soins aux associations afin qu’elles puissent bénéficier de ce travail pour enrichir leurs archives. À la demande des Echos de Rangueil, nous avons également écrit un petit article expliquant notre démarche et les analyses préliminaires concernant leur journal. Le cas du journal Candie est spécifique. Nous avons appris l’existence de ce journal tardive- ment, auprès du conseil citoyen de Bellefontaine-Milan87. Il se trouve que ce journal est édité

87Le Journal Candie est édité par l’association des habitants du quartier de Lafourguette, rattaché au quartier

Milan. Nous avons pu nous procurer les éditions incluses dans ce corpus grâce à Mme Renée Fouché, qui assu- rait la présidence de l’association. Nous avons eu l’occasion d’échanger avec elle, à l’occasion des séances plé- nières du conseil citoyen de Bellefontaine-Milan, puis dans les locaux municipaux hébergeant l’association des habitants, à propos de cette dernière et du journal Candie.

par l’association des habitants du quartier de Lafourguette depuis les années 1970, période durant laquelle l’association a été fondée. La plupart des éditions n’étaient pas numérisées et il nous était impossible, dans la temporalité du doctorat, de procéder à la numérisation puis au formatage de ces éditions afin de les intégrer à notre corpus. Nous nous sommes donc limités à intégrer les éditions fournies en format texte. C’est également au cours d’une séance plé- nière du conseil citoyen Bellefontaine-Milan, alors que nous présentions nos résultats d’analyse, que nous avons fait la connaissance d’un ancien membre de l’association publiant la Lettre de Bellefontaine, dont nous connaissions l’existence mais que nous n’avions pas ré- ussi à nous procurer, en raison de la dissolution de cette association en 2012. L’heure était désormais trop tardive pour intégrer les éditions de ce titre à notre corpus.

Enfin, nous avions pris contact avec l’association TO7, publiant un journal du même nom dans le quartier du Mirail depuis de nombreuses années. En dépit de cette prise de contact encourageante, l’association n’a pas été en mesure de nous transmettre les éditions complètes de ces journaux. Si certains contenus étaient accessibles via Internet, ils ne correspondaient pas à une édition complète mais plutôt à un florilège, une sélection choisie parmi les articles et il nous était donc impossible, de l’intégrer au corpus.

Outre la récolte de ce matériau, la seconde difficulté a été de nature technique. Pour les édi- tions disponibles au seul format papier, il a fallu numériser, puis convertir les textes afin qu’ils puissent être soumis pour analyse au logiciel IRaMuTeQ (format .txt). Cette entreprise s’est avérée délicate et tâtonnante en raison des limites des logiciels proposant une technolo- gie de reconnaissance optique des caractères (OCR) ou une extraction de texte à partir de do- cuments PDF. Nous avons ainsi utilisé le logiciel libre Ghostscript88 permettant le traitement

des formats de fichiers PostScript et PDF et le logiciel de reconnaissance optique de carac- tères Tesseract-ocr89. Toutefois, la procédure ne fonctionnait pas systématiquement et nous

avons eu recours à une fonctionnalité intégrée dans le « Drive » de Google, qui permet, éga- lement par reconnaissance optique de caractères, de transformer les documents PDF en do- cuments Word. La procédure s’est avérée très efficace bien qu’elle ne dispense pas d’une re- lecture attentive. Cela dit, elle n’a pas permis de traiter l’intégralité des documents et nous avons dû, à de nombreuses reprises, en recopier le contenu.

Nous avons ainsi pu constituer un corpus composé de 633 éditions de journaux de quartiers toulousains, chaque édition correspondant à un texte, soit 2 587 668 occurrences, dont voici une synthèse (Tableau 5), et la répartition géographique (Figure 6) :

88 Site internet : [https://www.ghostscript.com]. Le logiciel est distribué sous licence GNU GPL.

89 Site internet : [https://github.com>tesseract-ocr]. D’abord développé sous licence Apache, son développement

Journal Période Quantité Parution Tirage Structure de ratta- chement

Les Coursives d’Empalot

2001-2016 146 mensuelle 10 000 ex. Association Kara- van, association

culturelle de proxi- mité

Les Echos de Rangueil

1994-2015 106 trimestrielle 3 500 ex. Association dédiée au journal La Gazette des Pradettes 1990-2016 88 Trimestrielle en édition papier, mensuelle en diffusion inter- net, à partir de 2013 Non Ren- seigné (NR)

Collectif des asso- ciations du quartier des Pradettes

La Gazette des Chalets

1995-2016 83 trimestrielle 3 000 ex. Association du quar- tier Chalets- Roquelaine

Candie 2009-2016 73 mensuel NR Association du quar- tier Lafourguette

7 notre quar- tier

2003-2015 48 trimestrielle 7 000 ex. Comité des quartiers du secteur 7

Canal Infos 2001-2014 24 trimestrielle NR Association pour la sauvegarde du quar- tier Brienne Bazacle Amidonniers CQB Borde- rouge (lettre du Comité de Quartier de Borderouge)

2003-2014 38 trimestrielle 6 200 ex. Comité de quartier de Borderouge Bavard et Pi- pelette (lettre du Comité de Quartier du Grand Selves)

2006-2009 14 trimestrielle NR Association des ha- bitants du quartier du Grand Selve

Reynerie Mi- roir

2012-2016 13 trimestrielle 1 250 ex. Association dédiée

Tableau 5 : Présentation du corpus de presse associative et caractéristiques des titres90

Figure 6 : Répartition géographique des titres de presse associative

Parmi ces journaux, quatre sont implantés dans des quartiers prioritaires de la politique de la ville : c’est le cas des Coursives d’Empalot, de Reynerie Miroir, de la Gazette des Pradettes et de 7notrequartier91.

Outre la possibilité de déterminer si cette distinction est susceptible d’être opérante pour l’interprétation des spécificités discursives que nous détaillerons ultérieurement, il nous était possible de comparer, pour le quartier de la Reynerie le contenu discursif du journal Reynerie-

Miroir à celui du conseil-citoyen de Reynerie-Mirail Université et d’enrichir ainsi la connais-

sance des représentations des habitants, prises selon deux angles, deux dispositifs, deux con- figurations distinctes. Autre élément distinctif particulièrement saillant, Les Coursives

d’Empalot ne sont pas réalisées par une équipe de bénévoles mais des professionnels, salariés

de l’association Karavan, dont l’un des membres fut animateur de radio92.

91 Tout le secteur « 7 » n’est pas inscrit dans la géographie prioritaire, c’est cependant le cas des quartiers Soupe-

tard et La Gloire.

92 M. A. Makouf, avec qui nous avons eu l’occasion d’échanger à propos du journal, fut animateur radio sur les

La délimitation chronologique du corpus est, pour les titres encore édités, arbitraire car liée aux contraintes temporelles du doctorat.

Le corpus a nécessité un nettoyage très spécifique. Nous voulions pouvoir observer les diffé- rences de lexicalisation du quartier en dehors des distinctions nécessairement liées à la topo- graphie. Cette presse se caractérise en effet par une localisation et une personnalisation très forte (c’est d’ailleurs une caractéristique commune). Les noms propres, de rues, d’associations, d’écoles, de cités et résidences, de centres culturels, de centres médicaux, de bibliothèques, de personnes, d’habitants, de membres des comités de rédaction, de commer- çants, d’élus et notables, de techniciens, etc. sont très présents dans chaque titre. Cette presse peut ainsi, à l’instar de la presse régionale, avoir une fonction d’information service (Bous- quet, 2015) en se faisant vitrine et annuaire des commerces et services implantés sur le quar- tier.

Certains titres consacrent des pages entières à effectuer la promotion des commerçants du quartier, qu’ils soient, ou non, financeurs du journal93 (coiffeur, quincaillerie, restaurant, bis- trot, primeur, etc). C’est le cas par exemple des Echos de Rangueil. Ces noms propres influent considérablement sur l’analyse, dès lors que l’on s’attache à déterminer les spécificités de chaque titre. Il a donc été nécessaire d’opérer un nettoyage en plusieurs phases. D’abord, neu- traliser les noms propres les plus fréquents, en les formatant en tant que formes secondaires (_nom_). Ensuite, à partir de la CHD, éliminer les classes dans lesquelles les mentions des commerces et les informations paratextuelles récurrentes, comme les appels à adhésion (dou- blons) non pertinentes pour notre analyse.

9.1.2. La presse quotidienne nationale et régionale (PQN et PQR)

Pour la presse quotidienne nationale et régionale, la constitution des corpus a nécessité l'utili- sation de mots-clés94 car nous souhaitions appréhender la façon dont les quartiers, dans leur diversité et selon les catégories socio-administratives susceptibles d’être mobilisées, étaient médiatisés par la PQN et la PQR.

Les archives de la base de données Europresse95 ne remontant pas au-delà de 2012 sur les

journaux locaux, nous avons procédé pour ces deux corpus à un filtrage à partir de la barre de

93 Peu de titres bénéficient de subventions récurrentes leur permettant de publier les journaux, c’est le cas des

Coursives d’Empalot et de Reynerie Miroir. Ce qui n’empêche pas que ces derniers participent à la promotion

des commerçants du quartier.

94 Nous avons été, pour l’extraction des articles, la constitution de ces deux corpus et leur nettoyage, largement

assistés par Lucie Loubère, à l’époque doctorante au sein de notre équipe et désormais docteure, sans qui cette extraction se serait avérée bien plus complexe à réaliser et bien plus chronophage. Nous ne l’en remercierons jamais assez.

95 L’université Paul Sabatier a fait le choix d’une relation contractualisée avec Europresse et non Factiva, pour-

navigation du moteur de recherche Google en utilisant les mots-clés suivants : « quartier », « banlieue », « cité », « HLM », « ZUP » et « ZUS ».

Afin de désambiguïser le terme « cité » nous avons ajouté à la requête une exclusion des termes « cité scolaire », « cité de Carcassonne », « cité administrative ». Nous avons égale- ment décliné le terme « cité » sous sa forme nominale, au singulier et au pluriel afin de limiter l'apparition de la forme verbale. Pour le cas de la Dépêche du Midi, nous avons ajouté la loca- lité pour cibler plus spécifiquement les quartiers toulousains. La requête prend dès lors la forme suivante :

banlieue OR banlieues OR quartier OR quartiers OR "la cité" OR "une cité" OR "les cités" OR "des cités" OR HLM OR ZUS OR ZUP AND Toulouse site:http://nomDuSite.fr

Le moteur de recherche bloquant les résultats aux alentours de 500, pour nous permettre de recueillir un plus grand nombre d'articles, nous avons réitéré cette requête par année, puis importer l'url des résultats à partir de l’application Seoquake96 et extrait le texte des articles à l'aide du logiciel Gromoteur97 (Gerdes, 2014).

Le choix des titres a été déterminé en fonction de trois critères : leur audience, leur ligne édi- toriale présentant un clivage politique assez net (Turpin, 2015) et la possibilité d'accéder aux articles via Internet. Les articles extraits couvrent une temporalité différente, en fonction de leur disponibilité sur Internet. Le tableau ci-dessous en synthétise la composition :

Titre Nombre d’articles Période

La Croix 3931 octobre 2003 à octobre 2015

Le Figaro 4527 janvier 2006 à octobre 2015

L'Humanité 2593 novembre 1990 à octobre 2015

Libération 7867 octobre 1996 à octobre 2015 Tableau 6 : Synthèse de la composition du corpus de PQN

Le corpus comporte ainsi 18 920 articles (17 377 462 occurrences pour 199 735 formes ou mots).

Pour la presse régionale, nous nous sommes focalisés sur la Dépêche du Midi car c'est le titre de presse régionale le plus accessible, le plus lu et le plus emblématique de Toulouse (Bous- quet, 2015). Afin de pouvoir analyser le traitement spécifique des différents quartiers de Tou- louse, un tri a été effectué en fonction de la présence ou de l'absence du mot « Toulouse »

96 Site internet :[http://www.seoquake.com/]

dans les articles de la Dépêche du Midi. Toutes les pages contenant le mot « toulouse » (au moins dans un titre de menu), nous avons dû modifier la requête pour ne conserver que les articles indexés dans la rubrique « toulouse » du site. Le corpus est composé de 4059 articles (67 647 segments de texte, 2 393 241 occurrences pour 63 647 formes) répartis sur une pé- riode allant de mai 1998 à septembre 201598.

9.2.QUARTIER, BANLIEUE ET CITE : DES OBJETS DISCURSIFS PROCHES, MAIS NON SYNO-

Outline

Documents relatifs