Analyser le texte des enquêtes

(1)

Analyser le texte des enquêtes

Découvrez comment IBM SPSS Text Analytics for Surveys vous permet d'accéder à des informations essentielles

Introduction

Bien que les gens communiquent de nombreuses façons, ce sont les mots qui représentent certainement le moyen de communication le plus efficace et le plus répandu. Que la communication verbale prenne la forme de rapports établis avec soin, de réponses textuelles aux questions d'une enquête ou de notes ou d'e-mails informels voire difficilement déchiffrables, ils présentent tous des informations de grande valeur. Le défi consiste à trouver le moyen d'extraire ces informations.

SPSS est un pionnier du développement d'outils permettant l'analyse de communications ou de textes écrits de manière fiable et efficace. Notre société est également l'un des précurseurs du développement de solutions permettant de faciliter les enquêtes sur les caractéristiques, les attitudes, les comportements et les croyances des gens. C'est pour cette raison qu'une partie importante de nos efforts s'est concentrée non seulement sur les outils statistiques qui permettent l'analyse des réponses aux questions d'enquêtes fermées mais également sur les techniques permettant d'extraire et de catégoriser la richesse des informations contenues dans les réponses aux questions ouvertes. En combinant les deux types d'informations, les organisations obtiennent une vision plus complète des personnes auprès desquelles elles enquêtent, qu'il s'agisse de clients, d'étudiants ou de la population en général.

En tant que nouveau membre de l'entreprise IBM, SPSS apporte avec lui ses outils analytiques de pointe, permettant ainsi à la technologie d'IBM SPSS de prendre la première place sur le marché de l’analyse prédictive. Les offres d'IBM SPSS comprennent les meilleurs produits du marché pour la collecte de données, les statistiques, le data mining, le text mining et l'analyse de texte et permettent à votre organisation d’automatiser l’analyse des réponses des enquêtes à questions ouvertes.

Les outils d'IBM SPSS sont basés sur les standards du secteur et peuvent facilement s'intégrer à votre infrastructure existante pour améliorer la précision, réduire la main d'œuvre et minimiser les pertes. L'effort conjugué d'IBM et de SPSS vous offre une flexibilité optimale et s'adapte aux types de données que vous explorez et à la façon dont vous déployez les résultats.

Les organisations peuvent ensuite utiliser ces informations pour anticiper ou prévoir les besoins et actions futurs. Ce livre blanc vous propose un bref aperçu du rôle du texte dans les enquêtes d'opinion. Il décrit ensuite plusieurs approches de l'analyse de texte d'enquêtes et présente le fonctionnement d'IBM SPSS Text Analytics for Surveys, une solution basée sur la linguistique spécialement

Table des matières

1 Introduction

2 Le rôle du texte dans les enquêtes d'opinion

2 Différentes approches du text mining 4 Étapes de l'analyse de texte d'enquête 8 Fonctionnement de la classification et

de la catégorisation 10 Fiabilité et ajustement 11 Analyses supplémentaires 12 Conclusion

12 À propos d'IBM Business Analytics

(2)

Le rôle du texte dans les enquêtes d'opinion

Si l'analyse de texte est aussi longue et compliquée, pourquoi ne pas éviter l'utilisation de questions nécessitant des réponses textuelles ? La réponse, comme le savent les analystes expérimentés, est que les réponses textuelles complètent d'autres données et apportent des informations plus variées et plus détaillées sur ce que les personnes interrogées ressentent, pensent et font. Deux raisons principales justifient l'utilisation de réponses textuelles. Tout d'abord, les mots que choisissent les personnes interrogées offrent souvent aux analystes un nouvel aperçu de leur mode de pensée. Deuxièmement, si les analystes se fient exclusivement à des questions fermées, ils encadrent non seulement la question, mais aussi les réponses possibles et de fait, constituent et interprètent la réalité pour les personnes interrogées. Comment les analystes peuvent-ils être sûrs de bien interpréter ? Et si ils avaient omis une réponse alternative importante ? Et si la manière de poser la question avait faussé ou déformé les réponses ? C'est pour ces raisons que de nombreux analystes incorporent des questions ouvertes à leurs enquêtes. Mais peut-être se contentent-ils de sélectionner une ou deux de ces réponses pour illustrer les tendances plus facilement quantifiables présentes dans les données structurées.

Désormais, grâce aux nouveaux outils d'analyse de texte, les analystes peuvent exploiter pleinement les réponses textuelles en toute simplicité. Les plus efficaces de ces nouveaux outils utilisent les technologies de text mining linguistique. Les différences entre le text mining linguistique et les autres approches sont résumées dans la prochaine section de ce livre blanc. La principale différence réside dans le fait que le text mining linguistique est basé sur une classe d'algorithmes analysant la structure et la signification de la langue d'un texte, ce qui permet aux systèmes informatiques d'analyser les ambiguïtés inhérentes à la communication verbale. Ces technologies sont à la base de toutes les solutions de text mining de IBM SPSS, y compris IBM SPSS Text Analytics for Surveys.

Différentes approches du text mining

Il existe plusieurs autres approches du text mining. Le défi consiste à trouver celle qui offre le bon équilibre entre fiabilité et efficacité. Les méthodes manuelles exigent que les analystes ou les responsables du codage lisent un échantillon des réponses textuelles et créent un ensemble de catégories dans lequel les codeurs peuvent classer les réponses de manière appropriée. Une liste détaillée d'instructions de codage, ou plans de codage, doit être développée afin que les personnes en charge du codage puissent regrouper les réponses de manière cohérente. Bien que les codeurs humains trouvent généralement facile de comprendre le contenu d'une réponse, ils peuvent ne pas être d'accord sur la façon de le catégoriser.

Cette divergence réduit la fiabilité des résultats de recherche.

Même si elle est minime, le codage manuel des réponses textuelles peut prendre des jours, voire des semaines, en fonction du nombre et de la

(3)

retarde également parfois la livraison des informations nécessaires. Il existe plusieurs méthodes d'analyse de texte automatisées conçues pour l'accélérer et réduire l'intervention humaine nécessaire.

Une de ces approches est d'utiliser des solutions basées sur des formules statistiques, des réseaux neuronaux et d'autres techniques, généralement utilisées en combinaison avec des recueils de règles détaillés. Une grande expertise est nécessaire pour développer et utiliser ce genre de méthodes, ce qui explique pourquoi de nombreuses organisations y renoncent. Une autre raison est que ces solutions ressemblent à des « boîtes noires » avec leurs technologies sous-jacentes invisibles et hors de portée des utilisateurs. Un autre problème inhérent aux solutions automatisées basées sur les statistiques est que bien qu'elles puissent traiter rapidement du texte, leur précision est assez faible. De nombreuses solutions basées sur les statistiques comptent simplement le nombre d'occurrences des termes et calculent leur proximité avec les termes associés.

Si les réponses textuelles des enquêtes sont relativement simples (des listes de marques de céréales ou de garnitures de pizza préférées par exemple), une solution basée sur les statistiques peut offrir des résultats probants. Cepen- dant, avec des réponses textuelles légèrement plus complexes, les solutions basées sur les statistiques produisent de nombreux résultats inutiles et passent à côté d’informations qu'elles auraient dû découvrir. Les solutions basées sur les statistiques traitent les textes comme des « sacs de mots » et n'incorporent pas la structure et la signification du langage dans leurs analyses.

Les solutions linguistiques automatisées, quant à elles, tiennent compte à la fois des structures grammaticales et de la signification lors de l'analyse du texte. Ces solutions sont basées sur le champ d'étude connu sous le nom de traitement du langage naturel (NLP) ou linguistique computationnelle, un domaine dont l'importance a augmenté lorsque les ressources informatiques ont atteint le niveau nécessaire pour analyser les ambiguïtés inhérentes au langage humain. Le text mining linguistique offre la rapidité et le rapport qualité prix avantageux des systèmes basés sur les statistiques ainsi que des résultats plus fiables et plus utiles.

Les technologies avancées de text mining linguistique sont à la base d'IBM SPSS Text Analytics for Surveys. Cependant, les fonctionnalités et l'interface d'IBM SPSS Text Analytics for Surveys ont été spéciale- ment conçues en pensant aux spécialistes des enquêtes d'opinion. Ces derniers peuvent importer des réponses textuelles de manière simple et efficace, extraire des concepts ou des termes, les regrouper par type puis exporter les résultats sous forme de texte ou de dichotomies pour l'analyse avec d'autres données d'enquête.

De cette manière, les données textuelles gagnent en valeur prédictive.

Les analystes et les preneurs de décisions peuvent anticiper plus efficacement les attitudes et comportements futurs en identifiant des schémas et des tendances dans le texte, ce que nous aimons appeler l'analyse de texte prédictive d'IBM SPSS. De plus, les informations obtenues à partir de l'analyse de texte peuvent être utilisées pour compléter d'autres analyses de données et permettre ainsi aux organisations de tirer profit de l'analyse prédictive.

(4)

Étapes de l'analyse de texte d'enquête

Les réponses aux enquêtes sont généralement relativement courtes (une phrase ou un petit paragraphe). IBM SPSS Text Analytics for Surveys a été conçu pour ce type de texte mais il peut également traiter des réponses de plusieurs centaines de mots. Les étapes principales du processus d'analyse sont l'extraction et la catégorisation. Pendant ces deux étapes, IBM SPSS Text Analytics for Surveys permet aux analystes de configurer la technologie sous-jacente pour mieux répondre aux besoins d'un projet d'enquête spécifique. Avant de décrire le fonctionnement de l'extraction et de la catégorisation dans IBM SPSS Text Analytics for Surveys, quelques mots sur le processus général sont nécessaires.

Préparer l'utilisation d'IBM SPSS Text Analytics for Surveys Afin d'analyser correctement le texte d'une enquête, un analystes doit tenir compte de nombreux facteurs. Ils comprennent les points suivants :

L'analyse de texte d'enquête, comme tout type de text mining, doit être

•

effectuée en gardant à l'esprit des objectifs clairs. Lors de la

préparation d'une enquête, un analyste doit déterminer les objectifs de l'étude et comment les réponses textuelles aident à les atteindre.

La qualité des questions ouvertes posées affecte les possibilités

•

d'utilisation des réponses obtenues. Éviter les questions trop larges améliore la pertinence des réponses et des catégories en résultant.

L'analyse de texte n'est pas une science exacte. Il n'y a pas de résultat

•

« correct » unique. Le text mining est subjectif en ce qu'il est influencé par l'interprétation que fait l'analyste du message transmis par la personne interrogée. Deux personnes compétentes peuvent analyser les mêmes données et tirer des conclusions différentes en fonction de leur point de vue individuel. Les technologies linguistiques à la base d'IBM SPSS Text Analytics for Surveys aident néanmoins à réduire l'écart entre les interprétations individuelles.

L’analyse de texte est un processus itératif. Un spécialiste des enquêtes,

•

qui travaille avec des réponses d'enquête, recommencera probablement l’extraction des concepts et la catégorisation des réponses à l’aide de différentes définitions de catégories ou de systèmes de codage, de différentes définitions de terme ou de synonyme ou de différents regroupements de réponses. Ce processus peut être répété plusieurs fois avant d'obtenir un résultat satisfaisant. Même ainsi,

l'automatisation d'IBM SPSS Text Analytics for Surveys permet une catégorisation plus rapide et le potentiel d'une analyse plus

sophistiquée que les méthodes manuelles.

(5)

Ce que voient les analystes lorsqu'ils utilisent IBM SPSS Text Analytics for Surveys

Certains aspects de l'extraction et de la classification dans IBM SPSS Text Analytics for Surveys sont automatisés et ne nécessitent aucune intervention de l'utilisateur. Les captures d'écran présentées sur cette page offrent un aperçu de ce que pourrait voir un analyste pendant le codage d'un ensemble de réponses textuelles.

Réponses d'enquête importées.

Les analystes peuvent importer des réponses textuelles depuis des sources variées, notamment depuis Microsoft^® Excel^™ ; IBM^® SPSS^® Statistics ; IBM^® SPSS^® Data Collection Data Model qui sous-tend les produits d'enquêtes d'opinion d'IBM SPSS tels qu'IBM^® SPSS^® Data Collection Interviewer et toutes les bases de données compatibles ODBC.

Figure 1 : réponses à une question ouverte dans une enquête sur les facteurs qui influencent les décisions des consommateurs lors de la location d'une voiture.

(6)

Termes et concepts extraits.

Lorsque les utilisateurs cliquent sur le bouton Extraire, IBM SPSS Text Analytics for Surveys extrait automatiquement les termes et concepts importants contenus dans les réponses à une question. Aucune intervention manuelle n'est nécessaire. Cependant, les utilisateurs d'IBM SPSS Text Analytics for Surveys peuvent modifier certains dictionnaires et bibliothè- ques du produit afin que l'extraction soit encore plus précise.

Figure 2 : sur l'écran, un analyste voit le texte complet des réponses dans le volet de droite avec les termes extraits surlignés et répertoriés dans le volet en bas à gauche.

Réponses classifiées et catégorisées.

A l'aide d'une boîte de dialogue simple d'utilisation, le analyste peut choisir parmi de nombreuses techniques pour catégoriser les termes extraits.

Figure 3 : la dérivation de termes, l'inclusion de termes et le réseau sémantique sont trois techniques linguistiques que les utilisateurs d'IBM SPSS Text Analytics for Surveys peuvent choisir, séparément ou ensemble, pour créer des catégories. Le paramètre par défaut utilise ces trois techniques à la fois.

(7)

Catégories modifiées manuellement.

Les utilisateurs voient non seulement le texte de la réponse et les termes et catégories extraits mais également une représentation graphique des relations entre les réponses.

Figure 4 : le fait de pouvoir consulter une carte des cooccurrences des réponses aide les analystes ou les codeurs à affiner les catégories, ce qui permet un groupement plus précis des réponses. Les catégories peuvent être enregistrées et réutilisées lors de codage similaire ou d'enquêtes de suivi.

Résultats exportés pour l'analyse.

Lorsque les utilisateurs sont satisfaits de la catégorisation des réponses, ils peuvent exporter les résultats sous la forme de dichotomies ou de catégories de texte. Ces dernières peuvent être utilisées pour créer des tableaux et des graphiques décrivant l'analyse des réponses textuelles, soit séparément, soit en association avec d’autres données.

Figure 5 : les résultats peuvent être exportés vers IBM SPSS Statistics ou Excel pour être analysés ou pour créer de nombreux graphiques qui aideront à communiquer les résultats de l'enquête.

(8)

Fonctionnement de l'extraction

Bien que les utilisateurs puissent intervenir de plusieurs façons pendant l'extraction et la classification, le processus d'extraction d'IBM SPSS Text Analy- tics for Surveys ne nécessite aucune intervention de l'utilisateur. Le processus d'extraction est composé de six étapes principales :

Conversion des données entrées dans un format standard 1.

Identification des termes candidats (mots ou groupes de mots identifiant 2.

des concepts dans le texte)

Identification des classes d'équivalence (les formes de base des termes 3.

candidats) et intégration de synonymes Attribution des types

4.

Indexation 5.

Analyse des liens et extraction des événements et des sentiments 6.

Les bibliothèques et les dictionnaires qui constituent les ressources linguisti-ques d'IBM SPSS Text Analytics for Surveys ont été optimisés pour l'analyse de textes d'enquêtes. Certaines de ces ressources peuvent être modifiées et les analystes peuvent créer des bibliothèques personnalisées correspondant à un sujet ou à un type de recherche particulier. Cette personnalisation permet d'obtenir une liste de termes et de concepts extraits plus adaptée limitant les itérations et

l'intervention manuelle lors du processus de catégorisation. Une fois créées, les bibliothèques personnalisées peuvent être partagées avec d'autres personnes.

Pour une description plus détaillée des technologies linguistiques sous-ten- dant le processus d'extraction d'IBM SPSS Text Analytics for Surveys, veuillez consulter le site www.ibm.com/software/analytics/

Lorsque les termes sont extraits, un type leur est attribué. Un type est un groupement sémantique de termes. Les types peuvent contenir des concepts de haut niveau, des termes et des qualificatifs positifs et négatifs, des qualificatifs qui dépendent du contexte et des noms de personnes, de lieux ou d'organisations.

IBM SPSS Text Analytics for Surveys intègre également une liste des schémas dans le processus d'extraction. Les schémas sont une combinaison de termes et de types. Ils sont particulièrement utiles lorsqu'ils essaient d'identifier des opinions sur un sujet spécifique, comme les commentaires négatifs que les personnes interrogées ont pu faire. Une des forces d'IBM SPSS Text Analytics for Surveys est qu'il permet aux analystes de faire facilement la distinction entre les réponses positives et les réponses négatives : « J'ai trouvé le cours génial » contre « J'ai trouvé le cours horrible » par exemple.

Fonctionnement de la classification et de la catégorisation

L'étape suivante est la classification et la catégorisation des réponses textuelles.

La classification fait référence à la génération de définitions de catégories à l'aide de techniques intégrées. La catégorisation fait référence au processus d'évalua- tion et d'étiquetage pendant lequel des identifiants uniques sont attribués à chaque réponse.

(9)

automatisées du produit effectuent ces procédures beaucoup plus rapidement et facilement. Des techniques de classification basées sur la linguistique et sur les statistiques sont disponibles.

Les analystes peuvent également utiliser une combinaison de techniques automatisées et manuelles pour finaliser les catégories. Chaque ensemble de données étant unique, le choix des techniques et l'ordre dans lequel un analystes les applique sont susceptibles de varier d'un projet à l'autre. Cepen- dant, dans tous les cas, le processus est itératif : un analyste applique certaines techniques, évalue les résultats, effectue des modifications soit à la technique choisie soit aux catégories en résultant et affine encore les catégories.

Voici une courte description des techniques de classification automatisées disponibles avec IBM SPSS Text Analytics for Surveys.

Techniques linguistiques

Les techniques de classification linguistique d'IBM SPSS Text Analytics for Surveys permettent de regrouper les noms. Elles créent des catégories en identifiant des termes susceptibles d'avoir la même signification (également appelés synonymes) ou qui sont plus spécifiques que la catégorie représentée par un terme (également appelés hyponymes) ou qui sont plus généraux (hyperonymes). Pour des résultats plus précis, ces techniques linguistiques excluent les adjectifs et autres qualificatifs.

Dérivation de termes. Cette technique de classification linguistique crée des catégories en regroupant les termes composés de plusieurs mots dont le premier est commun (également appelées préfixes). Cette technique est particulièrement utile pour identifier les synonymes parmi les termes composés de plusieurs mots car les termes de chaque catégorie générée sont des synonymes ou ont une signification semblable. La dérivation de termes fonctionne avec des données de réponses de diverses longueurs et génère un petit nombre de catégories compactes.

Séries lexicales. Cette technique, fondée sur l'inclusion de termes, crée des catégories en prenant des termes et en en recherchant d'autres qui les contiennent. Une série lexicale basée sur l'inclusion de termes correspond souvent à une hiérarchie taxinomique (une relation sémantique « est un/une »). Par exemple, le terme voiture de sport serait intégré dans le terme voiture. Dans IBM SPSS Text Analytics for Surveys, les termes à un ou plusieurs mots qui sont inclus dans d'autres termes à plusieurs mots sont d'abord examinés puis regroupés dans les catégories appropriées. L'inclusion de termes fonctionne avec des données de réponses de différentes longueurs et génère généralement un plus grand nombre de catégories que la dérivation de termes.

Réseau sémantique. Cette technique crée des catégories fondées sur un index complet des relations qui existent entre les mots. D'abord, les termes extraits qui sont synonymes, hyponymes ou hyperonymes sont identifiés et regroupés. IBM SPSS Text Analytics for Surveys utilise un réseau sémantique avec des algorithmes sophistiqués pour filtrer les résultats dénués de sens. Cette technique produit de très bons résultats lorsque les termes font partie du réseau sémanti- que et ne sont pas trop ambigus. Elle n'est pas aussi utile lorsque le texte contient une importante terminologie spécialisée et spécifique à un domaine particulier que le réseau ne reconnaît pas.

Techniques basées sur les statistiques

La technique statistique principale proposée par IBM SPSS Text Analytics for

« IBM SPSS Text Analytics for Surveys

correspond exactement à ce que notre université

recherchait pour extraire les informations

essentielles contenues dans les réponses d'enquêtes sous forme de texte long. Grâce à ce nouveau produit, nous avons pu identifier

rapidement les problèmes que les étudiants

pouvaient rencontrer avec les services de notre

université. Ces problèmes n'apparaissaient pas dans les données

d'enquêtes quantitatives.

Mais lorsque nous avons utilisé IBM SPSS Text Analytics for Surveys pour

analyser le texte des réponses ouvertes, nous sommes parvenus à identifier ces problèmes puis à les résoudre. Les informations

supplémentaires obtenues grâce à IBM SPSS Text Analytics for Surveys

amélioreront considérable- ment la qualité des analyses de nos enquêtes et la capacité de prise de décisions de notre

organisation. »

– John Lemon

Responsable informatique Université d'Aberdeen, Écosse

(10)

mas. Cette technique peut être utilisée à la fois sur les noms et sur d'autres qualificatifs. La fréquence est le nombre d'enregistrements contenant un terme ou un type et tous ses synonymes déclarés.

Regrouper les éléments en fonction de leur fréquence peut générer des résultats intéressants qui peuvent indiquer une réponse commune ou importante. Cette approche fonctionne généralement mieux lorsque les données textuelles contiennent des listes ou des termes simples. Il peut également être utile d'appliquer cette technique aux termes qui ne sont pas encore catégorisés après l'application d'autres techniques.

Fiabilité et ajustement

Lorsque les analyste codent des données, ils veulent être certains que les catégories créées correspondent exactement aux réponses des personnes interrogées. Ainsi, deux codeurs indépendants utilisant les mêmes règles ou le même plan de codage coderont des réponses identiques de la même façon.

Lorsque l'analyse de texte est effectuée manuellement, il s'agit d'un problème majeur. Un ensemble précieux de catégories peut être créé mais si celles-ci ne correspondent pas parfaitement aux réponses, la valeur de cet ensemble diminue considérablement. Lorsqu'IBM SPSS Text Analytics for Surveys est appliqué aux mêmes données, et que les mêmes ressources linguistiques sont utilisées, il reproduira toujours à l'identique l'analyse précédente. Sa fiabilité est totale.

Cela ne signifie pas qu'il n'existera aucune erreur dans la catégorisation initiale mais plutôt qu'il est désormais possible de passer à l'étape suivante : l'ajustement. Lorsqu'ils effectuent un codage manuel, les codeurs lisent la réponse et peuvent saisir toutes les nuances d'une déclaration (même s'ils ont du mal à appliquer les catégories de codage). IBM SPSS Text Analytics for Surveys peut appliquer les catégories de codage, mais celles-ci doivent être définies afin que les nuances et les distinctions puissent être saisies.

Il existe deux façons d'effectuer l'ajustement : en affinant les ressources linguistiques et en affinant les définitions des catégories. IBM SPSS Text Analytics for Surveys crée facilement des catégories sans intervention manuelle mais il est possible que ces catégories ne capturent pas toutes les informations contenues dans les réponses. Cependant, il est possible de modifier les ressources linguistiques de base du programme afin que la création de catégories devienne extrêmement sensible aux idiosyncrasies du texte. Pour ce faire, il est possible d'ajouter des mots et des phrases aux bibliothèques et dictionnaires linguistiques du logiciel, de spécifier des mots à exclure de l'analyse, de définir des synonymes ou de créer des bibliothèques personnalisées.

En plus d'affiner les ressources linguistiques, les analyste peuvent consulter les catégories pour s'assurer que celles créées sont appropriées et qu'aucune catégorie importante n'a été oubliée. Si nécessaire, des techniques manuelles peuvent être utilisées pour effectuer des réglages mineurs, supprimer des classifications incorrectes et ajouter des enregistrements ou des termes qui pourraient avoir été oubliés.

(11)

méthodes manuelles. Les analystes peuvent modifier les dictionnaires et les bibliothèques pour un traitement encore plus rapide. Cependant, ils peuvent encore intervenir manuellement pour affiner les catégories et les réponses qu'elles contiennent.

Analyses supplémentaires

Parfois, la création de catégories de réponses textuelles est la seule analyse que nécessite une enquête spécifique. Le fait de connaître les principaux thèmes exprimés par les personnes interrogées et le nombre de personnes ayant mentionné chaque thème peut suffire à fournir des informations à propos de leurs attitudes, comportements ou croyances.

Néanmoins, il peut aussi arriver qu'un analyste souhaite effectuer des rapports et analyses supplémentaires. Ceci peut être avantageux par exemple pour créer des tableaux et des graphiques affichant les résultats de l'enquête. Un analyste pourrait vouloir utiliser des variables d'autres parties du questionnaire pour en savoir plus sur les répondants ou analyser les catégories trouvées dans les réponses textuelles en les comparant avec d'autres données d'enquête. IBM SPSS Text Analytics for Surveys permet aux analystes d'effectuer des analyses supplémentaires en exportant des catégories de texte comme des dichotomies vers IBM SPSS Statistics ou Microsoft Excel. Dans chacun de ces programmes, les analystes peuvent effectuer des calculs statistiques et créer des graphiques montrant les relations contenues dans les données.

Les catégories ou codes créés avec IBM SPSS Text Analytics for Surveys peuvent être enregistrés pour être réutilisés dans des enquêtes similaires ou dans des études de suivi. IBM SPSS Text Analytics for Surveys peut également échanger des données à l'aide d'IBM SPSS Data Collection Data Model. Cette gamme comprend des produits qui prennent en charge la création et le

déploiement de questionnaires sophistiqués sur papier, par téléphone et en ligne ainsi que leur traduction dans plusieurs langues. IBM SPSS Data Collection permet aux utilisateurs d'effectuer des analyses de données avancées et de partager ou de publier les résultats de manière efficace et peu coûteuse.

Conclusion

Ce livre blanc vous a proposé un bref aperçu du rôle du texte dans les enquêtes d'opinion. Il a ensuite décrit plusieurs approches permettant de catégoriser le texte des enquêtes et, en particulier, les processus d'extraction et de catégorisa- tion d'IBM SPSS Text Analytics for Surveys. Comme les techniques disponibles dans IBM SPSS Text Analytics for Surveys permettent aux chercheurs de combiner l'analyse de texte à l'analyse d'autres données d'enquête, ceux-ci obtiennent une compréhension plus riche et plus détaillée de leurs résultats qu'avec les autres méthodes.

En rendant les réponses textuelles plus facilement quantifiables, IBM SPSS Text Analytics for Surveys permet d'inclure des informations tirées du texte dans les analyses quantitatives, y compris le type d’analyses prédictives possibles avec le data mining d'IBM SPSS et les solutions d'optimisation de décision. Ainsi, IBM SPSS Text Analytics for Surveys, composant clé de la famille des solutions prédictives d'IBM SPSS, peut devenir un composant majeur de l'approche d'autres recherches ou organisations professionnelles dans l'utilisation de leurs données d'enquêtes d'opinion pour approfondir la compréhension qu'ils ont de leurs clients, anticiper les changements et préparer leurs organisations à y

(12)

Route 100 Somers, NY 10589

Droits restreints pour les utilisateurs du gouvernement américain - l’utilisation, la duplication ou la divulgation sont soumises aux restrictions visées dans le contrat GSA ADP Schedule conclu avec IBM Corp.

Produit aux États-Unis d’Amérique Mai 2010

IBM, le logo d’IBM, ibm.com, WebSphere, InfoSphere et Cognos sont des marques commerciales ou des marques déposées d’International Business Machines Corporation aux États-Unis, dans d’autres pays ou les deux. Si ces termes ou si d’autres termes déposés d’IBM sont représentés pour la première fois dans ce document suivis du symbole de marque déposée (® ou TM), ces symboles indiquent des marques déposées ou de droit commun appartenant à IBM lors de la publication de ce document. Ces marques commerciales doivent également faire l’objet d’un enregistrement ou doivent être des marques de droit commun dans les autres pays.

Une liste des marques commerciales actuelles d’IBM est disponible sur Internet sous

« Droits d’auteur et marques » à l’adresse www.ibm.com/legal/copytrade.shtml.

SPSS est une marque commerciale de SPSS, Inc., an IBM Company, déposée dans de Business Intelligence, d’Analyse Prédictive, de Performance financière &

gestion de la stratégie et d’Applications Analytiques permettent d’avoir une vision claire et précise de la situation actuelle et de prédire les événements futurs. Combinées à de puissantes solutions métiers, les organisations de toute taille peuvent améliorer leur productivité, optimiser leur prise de décisions et délivrer de meilleurs résultats.

Dans ce cadre, les logiciels IBM SPSS Predictive Analytics aident les organisations à prévoir les événements futurs pour une meilleure prise de décisions et donc une amélioration de leurs résultats. Nos clients des secteur privé, secteur public et universitaire se fient à la technologie IBM SPSS et considèrent cette technologie comme un avantage concurrentiel pour : fidéliser sa clientèle, attirer de nouveaux clients, maximiser ses ventes, réduire la fraude, minimiser les risques. En intégrant le logiciel IBM SPSS à leurs opérations quotidiennes, les organisations deviennent des entreprises prédictives capables d’optimiser leur prise de décision afin d’atteindre leurs objectifs et d’obtenir un avantage concurrentiel important. Pour plus de renseignements, visitez le site www.ibm.com/spss/fr.