• Aucun résultat trouvé

Comme nous l’avons dit dans les chapitres précédents, la représentation d’un concept ou du sens des mots différerait selon l’environnement. D’ailleurs, nous avons avancé, dans le chapitre deux, l’idée que malgré la différence environne- mentale, la notion centrale attachée au concept reste identique.

Afin de voir si ces deux caractéristiques que nous avons soutenues sont respec- tées dans le modèle, nous avons testé quelques mots pour le modèle qui a appris séparément deux corpus différents. Les corpus utilisés sont cinq ans de textes des journaux Le Monde et L’Humanité.

Comme on peut le constater dans le tableau 6.5, pour les mots censés être iden- tiques par leur sens dans ces deux journaux, comme par exemple film, il n’existe pas de différence significative entre les contexonymes obtenus séparément. En re- vanche, les mots censés être différents entre les deux journaux, comme par exem- ple politique, sont représentés différemment par le modèle : le résultat du modèle qui a utilisé L’Humanité comme corpus présente des contexonymes différents de ceux obtenus en utilisant Le Monde comme corpus. Par exemple, les contexo- nymes PCF, communistes, Hue, chômage pour le mot politique se distinguent des contexonymes du Le Monde.

Par ailleurs, la spécificité commune des corpus, à savoir les textes de journaux est reflètée par les résultats obtenus pour le mot américain. Les contexonymes produits par le modèle figurant dans le tableau 6.5 reflètent en effet l’intérêt des médias pour l’aspect politique.

Mot α β γ Contexonymes film 0,01 0,01 0,01

Le Monde

{ films, festival, réalisateur, réalisé, v, arte, cinéaste, min, scénario, noir, o, tourné, personnages, images, john, roman, personnage, cannes, sortie, documentaire, comédie, amour, meilleur, tournage, tf, e, série, acteurs, vidéo, genre }

film 0,01 0,01 0,01 L’Humanité

{ caméra, cinéaste, images, personnages, regard, télé, réalisateur, montre, filmer, films, parle, réalité, enfant, usine, caméras, voit, montage, vérité, amour, tournage, écran, écriture, distance, spectateur, sorte, personnage, type, engagement, minutes, trente }

politique 0,01 0,01 0,01 Le Monde

{ monétaire, étrangère, classe, commune, démocratie, discours, militaire, centrale, régime, partis, soutien, bu- reau, front, responsabilité, véritable, budgétaire, so- cialiste, relations, unique, élection, dirigeants, écono- miques, parlement, solution, opinion, égard, ministres, monnaie, élus, processus }

politique 0,01 0,01 0,01 L’Humanité

{ pcf, communistes, citoyens, démocratie, partis, chan- gement, monétaire, véritable, commune, intervention, hue, vote, sociaux, plurielle, peuple, chômage, opinion, engagement, solution, construction, sociales, discours, humanité, processus, unique, objectif, changer, socia- liste, ouvre, classe }

américain 0,01 0,01 0,01 Le Monde

{ clinton, bill, washington, britannique, mondial, new, e, trésor, john, département, york, allemand, george, nu- méro, filiale, congrès, dollar, géant, japonais, modèle, richard, o, russe, mondiale, bush, site, commerce, mi- chael, capital, rachat }

américain 0,01 0,01 0,01 L’Humanité

{ clinton, bill, washington, mondial, e, peuple, bush, congrès, new, champion, otan, britannique, russe, mi- litaire, york, onu, george, visite, mètres, john, irak, numéro, chine, william, noir, département, processus, mondiale, indiqué, kosovo }

TAB. 6.5 – Résultat du test pour deux corpus séparés (Le Monde et L’Humanité).

Outre ces résultats, plus de 100 000 types de mots peuvent être testés sur le site http ://dico.isc.cnrs.fr/dico/context/search.

Discussion et conclusion

7.1

Une étude pluridisciplinaire

Dans cette étude nous avons examiné des sujets assez variés comme la notion de concept, le sens des mots et les modèles informatiques, psycholinguistiques et linguistiques. Les disciplines liées à ces sujets sont aussi très diverses — la phi- losophie, la linguistique, la psycholinguistique, la linguistique computationnelle, l’intelligence artificielle, les sciences cognitives, etc. Il est vrai que chacune de ces disciplines garde son propre intérêt distinct et qu’elle adopte une approche spé- cifique à son objectif. Par exemple, en ce qui concerne le concept, la philosophie s’intéresse à la nature fondamentale du concept, la linguistique au lien entre le concept et les sens des mots, la psycholinguistique au lien entre représentation et processus mentaux et la linguistique computationnelle à la modélisation formelle. De ce fait, traiter dans une étude des sujets censés appartenir à ces différentes dis- ciplines peut comprendre le risque d’étudier ces sujets de manière superficielle ou bien de dévier de la direction principale en examinant chaque sujet de façon trop détaillée.

pourra compenser ce type de risque. En effet, un simple parcours de l’histoire des sciences montre des effets constructifs et interactifs entre différents domaines de recherche.

D’une part, les sciences issues de domaines différents s’influencent entre elles en s’inspirant du mode de pensée de chacune d’elles. La physique newtonienne par exemple a engendré le déterminisme mécaniste comme celui de Laplace tan- dis que la théorie de la relativité a influencé le relativisme comme le relativisme éthique chez Weber (1917/1949, 1919/1975). L’influence des sciences sociales sur les sciences naturelles existe aussi comme par exemple celle de la théorie de Mal- thus sur la théorie darwinienne. De manière similaire, la prospérité florissante du behaviorisme avant les années 60 a influencé plusieurs domaines de recherches et réciproquement son déclin est lié aux critiques provenant d’autres disciplines.

D’autre part, outre ces aspects interdisciplinaires, les changements au sein des disciplines elles-mêmes au cours de ces dernières décennies méritent notre atten- tion. Par exemple, le domaine de la recherche linguistique s’est largement étendu aujourd’hui par rapport à ce qu’il était au début du dernier siècle : la pragmatique et la prosodie en sont des exemples. Ce type d’élargissement intradisciplinaire est en effet dû au fait qu’il n’est pas possible de progresser sans rendre compte d’as- pects considérés comme initialement non reliés. En effet, en ce qui concerne la linguistique, l’approche restreinte à la sémantique lexicale montre une limite pour l’explication de divers aspects linguistiques. Par exemple, Reboul (à paraître) re- marque que la théorie du lexique génératif dont l’intérêt porte plutôt sur le lexique sémantique a des difficultés à expliquer les différents sens du mot began entre la phrase « Mary began her book » et la phrase « Virginia Wolf began her book » à moins que l’on ne recoure à une connaissance encyclopédique voire pragmatique. Outre cette tendance à l’influence mutuelle interdisciplinaire et à l’extension intradisciplinaire, la reprise de méthodes considérées comme obsolètes permet de

faire progresser les études. Par exemple, les méthodes statistiques, qui sont consi- dérablement appréciées aujourd’hui dans les applications du TAL, ont en réalité été rejetées dans les années 60, à la fois théoriquement et pratiquement, face à l’émergence de méthodes non statistiques. De fait, une théorie linguistique qui préconise une approche non statistique, notamment celle de Chomsky, est un pro- grès évident contre une approche statistique naïve. Ce progrès incontestable n’ex- plique cependant pas tous les aspects linguistiques ; il ne garantit pas non plus la possibilité d’avoir un système capable de traiter de manière parfaite des tâches de TAL voire de comprendre le langage humain. De ce fait, la réapparition de mé- thodes statistiques dans le domaine du TAL qui montre des résultats intéressants pour les études linguistiques computationnnelles ne doit pas être comprise comme un retour en arrière mais devrait être comprise comme la négation de la négation de Hegel, autrement dit comme un progrès. En effet le progrès est souvent ob- servé dans des études par alternance de deux attitudes opposées, ce qui n’est pas néanmoins un simple jeu à somme nulle. Le retour du dualisme cartésien contre le monisme naïf par exemple est un progrès au lieu d’une simple répétition du dua- lisme de l’antiquité ; inversement, le monisme hégélien est un progrès vis-à-vis du dualisme qui est devenu cette fois-ci naïf et incomplet relativement à ce retour du monisme.

Notre position se situe dans cette perspective. Nous préconisons un progrès possible en adoptant une approche statistique au sein de la linguistique séman- tique, de la linguistique computationnelle et de la modélisation psycholinguis- tique. En ce sens nous indiquons la limite d’une approche non statistique telle que l’approche syntaxique, symbolique, etc. Nous reconnaissons néanmoins que la combinaison de ces deux types d’approches ou bien que les approches non sta- tistiques qui utilisent les résultats d’approches statistiques puissent porter d’autres types de progrès envisageables. Ainsi, l’absence d’une discussion profonde sur

la syntaxe dans cette étude ne présage pas l’avantage et une légitimité absolue de notre approche statistique ; de fait, la voie est ouverte pour une amélioration utilisant des approches différentes de la nôtre.

Compte tenu de ce fait, nous discuterons ce que nous avons apporté dans cette étude et ce qu’il faudra faire en perspective.