• Aucun résultat trouvé

Significations algorithmiques

Aperçu des chapitres

2. La base de données comme outil cognitif

2.2 L’association des données

2.2.4 Significations algorithmiques

Les machines précitées plus avant (les machines à échecs, l’idéoscope etc.) fonctionnent avec des engrenages mécaniques ou des circuits électroniques, et la grande réussite de leurs inventeurs a été de trouver une méthode pour traduire les problèmes du monde réel dans des équivalents mécaniques ou électroniques. Comme Poe et Shannon l’ont écrit, il est concevable de trouver des équivalences dans les cas où il s’agit de systèmes fixes et bien déterminés, comme celui des mathématiques ou des échecs, mais les chances de trouver un système pour traiter de domaines de nature complexe et ouverte sont à interroger.

L’exemple particulier, qui mêle le calcul mathématique au domaine de la littérature est celui du concept des chaînes de Markov, une théorie nommée d’après son inventeur Andrei A. Markov. L’opinion courante est que la littérature est opposée au calcul et la formalisation, et les idées des générateurs de poèmes ont toujours rencontré beaucoup de scepticisme et de désapprobation. Ce n’était pas pour ses qualités littéraires que Markov s’est tourné vers le roman « Evgenij Onegin » d’Alexander Pushkin dans le cadre de ses études en mathématiques, mais c’était pour trouver des séquences de lettres non-arbitraires, pour vérifier et démontrer son nouveau concept dans le calcul des probabilités.

Markov était mathématicien à l'université de Saint-Pétersbourg où il travaillait sur le calcul des probabilités, un domaine qui, jusqu’à la publication des recherches de Markov, était dominé par les théories de Jacques Bernoulli. Bernoulli avait étudié les probabilités par rapport aux valeurs des variables indépendantes comme elles se produisent en jetant des dés. Son idée était qu’avec un grand nombre d’essais de jetés de dés, la moyenne des résultats était proche du résultat attendu et que cette valeur indiquait la probabilité de ce résultat. Dans cette expérience, les variables, les coups de dés, sont indépendants, le résultat final ne dépend pas des résultats précédents. Pour cette théorie, il n’est pas important que les dés soient jetés plusieurs fois en séquence ou qu’un grand nombre de dés soient jetés d’un coup, la dimension temporelle n’existant donc pas dans

La recherche de Markov introduisait une dimension relationnelle, en étudiant des séquences de variables qui dépendaient de leurs contextes. Pour trouver de telles séquences, il s’est tourné vers des textes littéraires où il trouvait des séries de lettres dont chaque lettre dépendait de ce qui avait été dit avant. Ces séquences sont désormais connues sous le nom de « chaînes de Markov »182. Il y a une dimension historique dans son approche où la dépendance des signes aux signes précédents est une forme d’inscription du passé. Néanmoins, même dans les chaînes de Markov il n’y a pas de vraie relation au passé d’une longue durée, car le passé ne compte qu’en tant qu’il produit un effet immédiat pour la situation actuelle. Regardant une chaîne de caractères, ce ne sont que les caractères à proximité proche du mot actuel qui ont une influence sur ce qui peut suivre. Ceux des mots précédents n’ont pas d’influence. Le passé est réduit à une simple valeur de probabilité. La différence entre les approches de Markov et le calcul de valeurs indépendantes comme le jeu d’échecs se trouve plutôt au niveau de leur relation à l’avenir. Dans le jeu d’échecs, la décision actuelle s’inscrit dans une séquence de futures décisions possibles avec l’objectif de gagner. Pour les chaînes de Markov, par contre, l’avenir n’a pas d’importance, parce qu’il n’existe pas de but final, il s’agit seulement d’une analyse statistique de probabilités que certaines valeurs apparaissant dans certaines circonstances.

L’utilisation d’une œuvre littéraire a permis à Markov d’obtenir des séquences dont les valeurs individuelles avaient une cohérence qui n’était pas entièrement arbitraire comme dans le cas des coups de dés. Le lien qui existe entre les lettres et les mots d’un texte n’est rien d’autre que la signification de ce qui est exprimé dans le texte. Cette relation significative est encodée dans une relation de probabilité, une opération qui la coupe de la signification précise, mais qui garde cependant une représentation de cette relation : « Nous prenons une succession de 20.000 lettres dans le roman de Pushkin ‘Evgenij Onegin’ […]. Cela nous donne un groupe de 20.000 échantillons connectés dont chacun représente soit une voyelle soit une consonne ».183 Dans son analyse du roman de

182

HILGERS, Philipp von, VELMINSKI, Wladimir, Andrej A. Markov – Berechenbare

Pushkin, Markov a calculé la probabilité d’être une voyelle pour une lettre ou bien une consonne, sans s’attacher au sens du texte, les lettres n’étant que des variables pour une étude mathématique. Mais même dans une analyse qui évite tout aspect de signification, ce qui rend le résultat du calcul possible est le sens et le raisonnement humain inscrit dans le texte : c’est l’expression et le désir de communiquer de l’auteur qui forment la structure du texte – linguistiquement aussi bien que mathématiquement. Il est certain qu’une simple composition de texte, au moyen du calcul de probabilité, n’est pas capable de créer une forme littéraire ni un texte expressif, néanmoins, ces probabilités constituent la trace d’un sens potentiel.

Figure 11. Pages du manuscrit de la recherche statistique sur le texte d’Eugène Onéguine par Andreij A. Markov (1913)

Il y a plusieurs exemples dans les arts qui ont utilisés l’approche de Markov, pour la création de textes, comme par exemple la « Poetry machine »184 de David Link ou les textes du personnage fictif de « Mark V. Shaney » qui a contribué au Usenet, un forum de discussion sur internet, dans les années quatre-vingt185. Dans son essai « Cybernétique et

184

LINK, David, Poesiemaschinen – Machinenpoesie, Wilhelm Fink Verlag, Munich, 2007.

fantasmes »186, Italo Calvino développe l’idée d’une littérature produite par des machines et souligne l’importance de Markov sur un tel projet.

Les chaînes de Markov sont devenues un outil très important dans la théorie de l’information, et dans les applications telles que les moteurs de recherche. Mais ces chaînes ne fonctionnent que de manière restreinte : il est possible de calculer des valeurs de probabilité par rapport à une, deux ou même dix valeurs précédentes, mais il n’est pas possible de calculer la logique d’un argument entier. Ce que les êtres humains font facilement, suivre un argument extensif, se souvenir, ou produire des associations, est un problème loin d’être résolu par les machines. Bien que la recherche sur l’intelligence artificielle a progressé et notamment du fait de la conception de logiciels très sophistiqués et de capteurs qui peuvent observer leur entourage, les machines ne sont toujours pas capables d’aller au-delà de ce qui a été mis en œuvre.