*ZFG
: Une nouvelle approche axiomatique à
l’analyse non-standard
par
Etienne Dauphin
Département de mathématiques et de statistique faculté des arts et des sciences
Mémoire présenté à la Faculté des études supérieures en vue de l’obtention du grade de
Maître ès sciences (IVLSc.) en Mathématiques
juin 2003
Université
dh
de Montréal
Direction des bibliothèques
AVIS
L’auteur a autorisé l’Université de Montréal à reproduire et diffuser, en totalité ou en partie, par quelque moyen que ce soit et sur quelque support que ce soit, et exclusivement à des fins non lucratives d’enseignement et de recherche, des copies de ce mémoire ou de cette thèse.
L’auteur et les coauteurs le cas échéant conservent la propriété du droit d’auteur et des droits moraux qui protègent ce document. Ni la thèse ou le mémoire, ni des extraits substantiels de ce document, ne doivent être imprimés ou autrement reproduits sans l’autorisation de l’auteur.
Afin de se conformer à la Loi canadienne sur la protection des
renseignements personnels, quelques formulaires secondaires, coordonnées ou signatures intégrées au texte ont pu être enlevés de ce document. Bien que cela ait pu affecter la pagination, il n’y a aucun contenu manquant. NOTICE
The author of this thesis or dissertation has granted a nonexclusive license allowing Université de Montréal to reproduce and publish the document, in part or in whole, and in any format, solely for noncommercial educational and research purposes.
The author and co-authors if applicable retain copyright ownership and moral
rights in this document. Neither the whole thesis or dissertation, nor
substantial extracts from it, may be printed or otherwise reproduced without the author’s permission.
In compliance with the Canadian Privacy Act some supporting forms, contact information or signatures may have been removed from the document. While this may affect the document page count, it does not represent any loss of content from the document.
Faculté des études supérieures
Ce mémoire intitulé
*ZFG: Une nouvelle approche axiomatique à
l’analyse non-standard
présenté par
Etienne Dauphin
a été évalué par un jttry coniposé des personnes suivantes
(président-rapporteur)
Monsieur Hidemitsu Saeki
(directeur rie recherche)
(membre du jury)
Dans le contexte de la théorie des ensembles, nous allons construire une nou velle axiomatisation (*ZFC) due à Di Nasso enajoutant certains axiomes à la théorie ZFC. Ces ajouts donnent existence à de nouveaux ensembles, dits non-standards.
Ajouter des axiomes crée un nouvel univers, répondant à de nouvelles lois régissant les nouveaux ensembles. Nous tâcherons de les définir pour vérifier ce que nous avons gagné par rapport à ZFC. On modélisera cette nouvelle théorie à l’aide des modèles existants de ZFC. On verra ciue tout modèle M de ZFC possède une extension finale élémentaire :M” qui -est la partie bien-fondée d’un modèle de *Zf C
finalement, on justifiera en quoi cette théorie, qui relie l’approche axioma
tique usuelle et celle des superstructures de Robinson est pertinente d’un point de vue logique et pratique. De plus, puisqile plusieurs axiomatisations en analyse non-standard ont vu le jour depuis 25 ans, on comparera *ZFC à quelques unes d’entre elles que nous présenterons. Nous soulignerons ce qu’elle apporte de nou veau (en particulier par rapport au problème de saturation illimitée), ce qu’elle améliore, ainsi que ses défauts.
MOTS CLÉS axiomatisation tZFC, modèle ion-standard, llltrapuissance (li mite)
ABSTRACT AND KEY WORDS
In the context of set theory, we will bllild a new axiomatization called *zFc This wiil be accomplished by adding several axioms to ZFC. Such additions will give hirth to new sets, which we will cail non-standard sets.
Adding new axioms creates a new universe, one that obeys to new laws that govern the non-standard sets. We will try to define this new universe and its laws,
so as to verify and, ultima.tely, understand what we gained from the ZFG theory. Then, we will try to model *ZFC based on the existent models of ZfC. A main resuit wiil be that ail modeis M 0f ZFC possess an elementary end-extension
M’—the well-founded part of some model of *Zf C.
Finally, since *ZFC connects set-theoretical approaches to non-standard ana lysis with Robinson’s superstructure perspective, we will try to prove that it is pertinent from both a logical and practical point of view. Moreover, seeing that numerous attempts at axiomatizing this theory were made in the past twenty
five years, several of these wilI be presented in direct comparison with *zFc.
This comparison will highlight new advancements *ZFC brings out—in particu lar, concerning the unlimited saturation problem—what improvements it brings, and what are its ftaws.
REMERCIEMENTS
Je tiens tout d’abord à remercier mon directeur, Monsieur $ayeki, pour m’avoir guidé, poussé et encouragé dans mes travaux. Je dois mon intérêt à l’analyse non-standard plus particulièrement à Monsieur Mauro Di Nasso, qui m’a initié à cette théorie riche et prometteuse.
Ce mémoire n’aurait pas été possible sans la précieuse collaboration de Hugues Boulanger, qui m’aura permis de surmonter et éclaircir certains problèmes, et qui a partagé mon intérêt pour la logique. Je remercie également Micheal $lattery pour ses corrections, Sébastien Manka et Nicolas Beauchemin pour tout le sup port technique qu’ils ont pu me donner, et bien sûr, je les remercie tous trois de leur amitié.
En plus de l’aide mathématique, je ne peux passer sous le silence tous ceux qui m’ont soutenu moralement durant mon travail. Je compte toutes les personnes qui me sont proches au département de mathématiques, plus spécialement Christian Coté, Dimitri Zuchowski, Gabriel Chenevert, Jérôme Fournier et Benoit Archam bault. Mes parents, Claude, Jeanne, mon frère Simon, et amis proches Meriem Debbih, Thomas Lepage, Jason Potts et Louis-Marie Colas, font partie intégrante de ce travail, étant constamment dans mes pensées.
finalement, j’aimerais dédier ce mémoire à Kefryn Thomas, qui m’a fait voir la vie comme une perpétuelle aventure toujours enrichissante, et m’a fait apprécier la beauté en toutes choses.
TABLE DES MATIÈRES
Sommaire et mots clés iii
Abstract arid key words iv
Remerciements y
Introduction 1
Première partie. La théorie *Zf C 4
Préliminaires 5
0.1. Quelques aspects de la théorie des ensembles 5
0.2. Langage et modèles 7
0.3. Filtres 14
0.4. Lexique des théories non-standards 16
Chapitre 1. Les débuts de l’analyse non-standard 17
Chapitre 2. La théorie axiomatique ZFC 31
Chapitre 3. Axiomatisation de la théorie non-standard *ZFC 35
Chapitre 4. Quelques résultats dans *ZFC 40
Chapitre 5. L’univers de *ZFC 43
5.1. Théorème des points fixes de * 43
5.3. Les éléments de *7 46
5.4. Les ultrapuissances limites et la fonction * 47
Chapitre 6. Standardisation 54
Chapitre Z. Justification de l’axiomatisation *ZFC 64
7.1. Existence de modèles de *ZFC 64
7.2. Extension d’un modèle à *pi
73 Deuxième partie. Survol d’autres axiomatisations en analyse
non-standard 81
Chapitre 8. IST : Internal Set theory $2
Chapitre 9. Théories non-standards avec un univers externe.... $7
9.1. NS1 et NS2 deux théories de Hrbek 87
9.2. NST : La théorie de Kawaï 93
Chapitre 10. EST : Enlargment set theory 96
Chapitre 11. Théories abandonnant l’axiome de régularité 104
11.1. (F) est-il ilécessaire? 104
11.2. La théorie des ensembles mal-fondés 107
11.3. Définitions inductives dans ZFC + AFA 111
11.4. La théorie ZfBC 113
Conclusion 120
Annexe 121
Ce mémoire se veut une synthèse des principales théories en analyse non standard. L’idée des preuves déjà existantes a toujours été conservée. La présen tation en a été modifiée et de nombreuses précisions y ont été apportées pour compléter la compréhension des démonstrations. Le détail de l’origine des résul tats pourra être consulté dans l’annexe à la fin du mémoire.
L’analyse non-standard a vu le jour dans les années 60, alors que l’on a re marqué que plusieurs grands mathématiciens tels Euler et Leibniz énonçaient des raisonnements tenant compte de nombres infiniment petits et infiniment grands. L’idée de vouloir donner une existence concrète et mathématiquement rigoureuse à ces nombres a motivé Abraham Robinson à créer l’analyse non-standard. Ed ward Nelson a par la suite axiomatisé cette théorie à partir de la théorie des ensembles, pour la rendre plus accessible. Ils sont certainement les deux individus qui ont le pius marqué ce champ mathématique. Si plusieurs axiomatisations sub séquentes ont tenté de résoudre certains problèmes qui subsistaient, le problème de saturation en est un qui persista longtemps. La théorie de Nelson proposait un modèle w-saturé, et on cherchait un modèle plus général qui soit k-saturé, où
k > w, en imposant le moins de conditions possibles sur le cardinal k. Il n’existe à
ce jour aucun consensus sur la création d’une théorie satisfaisant tous les critères des spécialistes. Nous suivrons lors de ce mémoire une des plus récentes théories, notée *zFc qui a tenté de régler le problème de saturation.
Ce mémoire distinguera deux parties. La première nous présentera la théorie tZFC de Mauro Di Nasso, telle que présentée dans l’article [DNj. La deuxième
tentera de situer son travail parmi les autres théories effectuées, et ce en présen tant celles-ci.
Après certains préliminaires touchant aux ensembles, aux langages, à la théorie des modèles et. aux filtres, nous verrons comment la théorie non-standard est née avec l’approche d’Ahraham Robinson dans le chapitre 1. Les chapitres 2 et 3 présenteront les axiomes de la théorie des ensembles “standards” ZFC, et de la nouvelle théorie non-standard de Di Nasso, *ZFC Nous verrons ensuite les premières conséquences de la nouvelle théorie, et nous prouverons le théorème de Tychonoif sur la compacité par une méthode non-standard.
Dans le chapitre 5, il sera question de délimiter l’univers de *ZFC et d’en trouver les propriétés. Nous exprimerons la fonction “c, cui crée des éléments
non-standards à partir d’éléments standards, comme une combinaison de deux fonctions connues en théorie des modèles.
Puis, on traitera dans le chapitre 6 des propriétés analogues aux mathéma tiques habituelles, en précisant les différences et en modifiant certaines preuves. Nous verrons certains résultats fondamentaux tels le principe de réflexion et celui de standardisation, communs à toutes les théories non-standards.
Finalement, le chapitre 7 nous présentera quelques résultats qui justifient l’uti lisation de cette axiomatisation, particulièrement comment obtenir un modèle de *ZFC à partir d’un modèle de ZFC (théorème d’extension).
On souligne que la théorie de Di Nasso ne suit pas celle de Robinson et n’a pas la même envergure. De nombreux travaux ont été effectués pendant les quarante années qui séparent les cieux théories, et l’oeuvre de Di Nasso en est une des dernières publications. Elle est le fruit de plusieurs théories axiomatiques qui se sont succédées en tentant d’améliorer les précédentes, clans le but d’en faire une théorie plus complète. Plusieurs arguments et résultats présentés dans la première partie sont d’ailleurs dus aux prédécesseurs de Di Nasso.
Ainsi, la deuxième partie nous présentera dans un ordre chrollologique l’essen tiel des autres théories noil-standards qui ont inspiré celle de Di Nasso. Nous ver rons la première approche axiomatique, celle de E. Nelson (IST) dans le chapitre 8. Se voulant chacune une amélioration de l’autre, le chapitre 9 nous présentera les théories de K. Hrbek (NS1 et NS2) et T. Kawai (NST) qui ont toutes deux résolu le même problème dans IST. Puis, D. Ballard tentera d’unifier les points forts de toutes les théories non-standards en proposant l’axiomatisation EST.
Pour conclure, le dernier chapitre s’intéressera à l’axiome de fondation, que certaines théories actuelles remettent en questioll, jusqu’au point où il peut être ahandonilé. On présentera en particulier celle de Boffa, puis 011 verra comment
Rappelons certaines connaissances de base qui seront exigées au cours de la lecture du mémoire. Nous passons outre la définition formelle d’ensemble car elle sera vue plus précisément dans le chapitre 2, et on utilisera d’ici là la conception naïve d’un ensemble. faisons un rappel des connaissances exigées pour la lecture du mémoire.
0.1.
QuELQuEs ASPECTS DE LA THÉORIE DES ENSEMBLESOn utilisera
[JI
par défaut comme ouvrage de référence pour les généralités sur les ensembles.(1) Un ensemble A muni d’une relation d’ordre est dit partiellement ordonné
si on a les conditions suivantes
Va, b, C E A, (i) a a (réflexivité),
(ii) (a < b et a b) z —(b < a) (antisymétrie),
(iii) (a < b et b < e) ‘- a < c (transitivité).
On dit aussi que < est un ordre partiet.
(2) (A, <) est dit linéairement ordonné s’il est partiellement ordonné et
Va,beA, (b<aoua<b).
(3) Soit < une relation binaire sur un ensemble A muni de l’ordre partiel .
< est définie tel que o. < b (o. < b et o. b). On dit que < est un ordre partiel strict sur A.
(4) L’ensemble A est dit bien-ordonné par l’ordre partiel strict < si et seule
V3
O
tel que B A, bo B Vbe
B tel que b bo, bo < b (B contient un plus petit élément).On dit que < est un bon-ordre sur A, et, par abus de langage, quand l’ordre est implicite, on dira que A est bien-ordonné.
(5) Soit A un ensemble linéairement ordonné, et x E A. Le segment initial de A donné par x, noté A, est l’ensemble {a
e
A a < x}.(6) Un ensemble x est dit transitif si Vy (y
e
x y C(Z) Un ordinal est défini comme un ensemble transitif, bien-ordonné par la, relation d’appartenance E.
On notera pour c et /3 deux ordinaux quelconques, ci <
/3
ce
/3 pour refléterque E est un ordre strict sur les ordinaux.
Pour tout ordinal c, ci = {/3 /3 < o}. Ainsi, on distingue trois types d’ordinaux:
• O =
O
est un ordinal par la définition de transitivité.• s’il existe un ordinal
/3
tel que c =/3
+ 1, alors on dit que Œ est un ordinal successeur • Si un ordinal o(
O) n’est pas un successeur (a n’a pas de prédécesseur immédiat), on dit que c’est un ordinal limite, et =U@<a
/3
La collection de tous les ordinaux est notée Ord. On remarque tout d’abord que pour c fini, les ordinaux définissent les nombres naturels. Le premier ordinal infini (dénombrable) est noté w, et c’est un ordinal limite.
Ainsi, w =
U<
/3
= {O, 1, 2, 3, ..
.}
est l’union des ordinaux finis. Si une propriété P vellt être démontrée pour tout ordinal, il semblerait, par la construction des ordinaux, qui fait appel aux prédécesseurs, qu’une sorte d’induction soit naturelle. Il faut bien sur vérifier la condition c O, puis si P est satisfaite pour o, alors P est satisfaite pour c + 1. Contrairement à l’induction sr N, il reste un cas à vérifier.En effet, avant de conclure, il faut remarquer que de cette manière, on atteint pas les ordinaux limites, qui ne sont pas des successeurs immédiats. Il faut donc vérifier ce cas-ci. Plils explicitement, il faut vérifier que, si c est un ordinal limite, et que P est vraie pour tout
/3
< c, alors P est vraie pour c. Ainsi, on pourraconclure que P est vraie pour tout ordinal c. On appellera ce type de preuve l’induction transflnze, ou induction sur les ordinaux.
(8) On définit la classe des cardinaux de cette façon
L’ordinal O est un cardinal; et un ordinal qu’on ne peut mettre en bijection avec un de ses prédécesseurs est un cardinal. La classe de tous les cardinaux est notée Card.
(9) L’axiome du choix est supposé dans tout ce mémoire. Il sera énoncé, SiliVi
de quelques expressions équivalentes, lors du chapitre 2 (page 33). Signalons plus particulièrement que l’énoncé suivant est aussi équivalent à 1’ axiome du choix Lemme de Zoru Soit A
0
un ensemble partiellement ordonné par.
Si tout sous-ensemble non-vide de A linéairement ordonné par < a une borne supérieure, alors A possède un élément maximal a, c’est-à-dire pour tout be
A,a<ba=b.
0.2. LANGAGE ET MODÈLES
La formalisation d’un langage ou d’un modèle est un travail pouvant deve nir assez long et pointu. On ne présentera donc que les éléments essentiels qui toucheront à la compréhension du mémoire, et la présentation du langage et des modèles que nous allons faire ne se veut pas exhaustive. Le lecteur peut se référer à CK] pour plus de précisions.
Un langage est l’ensemble des symboles à notre disposition, généralement noté L, pour traiter du sujet dont il est question. De façon générale, on distingue 3 catégories de symboles
Les constantes, généralement notées c1, e2, .
les relations, notées y,
.
et les fonctions, notées .
Notation 0.1. £ est une liste de symboles de relations, fonctions et constantes, qu’on peut écrire comme suit dans le cas où cette liste est finie
On ne sera confronté qu’à des listes finies dans les différents tangages que nous aborderons, mais en général, ta taille de £ peut être infinie. On différencie la cardmatité de L, notée jL, et ta puissance du langage L, notée := w U L
Définition 0.2. Pour formaliser un tangage de premier ordre, on a besoin de symboles logiques, distincts des éléments de L. Ainsi, on ajoute
des parenthèses
),(;
des variabtes vo, u1, . .. ;
des connecteurs A (et), (non); nn quantificateur (pour tout); et un symbole d’identité
On mentionne que les autres symboles usuels tels V,
,
—*, +—, ÷—*,\,
etc . . . nesont que des abréviations; par exemple a V b (—‘((--a) A (—‘b)))
Une suite d’éléments mentionnés ci-haut s’appelle un terme si elle répond à un des critères suivants
(i) Une variable est un terme;
(ii) Un symbole de constante est un terme;
(iii) $ est un symbole de fonction n-aire et t1,... ,t,, sont des termes, alors t) est un terme;
(iv) Si on effectue les applications (i) (iii) un nombre fini de fois, alors on obtient un terme.
Dans L, une formule atomique est définie comme suit
(O
si t1 et t2 sont des termes de L, alors t1 = t2 est une formule atomique. (ii) Si est un symbole d’une relation n-aire, et t1,.. . , t, sont des termes de L, alors (t1,. . .,
t) est une formule atomique.Une formule est définie comme suit (i) Une formule atomique est une formule;
(ii) Si et ï sont des formules, alors
(
A L’) est une formule, et (—‘) est une formule;(iii,) Si u est une variable est une formule, alors (Vv) est une formule.
(iv,) Seules les suites de symboles construites par un nombre fini d’applications des règles (i) (iii,) sont des formules.
Une sous-formule de est une suite de symboles cons écutifs dans qui décrit
elle-même une formule. Voici un exemple Soit : (Ex(x E y)) A (Vy(z y)).
x E y, Ex(x E y), z y, Vy(z
Ø
y) et elle-même sont toutes les sous-formules de . On dira qu’une sous-formule de (dfférente de 5) est plus courte que .Une liste de formules c/, . . . , j, est dite “sous-formule close” si pour tout
j
e
{1. 2, . . . , n}, toute sous-formule de bj est incluse dans la liste.Toute cette formalisation nous sera utile entre autre pour l’élaboration de preuves par induction sur la longueur des termes ou des formules. Nous verrons ces exemples de preuves dans les résultats 1.7 et 6.’.
Ainsi, pour s’assurer que pour toute formule , on a la proprzété P, on com
mence par vérifier que P est vraie pour toute formule atornz que. Puis, en considé rant toutes les façons de construire une formule (par tes connecteurs logiques A,
, et le quantificateur V) à partir d’autres formules vérifiant P, on s’assure que
la nouvelle formule satisfait aussi P.
De la même façon, pour s’assurer que pour tout terme t, on a la propriété P, on commence par s’assurer que P est vraie pour une variable, une constante, et une fonction. Puis, en retournant à la définition de terme, on vérifie qu’en effectuant les applications (i,) (iii) avec des termes qui satisfont P (un nombre fini de fois), on obtient un terme qui satisfait P.
La portée d’une occurrence d’un quantificateur v (respectivement Vu) est
l’unique sous-formule commençant par ce Eu (Vu). On dit que le quantificateur agit sur y.
L’occurrence d’une var’iabÏe dans une formule est dite liée si ette est dans ta
portée d’un quantificateur qui agit sur cette variabte. Dans te cas contraire, l’oc
currence de cette variable est dite libre.
Par exempte, dans la formule (Eu(v
e
w)) A (Vz(z u)), u est liée dans lasous-formule Eu(v
e
w) mais libre dans ta sous-formule Vz(ze
u).Une formule ne contenant aucune variable libre est dite un énoncé.
On note t(uo,. . . u,) un terme dont tes variables forment un sous-ensemble
de {VO,.
On note d(uo. ... , une formule dont les variables libres forment un
sous-ensemble de {vo, .. .
On note que quand le contexte sera assez clair, on omettra les parenthèses dans tes formules.
Définition 0.3. Soit P une formule. pA est dite la formule relativisée à A si
toute occurrence de “Ex” et ‘x” dans P est remplacée dans p’ par “Ex
e
A” et ‘Vxe
A” respectivement.Définition 0.4. On note et définit une structure 2 pour un tangage comme une
liste que l’on présente de la manière suivante
2t= (A;P;P;OEki E I,j
e
J,k K)où A est un ensemble non-vide, te domaine de 1, ]j (respectivement fii) est une liste de relations (Jonctions) ,u(i)-aires (v(j)-aires) sur A, et dk sont des
constantes A.
i (ii) est une fonction de I (J) dans N.
La théorie des modèles a comme sujet d’étude l’interprétation d’un certain langage. C’est maintenant une branche indissociable de la logique. On y décide entre autre de la validité d’une proposition.
Les éléments d’un langage n’étant qu’une liste de symboles qui n’ont a priori aucune signification, il faut maintenant leur donner un sens, une interprétation.
L’interprétation de £ est appelée rnodète pour L, notée U. On écrira U rr £ pour dire que U est un modèle pour L.
Il est à noter qu’il existe plusieurs interprétations (modèles) d’un même langage.
Il faut maintenant considérer ce qui constitue un modèle. Attardons-nous à ce dont £ veut parler. L a été créé pour discuter d’un certain domaine des mathé matiques. La collection des objets mathématiques considérés par £ sera appelée un univers, qui sera un ensemble noté A. A est donc une composante du modèle.
Maintenant que nous avons à disposition les objets mathématiques concernés, il faut donner un sens aux éléments de L. L’autre composante du modèle est donc unefonction d’interprétation I, qui à chaque élément de £ attribue un sens à cet élément.
Ayant ainsi deux composantes, on peut noter le modèle U = (A,I). L’in terprétation d’un symbole à n places est une relation n-aire R C A” sur t. l’interprétation d’un symbole à ‘m places est une fonction F : A, et l’interprétation de tout symbole de constante e est une constante r E À. Ainsi, un modèle aura la forme d’une structure définie plus haut.
Voyons plus formellement la définition d’un modèle
On note U = (xo, . . ., x) pour dire que la formule est satisfaite par la suite
Xo, .. . ,
Xq
dans U, ou de façon équivalente, que x0,. ., satisfait dans U, ou
encore que U est un modèle pour çb[xo,. . .
,Xq].
La définition se fait en trois étapes1
La valeur d’un terme t(vo,. . . , vq) ik),. .
,
rq,
notée t[xo,. . .,Xq]
est définiecomme suit
(i) si t v, alors t[xo, . . . ,
xq]
=(ii) Si t est symbole d’une constante, alors t[xo,. , x,j est l’interprétation de e
dans U, où e est une constante de A;
(iii) Sit = (t1,. . . , fin) est un symbole de fonction à ru places, alors t[o,. ..
F(ti[xo, . . . , x], . . . , tm[2j, . . . ,
Xq]),
où F est l’interprétation de F dans U.z
(i) Si «vo,. . . ,v) est la formule atomique t1 = t2, oùti(vo, ... ,vq) et t2(vo, . . . ,v)
sont des termes, alors U z= (t1 = t2)[xo,. . . ,x] si et seulement si t1[xo, . . . , Xq]
t2[xo, . . . ,
Xq]
(ii) Soit «vo,.. . ,vq) la formule atomique (t1, . .. , ta), où
7
est un symbole de relation à n places et ti(vo, . . . ,v), . . . ,t,,(v-j, . . ,vq) sont des termes. AlorsU (t’,. . . ,t)[xo, Xq] si et seulement si Rt1[xo,. . . ,;q] t[xo, . . . ,
3
Soit une formule de £ dont toutes les variables (libres 011 liées) sont parmi y0,.. .,vq.
(j) Si est de la forme 6 A 2, alors U «Xo.. ,
Xq]
si et seulement siU &i[X, . . . ,
3q]
et U(ii) Si est de la forme O, alors U . .
.
,;;q]
si et seulement si non U rq](lii) Si est de la forme (Vv), où i < q, alors U
xq]
si et seulement si pour tout x é A, U 9[xo, .. . , ,i+i,. . . ,q].
Ceci complète notre définition.
Soit un énoncé dont toutes les variables liées sont prises parmi la liste
y0,. . . , vq. On dit que U satisfait à (on note U rz=
)
si et seulement si il existeune suite x0, . .
,x telle que U q5[xo, . . .
Défiiiitioii 0.5. Considérons U = (A,
)
et U’ = (A’, Y) deux modèles du même tangage L; R et R’ leur relation respective. On dit que R’ est ta relation corres pondante à R si elle est t’mterprétatzon du même symbole retationnet dans L.Défiriltioii 0.6. On appelle une théorie Th ou T un ensemble d’énoncés. On peut aussi présenter la théorie comme l’ensemble des formules que l’on peut déduire
d’un ensemble d’axiomes de cette théorie.
Un ensemble d’axiomes de T est un ensemble d’énoncés ayant tes mêmes consé quences que T. En fait, une théorie est te plus souvent présentée par ta liste de ses axiomes. Si U est un modèle pour L, alors ta théorie de U est
Th(U):={U}.
On peut donc parler d’un modèle d’une théorie, où chaque axiome y est valide. De plus, une structure 2t est un modèle pour T si 2t pour tout b E T.
Voici quelques définitions de bases pour pouvoir comparer certains modèles.
Définition 0.7. Soit U = (A,I) un modèle pour L. Si £ subit une extension L’ = £ U X, U peut donner une interprétation aux éléments de X, nommée ï’.
On obtient un modèle U’ = (A,IUï’) pour L’.
U’ est dite une expansion de U à L’, et U est dit la réduction de U’ à L. Définition 0.8. Soient U (A,ï) et U’ = (A’,I’) 2 modèles.
On dit que U’ est un soils-modèle de U (ou que U est une extension de U’), et on note U’ C U, si A’ C A et:
(i) Soit R’ une relation de U’ à n places, alors R’ = Rfl(A’)’2, où R est ta relation correspondante à R’ dans U.
(ii,) Soit F’ une fonction à m places de U’, alors F’ = F(A/)m, où F est la fonction correspondante.
(iii) Toute constante de U’ est ta constante correspondante de U. Définition 0.9.
(1) Deux modèles U et B sont dits élémentairement équivalents si pour tout énoncéq, ona:UB=b.
(2) Deux modèles U et U’ sont dits isomorphes (ù’ U’) s’il existe une bijection
(i) Pour tout relation n-aire R de U et la relation correspondante R’,
Vx1, . . . ,x A, R(xl x) si et seulement si R’(f(xi),. . . ,f(x)).
(ii)Pour toute fonction à in ptaces G de U et ta fonction correspondante G’, Vx1, . . . ,x
e
A, f(G(x;,. . . , Xm)) = G’(f(xi),. . . f(x)).(iii) Pour toute constante x de U et la constante correspondante x’ de U’, f(x) = x’. (3) On dit que un modète U est plongé de façon isomorphe dans U’ (U L U’) s’il existe un modèle B et un isomorphisme
f
tel quef
: U B et B C U’.(4)
U est un sons-modèle élémentaire de U’ (ou que U’ est une extension élémen taire de U’), noté U —< U’ si:(i)UCU’
(ii)Pour toute formule «x1,. . . ,x,) de £ et tout a1,. . . , a,, e A,
(5) SoientU etB modèles tels queU A etB B. On dit que
f:
A — B estun plongement élémentaire de U dans B si et seulement si pour toutes formules «z1,.. . , z) du langage £ considéré, et a1,. . . , a, e A, on a U «ai,. . . ,a,) B j= «f(ai),.. . f(a,)], où
f
est une injection.En d’autres termes,
f
est un plongement élémentaire si et seulement sif
est un isomorphisme de U sur un sous-modèle élémentaire de B. On noteraf
: U —< U’.(6) On dit que le modèle U est plongé de façon élémentaire dans un modèle B (notéUB) siULB etU-B.
0.3.
FILTREs Définition 0.10.Soit X un ensemble non-vide, et P(X) l’ensemble de ses parties.
On appelle filtre sur X tout ensemble F c P(X) qui vérifie les 3 conditions suivantes
siA,BF, atorsAflBeF; siAcC etAF, atorsCF.
On peut mentionner comme exemptes te filtre trivial {X}, et te fittre impropre P(X). On appette’ra tout fittre qui n’est pas impropre un filtre propre.
Définition 0.11. Soit E
e
P(X). Soit V = fl{F Ee
F et F est un filtre SUTX}. On appette V te filtre engendré par E. Proposition 0.12.
Soient X un ensembte, A C P(X) et F te fittre engendré par A.
F est l’ensemble de tous tes B P(X) tels que B X ou il existe un nombre fini de B1,. . . ,B,
e
A tet que B1n... n
C B.Démonstration
Soit F’ l’ensemble de tous les B P() tels que B X ou il existe B1,. . . , B
e
A tel que B1n.. n
B. C B. On veut montrer que F’ = F.Ou adéiàX
e
F’. Soit B1,B2e
F’ tels que Vil> i > nVj I >j>
ra, },}EF’,etYifl...flYflCB;etY’ifl...flY’,flCB2.SiBicZcX,alorsYfl..:.flrc:Z,doncZeF.
De plus, Y1
n
. . .n
Y fl Y’1 fl . . . fl Y’m C B1n
B2, donc B1n
Be
F’. Ainsi, F’ est un filtre sur X. On a aussi A C F’, donc F C F’.Considérons maintenant un filtre V sur X tel que A C V. On a donc X
e
V. PourtoutY1,...,YA,onaY1fl...flYV,doncpourtoutBeP(X)telqueY1n...nYcB,BeV. Ainsi, F’ C V, d’où F’ C F, et F’ F.
D
Définition 0.13.
(1) Soit F un fittre propre sur X. On dit que F est un ultrafiltre sur X si on a ta condition suivante : Si Ç est un filtre propre sur X et F C Ç, alors F = Ç. (2) Un uttrfittre V est dit incomplet de façon dénombrable s ‘il existe un en semble dénombrable E C V tel que
fl
EØ
V.Théorème 0.14. (Principe de Ï’uttrafittre) En supposant Ï’axiome du choix,
si V est un filtre propre sur un ensemble I, alors il existe un ultrafiltre V’ sur I tel que V Ç V’.
Démonstration
On pose F : {F V C F et f est un filtre propre sur I}. F
O
car V E F. Soit F’ C F, où F’ est non-vide et est lilléairemellt ordonné par C.Soit G
UFF’
F.PourtoutFEF’,VCF,donconaVCG.
Si G est un filtre propre dans F, alors G sera une borne supérieure de F’ dans F. On voudra alors appliquer le lemme de Zorn. Montrons que G est un filtre propre
O
G car sinonO
E F pour un certain F E F’, et tous les F sont des filtres propres.Soient G1, G2 E G, il existe F1,
F2
E F’ tels que G1 E F1 et G2 E F2.OnaF1 CF2ou F2CF1,doncGy,G2EF 011 G1.G2EF2. F1 et F2 sont des
filtres, donc G1
n
G2 E F ou G1n
G2 E F2. Dans les dellx cas, G3n
G2 E G.finalemeiit, Soit G1 E G et G3 C G2. Ti existe un fi]tre F E F’ tel que G1 E F,
donc G2 E F, et G2 E G. Donc G est un filtre propre.
Ainsi, F’ possède ne borne supérieure dans F. Par le lemme de Zorn, F
possède un élément maximal V’.
Donc V’ E F et V’ D V. Le fait que V’ soit maximal nous assure que c’est un
ultrafiltre. D
0.4.
LExIQuE DES THÉORIES NON-STANDARDSLa théorie non-standard se propose de poser les fondements pour dollner une
réalité à des quantités infiniment petites et infiniment grandes, puis pour per
mettre leur utilisation. Dails cette optique, voici quelques termes qui reviendront au cours de ce mémoire.
Défiiiition 0.15. Plaçons nous dans le contexte de l’ensemble des naturels N. On appelle x un nombre illimité si x > n Vu E N.
LES D1BUTS DE L’ANALYSE
NON-STANDARD
C’est â Abraham Robinson que l’on doit la création de ce champ rnathéma tique. C’est dans les années 60 que cette branche a vu le jour, et ce, grâce â l’ouvrage de Abraham Robinson, IVon-standard anaÏysis en 1961 (voir[Rj). Pré sentons cette théorie dans ses grandes lignes. en suivant la présentation de [f J].
Son approche était de construire de nouveaux éléments mathématiques â par tir de ceux existants, et n’utilise pas la iriéthode axiomatique. Partant principa lement du fait que certains grands esprits mathématiques tels Leibniz et Euler avaient considéré les concepts de nombres infiniment petits et infiniment grands, il a créé un modèle qui permettait l’existence de ces éléments “idéaux”, tout en
imposant certaines contraintes que nous verrons prochainement.
On soulignera que l’on présente son approche car elle est historiquement la
première, mais le lecteur réalisera qu’elle n’est certainement pas l’approche â
l’analyse non-standard la plus simple ni la plus naturelle, faisant appel â certains
concepts difficiles â gérer.
Un élargissement de structure, l’idée centrale de son travail, est une fonction
*
X — X’ pouvant s’appliquer â toute structure X. On se restreindra au cas
où l’univers X0 de X est infini, car c’est dans ce cas que l’on voudra rajouter des
Tout élément de est appelé interne, et tout élément de X/\*X est externe.
Tout élément de X’ qui appartient déjà à X est dit standard.
Nous tâcherons de construire ce modèle par la méthode des ultraproduits. Par son existence, ce modèle nous assure de la consistance de la théorie non-standard, et nous verrous que la plupart des autres théories non-standards utilisent le même genre de modèle. Nous ferons une introduction générale aux ultraproduits avec sou théorème principal, puis nous présenterons la construction spécifique à Ro binson.
Commençons par construire le produit réduit, dont l’ultraproduit n’est qu’un cas particulier
Soient I un ensemble non-vide, et V un filtre propre sur I. Soit {A j I} une famille d’ensembles non-vides.
Soit C =
fl
A le produit cartésien. On peut interpréter C comme l’ensemble des fonctionsf
définies sur i à valeur dansU1
A, tel que pour tout i, f(i)e
A.Définition 1.1. Soient f,g C. On dit que
J
et g sont V-équivalentes{i
e
I f(i) = g(i)} V. On noteJ
= g. Ceci définit une relation d’équivalence, nous permettant de parler de ta classe d’équivalence fv = {g E C
I
f
=v g}.Remarque 1.2. Vérifions que = définit une relation d’équivalence.
(i) Il est évident que
f
= g = g =vf.
(ii) De plus, {i
e
I j f(i) = f(i)} = I, et Ie
V, doncf
=vf
(iii) finatement, soient
f,
g et h 3 fonctions définies sur I. Sif
= g et g v h,ona{ieljf(i)=g(i)}eDet{iel g(i)=h(’i)}eV;donc
{iI f(i)=g(i)}fl{ieljg(i)=h(i)}={iel f(i)=g(i)=(i)}eV. Or, {i
e
I f(i) = g(i) = h(i)} C {ie
I f(i) = h(i)} C I,Définition 1.3. Le produit réduit de la famille des A modulo D est Ï’ensembte des ctasses d’équivalences de =D, noté flDAj.
llAi={fv
fec}.
Définition 1.4.
(i) L ‘ensemble I sera appelé l’ensemble d’indices du produit réduit
fl
Ai; et dans te cas où D est un uttrafittre, on appellera te produit réduit un ultraproduit. (ii) Dans te cas où tous tes ensembles A sont te même ensembte A, on partera de puissance réduite au lieu de produit réduit, et d’ultrapuissance au lieu d’ultra-produit.Voyons maintenant ce que représente un produit réduit de modèles
Définition 1.5.
Soit £ un tangage, I un ensemble non-vide, et D un filtre propre sur I. Four tout i E I, soit U un modèle pour S.
Dans U, tes symboles de relation sont interprétés par R, tes fonctions par F, et les constantes e par a.
Le produit réduit
fl
U est le modèle de S qui satisfait les conditions suivantesI I
(1) L unzvers de
flU
est ou A est lunvers de U.(2) Soit
7
dans £ le symbole d’une relation n-aire. L’interprétation de dansI
fl
L4 est la relatzon S telle que S(f. ..
f)
si et seulement si {i E I R(f’(i) . . .ffl(i))}
e
D.(3) Soit dans £ un symbole de Jonction à n places. est interprétée dans
fl
U par la fonction G telle que: G(f. ..
f)
= (F(f’(i). . . f(i))
Ii
E I).()
Soit e une constante dans L. e est interprétée par un élément be
fl
L4 tel queRemarque 1.6.
flU
est bien défini. En effet. S(f.1,..f)
et G(f...f)
ne dépendent pas des Teprésentants fi,. .,
f’
des ctasses d’équivalences, car tes i qui vérifient F(f’(i) . . f(i)) et R(f’(i) . . ffl(i)) sont quotientés par V.De façon informelle, on peut voir les éléments d’un ultraproduit comme les propriétés qui sont vraies sur la “plupart” des A (c’est-à-dire les i pour lesquels la propriété est vraie dans A forment un élément de l’ultrafiltre). L’intérêt de l’ul trapuissance vient du fait que les A sont tous les mêmes, ainsi, l’ultrapuissance regroupe les propriétés vraies dans A.
Présentons le principal résultat sur les ultraproduits, due à Los (voir [CK]). Théorème 1.7. (Théorème fondamental des ultraproduits)
Soit £ un langage, B = (B, J) un uttraproduit Alors on a:
(i Pour tout terme t(1,.. . de £ et pour
f,.
..
,f
e
B, on a tB[f. ..
f]
(t[f1(i) . . . (i)]I
i E I)(ii) Soit .
.
)
une formule de £ etf,.
.,f
V, alors on a:B Q5[f.. . .
,
J]
si et seulement si {i I t [f’(i) . . J”(i)]} E V(iii) Pour tout énoncé b de L,
B si et seulement si {i é I U =
}
e
V Démonstration(i) et (ii) se feront par induction, respectivement sur la longueur du terme, puis sur la longueur de la formule. (iii), le résultat central du théorème, est une consé quence de (i) et (ii). C’est le cas particulier de (ii) où n’a aucune variable libre.
(i) En retournant à la définition d’un produit réduit, on voit que (i) est vraie quand t(x1,.. . ,x) est un terme de la forme (x1,. . .
),
ou alors t(y, . . .,
x,) est un symbole de constante ou une variable. En effet, dans ces trois cas, on a af faire à un élémentfv
de l’ultraproduit, qui est bien une classe d’équivalence desf
modulo V. Supposons maintenant que t(1,. ..,
n) = (t1(1,. . .
,
Xn), - . .,
tm(X1,...,
Alors, par la définition de l’interprétation de termes
[41 çnl — (# [fi fnl . [fi fnfl
JV] — i1]V JV] v?flt1V.
où G est l’interprétation de dans B.
Par hypothèse d’induction, pour t,. .. ,t,, on a pour k 1,. ,ni; tkB[f.
JE]
= = (tku[J1(i) .f(i)
I).Par la définition (3) du produit réduit, G(g. . .g) = F(g1(i) gm(j)) e I).
Par la définition de l’interprétation des termes, t1[f’(i) . .
. ffl(j)]
= F(g’(i). .
.
g(i)). En combinant les deux résultats précédents, on obtient
• .
.
JE]
= G(g. . . g) = (t[J’(i) . . .i e I) Ainsi t(x1 . . . x,) satisfait (i).
(ii) Montrons (‘ii) pour le cas où est une formule atomique. Soit t = t2, où t1 et t2 sont des termes deS, et
f,
. . .
,J
B. On a i i_ -— 1-1B1Jv, • • , JVJ — 2B[j, ‘1v B (ti[f’(j) . . . f(i)]ji E I) = (t2.[J’() .. . Jfl(j)] j e I) par (j) {j E I j U tiu.[f’(i) •. ffl(j)] = t2u[f’(i) . . . ffl(j)]} V Uç5}eV.Soit R(t1,. . ,t), où t1, • . ,t sont des termes de L, un symbole de relation
k-aire,etJ,...,fEeB.Ona:
2I=,rf1 fr1
- Y1]v Jv
B j=
$(f,,.
•,
J)
où $ est l’interprétation de dans BB $((tiu.{J1(i) . . . ffl(j)] j e I),..., (tku.[J’(j) . . . Jfl(j)]jj e I)) par (j) {j e I U R(t1.[f’(i) . . . ffl(j)], • ,t[f’(i) . • . ffl(j)]}) e V Uj=}eV.
Supposons que . . .x) satisfasse (ii) et = -1?J)(r1 . . .x). On a alors les
équivaleilces suivantes
{ieI M
0V
<> {i
e
I 11011 M[=
b[f’(i) . .. ffl(j)]}
E V car V est un ultrafiltre
{i
e
I M [J’(i).. ffl(j)]}e
V.Prouvons maintellant que si ) et O satisfont (ii), alors q
=
b A O satisfait (ii).Les lignes suivantes sont équivalentes
{i
e
II
U [J1(i) ...ffl(j)]}e
V et {ie
I U O[f’(i) fl(j)j}e
V{i
e.[
l ..
.f’(i)] et M O[f’(i) . . .r(i)]} V car X nY
e
V X,Ye
I{i E I U [f’(i) fl()]}
E V.
Prouvons maintenant que si (Xo,xi.. . . ,x,) satisfait (ii), alors
(x1,. . . , x)
=
xo (xo,xi,. . . ,x) satisfait (ii).On a les équivalences suivantes
(*)
Puisque U . .
J]
implique que M b[J. . .fa],
on a:De plus, si (**) est satisfaite, o peut choisir une fonction
f°
dansfl
A telleque
(*)
soit satisfaite.Ainsi (*)
(**),
et(**) ‘ 13
. .
JE].
Ceci complète notre illductioll pour (ii).Revenons maintenant à la théorie de Robmson, où ce dernier résultat nous intéressera. On construira une ultrapuissance avec un ultrafiltre non-principal (pas engendré par un unique élément), pour y faire apparaître de nouveaux éléments. On remarque que le langage usuel utilisé en mathématiques possède un nombre fini de symboles, et qu’une formule est constituée d’un nombre fini de symboles, si bien qu’un langage de premier ordre (celui défini dans les préliminaires) ne donne accès qu’à un nombre dénombrable de formules. Cependant, il existe des énoncés qui traitent de sous-ensembles arbitraires, ou de fonctions arbitraires, bien qu’ils ne soient pas à la portée du langage de premier ordre. Ainsi, on ne peut pas décrire tous les sous-ensembles de N par une formule, car il y en a un nombre non-dénombrable. Voici un ajout au langage pour traiter de tels énoncés. On définit la notion de type comme suit
Définition 1.8.
(1) Le nombre O est un type;
(2) Soit n
e
N, et T(1),. . . ,r(n) des types, alors ta suite (T(1),.. , T(n)) est untype.
Soit T l’ensemble de tous tes types, et M un ensemble quelconque. On associe à M un ensemble MT de telle sorte que
(i) M0 = M;
(ii) Si T(1),.. . ,T(n) sont des types et T = (T(1), . . . ,T(n)),
aloTs MT — P(M(i) X ... X
Les éléments de MT sont des objets de type T sur M, ou des ensembles de type T Si T O. En fait, si T O, un ensemble de type T est dit un ensemble d’ordre
supérieur. Un ensemble d’ordre supérieur se distingue car il contient comme élé ments des objets et des ensembles de ces mêmes objets (par exemple N U P(N)). Ainsi, N0 = N, N(o) = P(N), et N(o,o) = P(N x N).
Pour tout ensemble A d’ordre supérieur sur M, on considère XA1,XA2,... une suite de variables. On définit les formules de langage d’ordre supérieur, noté £œ(M), ainsi:
Définition 1.9.
(a) X = X, XA = a et a = b sont des formules pour tout ensemble d’ordre supérieur A, pour tout a, b E A, et pour tout i,
j
E N;(b) Si A(l),. . . , A(n) sont des ensembles d’ordre supérieur, A(O) est contenu dans
P(A(l) x ... x A(n)), et pour tout y entre O et n, ou bien t, est une variable de
ta forme XA(),(), ou bien un élément de A(v) ; alors (t1,. . . ,t,)
e
to est uneformule;
(e) tes négations et disjonctions de formules sont des formules; et
(d) si est une formule, alors pour tout ensemble A d’ordre supérieur et pour tout i
e
N, XAe
A@) est une formule.Soit *N une exteilsion élémentaire de N. N(o) = 73(N) et (*N)(o) =
La structure de second ordre *N U P(*N) n’est pas une extensioll élémentaire de N UP, car il faudrait que toute formule vraie dans la seconde reste vraie clans la première, or le principe d’induction ne se transfert pas
VX E N(e) ((1 E XAVx
e
N (x E X ± 1e
X)) Vx E N; E X),OÙ 011 remplace N par *N, N(o) par *(N)(0), et X N, l’énoncé ne tient plus.
Pour retrouver les propriétés d’une extension élémentaire dans des ensembles d’ordre supérieur, on devra restreindre nos quantificateurs qui portent sur les
sous-ensembles de *N de telle sorte qu’ils portent sur un sous-ensemble propre de *(N)(o) qu’on notera *N(D) le sous-ensemble interne de *N Voici sa construction
On vellt construire une extension élémentaire d’une structure saturée quant aux relations d’ordre supérieur. Soit Mun ensemble, muni d’une structure d’ordre supérieur. On définira un élargissement comme un modèle d’une théorie d’ordre supérieur, qi devra satisfaire à 3 conditions. Nous énoncerons ces conditions en justifiant leur choix, puis on construira un modèle dont on prouvera qu’il satisfait à nos 3 conditions.
Soit x un objet de type T dans M. S’il lui correspond un objet * de *M de
même type (c’est-à-dire est un élément de (*M)), on dira que *;
est standard. En fait, M,- lui-même est un élément de M(,-). Il correspond donc à un élément
*tM) de (*j1/f)(T) et par la définition inductive. *(AI) est un sous-ensemble de
(*/lj)
Les éléments de *(M) seront dits internes et les éléments de (*M) \*(jlvI) ex terri es.
On note que si T(1),.. . ,T(n) sont des types, et que R C Mr(1) X... x M7(,1), alors R est une relation de type T sur M (où r — (r(1),. . . ,r(n))). Ainsi, *R est une
relation de type T sur ]f (*R
e
(*M)T * (*J)r x ... x (*M)T(n)) Par coiltre, la condition 1 e exige un peu plusCondition 1 : Les éléments d’une relation n-aire standard sont des n-tuples dont les coordonnées sont internes.
Formellement, si r(1),. ,T(n) sont des types et que R C MT(1) X ... X MT(fl),
alors *R ç *(f(1)) X ... X
Maintenant, soit R = {(a1, a()
e
MT(n xI
M a)}une relation définie par . La condition 2 nous assrire que
{(Oi.. . . ,a)
e
M) x ... x M() M a)}. c’est-â-direqu.e les extensions élémentaires conservent leur belle propriété
Condition 2 : Soient A1, . .A,, des ensembles d’ordre supériellr, et (XA1,(1),. . . ,
une formille de £(M). Si a
e
Ai,, où u 1,... alors M (a1, . . . ,a,) t.’ *M *(*ai,... *a)Ainsi, a E M,- implique que *a E *(M7), assurant de cette façon qu’un objet
standard soit interne. Voici quelques consécfuences de cette condition
(1) (x,yeMretxy)*x*y;
(2) La fonction canonique
f
M.,- —f *(Mr) telle que f(a) = *a est injective; (3) Soit R C A1 x ... x A, et ae
A1 x ... x A,,.Si a *R, alors a
e
R, de telle sorte que *R O (A1 x ... x A,,) = R, et *R estLa dernière condition à nos élargissements, est qu’ils apportent effectivement de nouveaux éléments à l’ensemble de départ.
Définition 1.10. Soit A et B deux ensembles d’ordre supérieur de M. Une re
lation bznazre R C A x B est dite concoura;ite si pour tout n E N,
a1, . . ,a E A b E B tet que (ai, b) E R, où i = 1,. . ,n.
Condition 3 : Soit A et B deux ensembles d’ordre supérieur de M et R C A x 3
une relation concourante.
Alors il existe b E *B tel que pour tout a E A, (*a, b) E *R.
Cette conditioll prend le noni de concourance, compacité, ou alors d’idéali sation dans la littérature, comme nous le verrons au fil de ce mémoire. Elle est présente dans toutes les différentes approches à l’analyse non-standard. Voici deux résultats principaux découlant de cette condition
Corollaire 1.11. Soit A un ensemble infini d’ordre supérieur de M,
alors A
Démonstration
On sait que la relation 4 est concourante. Par hypothèse, pour tout a1,.. . ,a, E A, il existe a E A tel que Vi E {Ï,. . . ,n} a a car A est infini. Par la condition 3, il existe b E *A tel que pour tout a é A, a
Ø
b. Les éléments de *A\A sont dits non-standards.D
Corollaire 1.12. N est un sous-ensemble externe de *N
Démonstration
Par le corollaire précédent, *N possède un élément non-standard e. Puisqu’il n’existe pas d’élément entre n et n + 1 dans N, il n’en existe pas non plus dans *N Si l’on considère l’extension *
< de la relation < sur *N e est plus grand que tout élément de N. Ainsi, N est borné dans *N
VA
e
N(o) ((be
NVae
A a < b) E A Va E A a e). Si on interprète cette formule dans tN, tout sous-ensemble borné interne de *N a un élément maximal. N n’a pas d’élément maximal, donc il est externe.D
Corollaire 1.13. Soit A un ensemble interne. Si Va
e
A, a est standard, alorsA est fini.
Démonstration
Supposons le contraire. Soit A infini. Il existe une surjection
f
: A -—— N. Parhypothèse, tous les éléments de A sont standards, donc A est standard, et
f
eststandard, et
f
a une extension standard*f
*A _.*
Par la condition 1, les
ensembles internes de *A sont envoyés sur des ensembles internes de *N par
f.
De plus f(A) = N est un sous-ensemble interne de *N contredisant le corollaire
précédent.
D
Maintenant que nous avons défini les élargissements comme les éléments ré
pondant aux. 3 conditions, montrons qu’ils existent, et ce en les c)nstru1sar1t par
la méthode des ultraproduits.
Soit V un ultrafiltre sur I. Soit B un ensemble. Identifions P(B)’/V avec un
élément de P(B’/V) de la façon suivante
Pour chaque A
e
P(B)’/V, soit A la ième coordonnée d’un représentant de A(on rappelle que A est une classe d’équivalence). Identifions A avec l’ensemble
A’={aeB’/V{ieIaeA}eV}.
Par la suite, nous verrons que les sous-ensembles standards de P(B’/V) sont
ceux de la forme A’/V (où A E P(3)).
Nous verrons que ses sous-ensembles internes seront les éléments de P(B)’/V, et
que ceux qui ne sont pas internes seront externes.
Ainsi, si B est un ensemble infini, son identification “diagonale” avec un élément
La famille d’ensembles internes P(B)’/V est munie d’une structure d’algèbre de Boole, et son identification avec un élément de P(B’/V) préserve cette struc ture.
De façon similaire, les ultrapuissances commutent avec des produits directs finis:
Soient B1, . . . ,B des ensembles. On identifie de façon canollique
(Bi x ... x B)’/V avec Bf/V x ... x B/V.
Ell particulier, si R C B1 x... x H, alors ((B1 x.. . x B) flR’)/V = R. De plus, on note qu’ulle injection jC
t A —* B d’ensembles définit de façon callollique uiie injection
f’:
P(A) P(B).Nous avons maintenant tous les outils pour construire l’élargissement de M.
Soient A et B deux ensembles d’ordre supérieur sur M, soit R une relation binaire concourante R C A x B, et soit a A. Posons W l’ensemble de tous les quadruplets (A, B, R, a).
Soit 1 l’ensemble des sous-ensembles finis de W. Pour tout j I, on défiuit l’en semble D =
{j
II
j CPuisque pour tout , i’ I D Fi DUj’, il existe alors un ultrafiltre V de I
qui contient chaque D. Eu effet, {D i E I} C F {E C I i I D C E}, et F est un filtre propre. Par le principe de l’ultrafiltre (voir le théorème 0.14), il existe un ultrafiltre qui contient F, et on choisit V comme cet ultrafiltre.
Définissons maintenant *M = *y
M’/V.
Par induction sur les types non-nuls, on identifie les ultrapuissances M/V avec un sous-ensemble *(M) de (*M)T.
Plus précisément, Soit r = (T(1), . . . ,r(n)). Ou identifie M()/V avec *(MT(j))
Puis, on considère MT = P(M(l) X X MT(fl)). Soit (A’i) C P(M(l)/V X X M()/V) = P(*(M) x ... x C X ... X (*M)) = (*]/f)
Vérifions maintenant si cette construction respecte bien nos trois conditions Condition 1:
Si R E AIT (c’est-à-dire R C M.,-q) X ... X MT(n)), alors définissons *R comme
l’ultrapuissance R’/V, et considérons-le comme un sous-ensemble de M(1)/V x
x M()/V *(M) X ... X
Ainsi, R est un élément de (*M)T et la condition 1 est vérifiée.
D’un autre côté, le plongement canonique Mj,- — M/V identifie R avec un
élément de M/V *(M). Mais on a montré que cet élément est bel et bien *R Cet argument reste valide pour T = O, donc si a M, alors *a est l’élément correspondant de iW = M’/V.
Condition 2
Soit A1, . . ,
4,
une suite d’ensembles d’ordre supérieur. Soit (XA1,j(1),. . . ,X)
une formule de œ(JVI), et soit a *4,,, = 1, . . . ,n. Alors, par le théorème fon damental des ultraproduits,
*M *ç(ai,. . .
, a) {i E I M (ai, ... ,ai)} E V. (1)
où est la ième coordonnée d’un représentant a E A/V = *4,• En particulier, si a A, = 1,...,n, alors,
*M *(* .. a) i/I
«ai,..., an). (2)
Condition 3
Soit une relation binaire concourante R C A x B.
à i, alors (a, b)
e
R.L’élément b est la ième coordonnée d’un représelltallt d’un élément b
e
*3B’/V.
Si a0
e
A, alors j0 = {(A, B, R, ao)}e
I et (ao, b) ê R pour tout i ê D0.Par ilotre construction de V, on a {i ê I (ao, b)
e
R} ê V, donc par le théorèmefondamental des ultraproduits, (*ao b)
e
*3 Ainsi, la condition 3 est respectée,et *M est un élargissement de la structure d’ordre supérieur de M.
Ainsi, Robinson a pu construire ces éléments dits non-standards. Cependant, cette extension n’est pas unique et dépend du choix de notre ultrafiltre. Il existe donc une infinité de superstructures *N par exemple. Si certaills logiciens voient ce manque d’universalité d’un mauvais oèil, nous verrons qe cette idée sera reprise dans le chapitre 10, par une autre théorie non-standard.
Un handicap plus évident à la théorie de Robinson est l’utilisation constante
des types, pour se référer aux ordres supérieurs. Cela engendre une notation très
lourde et une application peu naturelle.
En fait. la quasi totalité des théories non-standards qui suivirent l’invention de Robinson ont tenté d’éviter le problème des ordres supérieurs par une ap proche se basant sur la théorie des ensembles. Cette dernière considère tout objet mathématique comme un ensemble, et peut formuler n’importe quel résultat en les utilisant. Un ensemble est défini formellement comme une collection vérifiant certains axiomes. Cette liste d’axiomes portera le nom de ZFC dans le cadre de ce mémoire. “L’autre” stratégie consiste donc à ajouter des axiomes à ZFC pour élargir notre univers et permettre à des entités non-standards d’y exister.
La théorie *ZFC de Mauro Di Nasso, que nous allons présenter dans cette partie, comme plusieurs autres en allalyse non-standard, s’inspire du travail inno vateur de Robinson, et reprend la plupart des notations et définitions présentées dans ce chapitre. Elle tentera de faire un pont entre l’approche axiomatique et celle de Robinson.
LA TH]ORIE AXIOMATIQUE ZFC
Puisque nous serons portés à ajouter des axiomes à ceux déjà existants, nous en ferons la présentation. Notre contexte est l’axiomatisation Zf C, due à Zer melo et Fraenkel, incluant l’axiome du choix. Nous présenterons 9 axiomes plus 2 schémas d’axiomes. Pour des raisons pratiques d’utilisation, on a pris l’habitude de tous les présenter, et ce malgré le fait que bon nombre d’entre eux soient dé pendants les uns des autres.
Rappelons l’origine du besoin d’une axiornaJsation. On a longtemps travaii].é avec 1s ensembles sans grand besoin de définir cet objet. Russeil, au début du siècle,
a alors proposé la collection suivante A = {x x x} (voir jRu]). Par cette définition, on peut voir que A
e
A A A. Cet argument, communément appelé le paradoxe de Russett, révèle une faille dans notre définition - alors intuitive - d’ensemble car elle mène à une contradiction. Un définition formelle, qui ne
permet pas l’existence de A en tant qu’ensemble, est donc nécessaire.
Cette théorie est exprimée dans un langage de premier ordre, noté £ZFC, doté
d’un unique symbole de relation,
e,
reflétant l’appartenance. Ainsi, on lit “x E y” comme “x appartient à y “ou “x est un élément de y”.On utilisera les termes colt ection, ou classe d’objets sans se poser de question quant aux contradictions que cela peut engendrer. Il sera utile de les utiliser pour alléger le discours. Une classe B est une collection d’objets vérifiant une certaine propriété, et se note ainsi B {x P(x)} où P est une formule quelconque. Bien que les classes ne fassent pas partie des variables de notre langage, on fera un abus de notation et on écrira x B pour signifier P(x). Un ensemble sera
une classe qui vérifie les axiomes que nous présenterons sous peu. Pour bien dif
férencier les deux, on désignera les classes en caractère gras A et les ensembles en simple majuscule ou minuscule (A ou a). Une classe qui n’est pas un ensemble
sera dite une ctassepropre. Ord. que nous avons défini plus tôt, est notre premier
exemple de classe propre. Ainsi on notera c E Ord pour “c est un ordinal”.
Définition 2.1. On désignera par Univers ta cottectzon de tous les ensembtes,
que l’on notera V. On peut mentionner que cette cotlectionz n’est ette-même pas un ensemble.
De façon ptus générale, un univers dészgnera ta collection des ensembles dont nous voutons traiter.
Axiome 2.2. Axiome d’extentionaÏité:
Deux ensembles ayant exactement tes mêmes éléments sont égaux. Formellement, Vx Vy [(Vz (z E x z E y)) — = y].
Axiome 2.3. Axiome de ta réunion
Pour un ensemble x, ï existe un ensemble y qui u comme éléments tes éléments des éléments de x, noté
U
.Formellement, Vx y Vz [z
e
y t (t E x A z E t)]Axiome 2.4. Axiome de ta paire:
Si x et y sont deux ensembles, il existe un ensemble formé exactement des éléments x et y, noté {x,y}.
Formellement, Vx Vy z Vt (t E z (t = x V t = y))
Axiome 2.5. Axiome de l’ensemble des parties
Soit x un ensemble, P(x), la collection de toutes tes parties de x, est aussi un ensemble.
Axiome 2.6. Axiome de l’ensemble vide Il existe un ensemble vide, noté
0.
Formellement, x Vy E x y y
Axiome 2.7. Axiome de l’infini:
Il existe un ensemble comptant une infinité d’éléments. Formellement, x
(0
E x AVy (ye
x —* yU {y} E x))Cet ensemble n’est pas unique. Cet axiome nous donne par exempte l’existence de l’ordinal limite w que l’on définit de cette façon
w=fl{xØexA(yexyu{y}ex)}.
Axiome 2.8. Axiome de fondation ou de régularité (f)
Tout ensemble non-vide contient un élément qui lui-même n’a aucun élément en commun avec cet ensemble.
Formellement, Vx [x
0
— Ey (y E x Ay fl x =0)]
De façon équivalente, on peut dire qu ‘il n’existe pas de chaine d ‘appartenance descendante iifinie x1 3 x2 3 ... 3 x,, 3
Ainsi, si V était un ensemble, on aurait V E V, ce qui contredit l’axzonze.
Axiome 2.9. Axiome du choix (C)
Il existe plusieurs énoncés équivalents. Nous en citons quelques uns, et on pourra se référer à [J] pour la vérification des équivalences
Tout ensemble A possède un bon-ordre < tel que A, <) est bien-ordonné.
Tout ensemble est en bijection avec un unique cardinal (On confondra ainsi la cardinalité d’un ensemble et te cardinal avec lequel il est en bijection).
Le produit cartésien d’ensembles non-vides est non-vide.
Axiome 2.10. Schéma d’axiome de substitution ou remplacement
Soit F une fonction à un argument, et x un ensemble. L’image de x par F est un ensemble, noté F[x].
Formettement, Vx1 Vx2 - - .Vx {Vx Vy Vz [F(x, y, x1, . . . ,xk)AF(x, z,X1,.. . ,x)
z=y]VtwVu [vEwu[uEtAF(u,v,xl,...,xk)]]}
Nous pouvons mamtenallt déduire le théorème suivant. Encore une fois, il prend souvent l’appellation d’axiome, que l’on conservera malgré la preuve.
Proposition 2.11. Schéma de séparation
Les éléments z d’un ensemble x qui vérifient ta proposition A forment un ensemble.
Formellement, Vx1 Vx2 . . .Vx Vx Ey Vz [z y z X A A(z,Xi,. . . ,Xkfl]
Démonstration
Posons E(x,y) :=A(x)Axy.
On essaie d’appliquer le schéma de substitution.
Si on a E(x,y) et E(x, z), alors on a A(x) AX = y = z.
Par le schéma d’axiome précédent, Vt Eu’ Vv [u E w —* Eu [u E t A E(u,y)]]).
Donc w = {v Eu [u E t A E(u, v)]} E V
w={v{Eu[uEtAA(u’)Au=v]}EV
{u
e
t A(u)} E V.D
Notation 2.12. L’ensemble de ces axiomes et de leurs conséquences forment
la théorie ZFC, due à Zer’rnelo et Fraenkel. Le C désigne l’axiome du choix. La théorie ZF est constitué de tous les axiomes sauf (C), et ZFC— de tous les axiomes sauf (F,). ZF désigne ZFC sans (C) et sans (F).
AXIOMATISATION DE LA THÉORIE
NON-STANDARD
*ZFG
L’approche favorisée dans ce mémoire demande une nouvelle axiomatisation. En fait, notons £* le langage de *ZFC une extension du langage £zFC telle
que £* = {, *}, où
* représente une fonction qui sera déterminée pius loin. Elle
correspond à la création d’une superstructure telle que nous l’avons vu avec Ro binson. Voici les axiomes (ou schéma d’axiomes) de cette théorie
Axiome I : Tous les énoncés des axiomes de ZfC sont vrais.
Il ne faut pas se surprendre de l’abandon de l’axiome de fondation. Il est d’ailleurs souvent contesté par sa trop grande force, amenant parfois à des consé quences logiques difficiles à accepter pour certains mathématiciens (voir chapitre 11). L’axiome de régularité n’intervient presque pas dans les mathématiques stan dards. En fait, seuls quelques résultats de la théorie des ensembles et en topologie générale font usage de cet axiome. De plus, tout modèle non-standard se doit d’abandonner cet axiome. Regardons rapidement pourquoi
Définition 3.1. Soit WF la classe des ensembles bien-fondés.
Elle est définie de ta façon suivante
Une façon équivalente de citer l’axiome de fondation est de dire que V WF. Un ensemble qui n’est pas bien-fondé sera dit mal-fondé.
Ainsi, l’extension non-standard de N, notée *N est mal-fondée. Il y existe un nombre infiniment grand *n. Or tout nombre naturel non-nul est un successeur,
donc il existe *n — 1, — 2,..., où les
*
— (i e N) sont également infiniment
grands. Donc — 1 — 2 ... est é-chaîne descendante infinie, contredisant la définition.
Définition 3.2. On nomme S la classe des ensembles standards. On retrouve
ainsi dans cette collection toutes les entités mathématiques considérées avant te postulat de ces nouveaux axiomes (définies dans ZFC]. Ainsi, S = WF.
La fonction * est définie sur tes ensembles standards.
On notera Vstx (respectivement tx) comme diminutif pour dire “pour tout x qui est standard” (respectivement “il existe un x qui est standard’
Définition 3.3. On note I t’image de S par ‘.
On nomme I notre univers interne. Il est formé d’ensembles standards ou non, qui satisfont les axiomes I à VI. Un ensemble dans I est dit ensemble interne. Ainsi, pour être conforme à t’approche des superstructures de Robinson, on définit
I = {y x é S y *x}
Tout ensemble n’étant pas interne est dit externe.
Axiome II * : S —+ I est une fonction surjective (Cette fonction est notre
premier exemple d’un plongement élémentaire).
Définition 3.4. De façon analogue aux ensembles, une classe A est dite transitive
si on a : x c A = x é A. où x est un ensemble.
Axiome III : I est transitif.
L’axiome III est une technicalité qui simplifie certaines preuves, comme nous verrons un peu plus loin.
Axiome IV Soit P une propriété n’ayant que des paramètres standards. Considérons P’ avec comme paramètres l’image des paramètres précédents par . Affirmer que P est vraie pour toutes variables standards est équivalent à affirmer que P’ est vraie pour toutes variables internes.
formellement, Val,...,Vak
e
S (aiak) E(*ai*ak)Cet axiome (qui est en fait un schéma d’axiome) nous assure qu’il y a un transfert de toutes les propriétés vraies dans ZFC pour avoir des propriétés équivalentes dans *ZFC
Axiome V Tout ensemble est bien-fondé sur I, c’est-à-dire Vx
0
yex
xfly C I.Cet axiome est connu sous le nom de faibte régularité. En effet, si la régularité a été abandonnée pour pouvoir faire de la place à des entités “idéales” à l’intérieur des ensembles, on a besoin d’une version plus faible touchant nos ensembles ex ternes. Voici un résultat qui nous sera utile, qui est une conséquence de l’ensemble des axiomes qui viennent d’être présentés
Corollaire 3.5. It n’existe pas de chaînes descendantes x1 3 x2 3 x3 3 ... où
xy, x2, x3,.. . sont des ensembles externes. Démonstration
Soit x1 3 X2 3 X3 3 ... une chaîne descendante. Considérons l’ensemble A := {x1, x2, x3, .
.
.1
(par l’axiome de remplacement). Par l’axiome V appliqué à A, il existe i N tel que xflA C I. Maise
xflA, donc x1 est interne.Présentons la propriété de i-saturation, qui nous donne une condition sur la taille de notre ensemble pour qu’il contienne des éléments non-standards
Définitioll 3.6. La propriété de n-saturation va comme suit
strictement inférieure à t, et fermée sous l’intersection. Alors l’intersection de
cette famille est non-vide. Formellement, Soit F
0,
[(VxéFxél) A(F <t)A(Vx,y eFxflyeF)j
=nF0.
Définition 3.7. On dira qu’un univers est ti-saturé quand il répond aux critères
de ta propriété de n-saturation.
Définition 3.8. Une é-formule est une formule dans te langage de 1er ordre,
ayant comme seul prédicat le symbole d’appartenance é.
AxiomeVl: (Schéma de saturation)
Si Fou peut définir un cardinal t à l’aide d’une é-formule, alors la propriété de
i-saturation est vraie.
formellement, [Vx,y é S (S() A S()) (x
= y) A (x é Card)j = Vt é S [S()
“propriété de i-saturation”1
On désignera par *ZFC la théorie découlant des 6 derniers axiomes, et par *ZFC l’axiomatisation *ZFC sans l’axiome VI.
Un élément de flF sera un élément “idéal”, ou non-standard. Un axiome sti pulant l’existence de tels éléments est bien sur commun à toutes les théories non-standards, et porte parfois le nom d’idéalisation (voir chapitre 8).
On tentera plus tard de construire un modèle de *ZFC On peut dire d’un modèle qu’il est ii-saturé si son univers l’est. On en verra dans le chapitre Z une définition plus formelle. Ce sixième axiome est en fait un schéma d’axiomes (un nouvel axiome pour chaque formule
),
et se distingue quelque peu des autres axiomatisations.Si chaque théorie de l’analyse non-standard doit faire une concession, c’est bien celle de délimiter sou univers. Plus précisément, cet univers est i’-saturé, et
i doit être un cardinal accessible. C’est la plus grosse contrainte à laquelle chaque
axiomatisation doit faire face. Créer un modèle tel que pour tout cardinal i, il soit
t-saturé, engendre une contradiction (voir
[HI);
mais à tout le moins, pour chaqueaxiome nous donne ainsi la sensation de ne pas être limité dans notre choix du cardinal ii (en autant que le choix se fa.sse avant la construction du modèle). Nous verrous plus précisément où cet argument nous aide dans le développement de la théorie, entre autre dans le chapitre qui suit.
Par sa condition de concourance, l’approche de Robinson ne créait que des structures w-saturées, tout comme la première axiomatisation de l’analyse non standard, qui sera présentée dans le chapitre 8. Plusieurs ont tenté de généraliser cette propriété, et le résultat de Di Na.sso est un aboutissement de ces recherches.