Présentation d’Internet et du Web
Plan : 1. Internet
Rudiments sur la communication
Modèles en couches (cas d’Internet)
Notion de protocole
Adresse IP
Protocole TCP (Transmission Control Protocol)
URL (Uniform Resource Locator)
DNS (Domain Name System)
Schéma (très simplifié) d’Internet
WAN, LAN, translation d’adresse
Fournisseur d’accès 2. Web. World Wide Web (www)
Hypertexte
HTML
Web
Site
Navigateur, butineur, fureteur, brouteur, arpenteur (browser en anglais)
Moteur de recherche
Remarque : Internet est un nom propre (il n’y a qu’un seul Internet), il faut donc l’écrire avec une majuscule.
1. Internet
• Rudiments sur la communication
On parle ici de la transmission d’information entre un émetteur et un récepteur. Il peut s’agir de deux ordinateurs (au sens large : PC, smartphone, micro-contrôleur, machine outil à commande numérique, etc.)
Pour qu’un échange oral d’information puisse avoir lieu il faut réunir plusieurs conditions. Si l’on prend comme exemple deux personnes, il faut que l’émetteur ne soit pas muet et que l’auditeur ne soit pas sourd. Il faut également qu’elles maîtrisent une langue commune. Il faut aussi qu’entre les deux un médium transporte le son de l’une à l’autre (air, ligne téléphonique, etc.). On comprendra bien que la première condition. Dans le cas d’un échange de données en informatique on va distinguer ces diverses conditions en les plaçant en couches.
Modèle en couches (TCP/IP)
Dans le cas d’Internet on distingue 4 couches : Accès réseau, Internet, Transport et Application Application Cette couche contient tous les protocoles de haut niveau : FTP pour le transfert
de fichiers, SMTP pour les mails, HTTP pour le WWW, DNS pour les noms de domaine.
Transport Cette couche détermine comment les données doivent être envoyées : de manière fiable ou pas. Deux protocoles sont dans la couche transport : TCP (Transmission Control Protocol) et UDP (User Datagram Protocol).
- TCP est un protocole de transfert fiable orienté connexion. Ce protocole contrôle et s’assure qu’il n’y ait ni perte ni corruption de données. Il est donc en charge des erreurs. TCP est le protocole le plus utilisé sur le Web aujourd’hui.
- UDP est un protocole de transfert non fiable et qui ne nécessite pas de connexion préalable. Ce protocole est particulièrement utilisé pour les échanges
2
où la perte de quelques données n’est pas grave (appel vidéo, jeu en ligne, etc.) car il est plus rapide que TCP.
Internet Assure la communication logique entre hôte, c’est-à-dire transmet coûte que coûte les paquets d’un hôte à un autre et de fait en sorte qu’ils arrivent à destination. Le protocole principal de cette couche est IP (Internet Protocol). Les paquets peuvent prendre différentes routes pour arriver à destination et arriver dans un ordre différent de l’ordre dans lequel ils ont été envoyés.
Dans son fonctionnement, la couche Internet n’est pas responsable d’une transmission fiable. Ce sera aux protocoles de plus haut niveau d’assurer la fiabilité du service.
Accès réseau Définit comment envoyer des paquets IP à travers le réseau via des protocoles comme Ethernet (liaison filaire) ou Wireless (le Wifi par exemple) entre autres.
Notion de protocole
On va prendre un exemple de communication téléphonique entre deux humains. Pour que ce transfert d’information soit efficace il faut respecter un certain nombre de contraintes :
1. L'appelé apprend que vous avez quelque chose à transmettre (son téléphone sonne) ; 2. il indique qu'il est prêt à recevoir (il décroche) ;
3. l’appelant situe la communication dans son contexte (« Je suis Marc. Je t'appelle pour la raison suivante… ») ;
4. un éventuel destinataire final peut éventuellement y être identifié (« Peux-tu prévenir Michel que… ») ;
5. l’appelé s'assure d'avoir bien compris le message (« Peux-tu me répéter le nom ? ») ;
6. les procédures d'anomalies sont éventuellement mises en place (« Je te rappelle si je n'arrive pas à le joindre ») ;
7. les interlocuteurs se mettent d'accord sur la fin de la communication (« Merci de m'avoir prévenu »).
8. un des interlocuteurs met fin à la communication (il raccroche).
Il s’agit là de la mise en œuvre de protocoles.
En pratique chaque couche gère un ou plusieurs protocoles. Cela se traduit par le fait que les données transmises sont expédiées par paquet. Chaque paquet est « encapsulé », c’est-à-dire que des données sont ajoutées avant celles qui sont destinées au récepteur. Par exemple l’en-tête d’un paquet comportera l’adresse de l’émetteur et celle du destinataire. un exemple de paquet IP est représenté ci-dessous :
4 bits 4 bits 8 bits 16 bits
Version IP IHL TOS Longueur totale
Identificateur F1 F0
TTL Protocole Somme de contrôle (en-tête)
Adresse source Adresse destination
Options Données
Dans cette représentation on a placé les différents champs du paquet les uns au-dessous des autres mais il faut comprendre que toutes ces données sont en fait mises bout-à-bout.
La longueur du champ appelé « Données » est variable et peut être calculée à partir du champ
« Longueur totale ». En effet ici l’en-tête comporte 24 octets.
3
La composition des paquets dépend de la couche où ils sont traités. Les paquets les plus courts se trouvent au niveau Application.
Lorsque le paquet est transmis au niveau transport, il se voit complété par les informations nécessaires à son acheminement. et ainsi de suite. C’est au niveau accès réseau que le paquet devient le plus long. A l’extrémité de réception le paquet est amputé des informations superflues lorsqu’il passe d’une couche à celle du dessus.
Adresse IP
Comme il faut un numéro de téléphone pour désigner chaque poste de téléphone dans le monde il a fallu créer une désignation pour chaque appareil connecté au réseau Internet. Dans la première version (IPv4) cette adresse est un nombre binaire de 32 bits de long. La capacité d’adressage théorique maximale est alors de 4 294 967 296 appareils connectés à l’Internet et utilisant le protocole IP. les adresses IPv4 sont présentées sous la forme de 4 nombres écrits en notation décimale dont la valeur va de 0 à 255. Chaque nombre représente un octet soit 8 bits. L’ensemble des 4 octets représente 32 bits.
Depuis une dizaine d’années environ la ressource en adresses IPv4 est épuisée. Afin de ne pas interrompre la croissance d’Internet il a été créé une version 6 du protocole IP. Dans cette version les adresses ont une longueur de 128 bits ce qui permet environ 340x1036 adresses. Il est plus que probable qu’on n’atteindra jamais ce nombre d’objets connectés.
URL (Uniform Resource Locator)
Se souvenir des adresses peut être fastidieux et générer des erreurs. De la même manière qu’appeler au téléphone « Service clients SNCF » est plus aisé que « 08 05 50 60 70 » il a été créé un mécanisme qui s’apparente à un annuaire. Ainsi pour accéder à mon propre site d’arénophilie il sera plus commode d’indiquer l’URL « https://pollux06.synology.me » que l’adresse IP (qui change d’ailleurs périodiquement) « 90.9.188.45».
DNS (Domain Name System)
Les différents organes du réseau Internet ne savent manipuler que les adresses IP (v4 ou v6). Par contre les URL, s’ils sont commodes pour les utilisateurs humains car ils sont signifiants (au moins pour certains) ne sont pas compréhensibles par les divers routeurs, passerelles, etc.
Il a donc fallu créer un système d’annuaire. C’est un ensemble de serveurs dont le rôle est de traduire les URL en adresses IP. Par métonymie on appelle souvent DNS ces serveurs.
Schéma (très simplifié) d’Internet a) Les câbles sous-marins (99% du trafic)
b) Schéma de principe
4
WAN, LAN, translation d’adresse WAN : Wide Area Network
LAN : Local Area Network
Si vous avez une « box » Internet, un ordinateur, une smart TV, une imprimante reliée à la box cela constitue un réseau local (LAN).
Tout ce qui est accessible par la box en dehors de votre réseau local est appelé WAN. Ce réseau étendu (WAN) peut être l’Internet. C’est le cas pour la plupart des particuliers. Par contre des entreprises peuvent relier l’ensemble (ou une partie seulement) de ses réseaux locaux par un réseau étendu (WAN) sans passer par Internet. On parle alors d’intranet (sans majuscule car il peut y avoir autant d’intranet que d’organisations, entreprises, associations, états, …). Souvent l’intranet est un outil de sécurisation de l’outil informatique en entreprise.
Un réseau privé (LAN) peut être relié au réseau Internet par une « box » (en fait on devrait parler de « modem-routeur ». La box communique avec les différents éléments du LAN à l’aide d’adresses IP privées. On reconnait ces adresses car elles ont la structure 192.168.xx.xx. Par contre pour communiquer avec le WAN, un ordinateur dont l’adresse interne au réseau local est, par exemple, 192.168.0.7 sera présenté à l’Internet avec l’adresse de la box (par exemple : 91.122.214.5).
Fournisseur d’accès Internet (FAI). Internet Service Provider (ISP) en anglais C’est une organisation (entreprise ou association) qui offre une connexion à Internet.
Le raccordement du client au réseau du FAI peut se faire par le raccordement téléphonique (modem, RNIS, ADSL ou VDSL), par fibre optique (FTTH), par câble coaxial, par radio (Wimax ou Wi- Fi) ou par satellite.
Les débits sont fortement dépendants de la technique utilisée : - modem : débit ≤ 56 kbit/s
- ADSL : 512 kbit/s ≤ débit ≤ 20 Mbit/s - Fibre : débit ≥ 100 Mbit/s
2. Web. World Wide Web (www)
Hypertexte
Il s’agit d’une notion que vous connaissez déjà peut-être sans le savoir. Le préfixe hyper signifie que le document s’affranchit des limitations engendrées par la linéarité de la lecture.
Pensez, dans un livre, à la table des matières, la table des index, le glossaire, les notes de bas de page, de fin de chapitre ou de fin de l’ouvrage !
5
Ce sont simplement des renvois qui rompent la linéarité de la lecture. Une note de bas de page, par exemple, permet de compléter ou de commenter un texte sans l’alourdir, Elle permet d’offrir un complément que seuls les lecteurs qui en éprouvent le besoin consulterons.
En informatique on ne va pas se limiter à l’intérieur d’un seul document, les renvois peuvent avoir comme cible un autre document (ou une partie de celui-ci) situé n’importe où sur le réseau accessible (l’ordinateur, le réseau local, Internet ou un intranet).
HTML (HyperText Markup Language)
En français cela donne : langage de balisage d’hypertexte. Les documents décrits dans ce langage sont appelés pages.
Il est ainsi nommé car il est constitué essentiellement de balises. Ces dernières servent à définir les hyperliens (c’est le côté hypertexte) ainsi qu’à structurer la page.
Un exemple de page serait :
<!DOCTYPE html PUBLIC "-//IETF//DTD HTML 2.0//EN">
<html>
<head>
<title>
Exemple de HTML </title>
</head>
<body>
Ceci est une phrase avec un <a href="cible.html">hyperlien</a>.
<p>
Ceci est un paragraphe où il n’y a pas d’hyperlien.
</p>
</body>
</html>
Dans cet exemple les éléments entre < et > sont les balises. La première : <html> indique le début d’un document écrit en HTML. la dernière balise :</html> indique la fin du document.
La balise <a href="cible.html"> est un début hyperlien et </a> est sa fin. Dans le document visualisé dans un butineur cela donne hyperlien.
L’exemple ci-dessus ouvert par Firefox donne :
Web
Il est important de ne pas confondre le World Wide Web (la toile d’araignée mondiale) avec l’Internet. L’Internet est un réseau, c’est-à-dire constitué de câbles, de satellites, de stations hertziennes, de routeurs, de serveurs, de terminaux, de logiciels etc. Le Web n’est qu’une des applications qui fonctionne sur Internet. Le Web est un hypertexte public qui permet de consulter, à l’aide d’un butineur (ou navigateur) des pages accessibles sur des sites.
6
Site
Il s’agit simplement d’un ensemble de pages web et de ressources (telles que des images des séquences vidéo, des sons, …) qui sont reliées par des hyperliens. Un site peut être accessibles sur la même machine que celle où on utilise le butineur, sur un réseau local (LAN), sur un intranet (WAN) ou sur l’Internet (Web).
Navigateur, butineur, fureteur, brouteur, arpenteur (browser en anglais)
Ce sont des logiciels conçus pour consulter et afficher le web. C’est-à-dire qu’ils sont capables d’interpréter les éléments du HTML et d’afficher les pages web en conciliant d’une part les consignes imposées par les balises et les caractéristiques des écrans sur lesquels se fait l’affichage des dites pages. Ainsi on ne peut généralement pas définir de manière rigide l’aspect qu’aura une page HTML.
Les butineurs les plus connus sont :
- dans le monde Windows : Edge, Chrome, Firefox, Opera, Brave, Vivaldi - dans le monde Apple : Safari, Chrome, Firefox, Brave, Opera, Vivaldi - dans le monde Linux : Firefox,Chrome, Brave, Opera, Vivaldi
- dans le monde Android : Chrome, Firefox, Brave, Edge, Opera
Moteur de recherche
Il s’agit de logiciels qui permettent de trouver des ressources à partir d’une requête. Par exemple si vous cherchez l’adresse d’une pharmacie dans la ville de Grasse la requête pourra être « pharmacie grasse ».
Préalablement à toute requête, les moteurs de recherche explorent le web. Chaque page rencontrée est indexée (elle est répertoriée dans une base de données et liée à une série de mots- clés). Il peut être utile de savoir que les requêtes subissent un traitement avant d’être interprétées.
Par exemple les majuscules sont généralement inutiles et automatiquement remplacées par des minuscules, les mots comme le, la, de, sont supprimés pour simplifier la recherche.
Les moteurs les plus connus sont : Google, Bing, Qwant, Yahoo.