Des risques soci´ etaux et des d´ efis scientifiques du Web
Serge Abiteboul
INRIA Saclay – ˆIle-de-France
La cantine, avril 2009
On d´ ebranche?
Le Web est en train de diverger
•
L’exclusion domine: Fracture num´ erique
•
Les gouvernements d´ erapent: Big brother
•
La criminalit´ e s’incruste: P´ edophilie, terrorisme
•
Le commercial s’´ etend: Pub, etc.
Et les techies?
•
Les grosses compagnies ne pensent qu’` a leurs profits
•
Les startups aussi
•
Les chercheurs ne pensent qu’` a leur recherche
Le premier probl` eme du Web
La fracture num´ erique
•
L’acc` es ` a l’information est un droit universel
•
La publication aussi: droit d’expression
On en est o` u?
•
La Web a r´ ealis´ e le rˆ eve des chercheurs
• mise en commun massive d’information `a l’´echelle de la plan`ete
•
En vingt ans, une litanie de “r´ evolutions”
• les moteurs de recherche: Google et al.
• le t´el´echargement de musique et de films: emule/torrent et al.
• les r´eseaux sociaux: Facebook et al.
• les connaissances collectives: Wikipedia et al.
•
Des standards raisonnables: html, xml, wsdl, rdf...
•
Des avanc´ ees techniques
• moteurs de recherche web, P2P/comm&index, multilangue, calcul & gestion de donn´ees distribu´ee, ´edition coop´erative, etc.
•
C ¸ a va se calmer?
C ¸ a va continuer ` a d´ em´ enager
•
Web s´ emantique: Web de connaissances plutˆ ot que de texte
• Des r´eponses plus pr´ecises
• La possibilit´e pour des logiciels d’obtenir des donn´ees
•
Web 2.0: un Web plus interactif, plus communautaire
• Publication pour tous: wiki, blogs, mashups
• Communaut´es
•
Web des objets
• Des milliards d’objets communicants
•
Web du pair-` a-pair
• D’une architecture Client-Serveurs avec ses millions de serveurs
• A une architecture P2P avec des milliards de pairs
•
Web des mondes virtuels et ceux que j’oublie...
•
Des tas de nouvelles fonctionnalit´ es ` a inventer
C’est la jungle
•
Beaucoup de marketing Web 3.0, 4.0, Google.0...
•
Souvent plus d´ evelopp´ e dans le Web d’entreprise que le Web publique
•
Lectures crois´ ees:
• Machine2Machine: dans tous - recherche automatique de service en e-commerce
• R´eseau social dans un syst`eme P2P
• Mashup int´egrant des positions de GPS et des requˆetes bas´ees sur une ontologie
Zoom sur la techno
Gestion d’information en P2P
Passage ` a l’´ echelle de la gestion d’information
•
Tr` es grand nombre d’utilisateurs
•
Tr` es gros volume de donn´ ees
•
Solution
• des serveurs de plus en plus gros, fermes de serveurs
• belles prouesses techniques mais tr`es coˆuteux, tr`es lourds
•
Alternative, le P2P
•
Pair-` a-pair; un nombre (peut-ˆ etre important) et changeant de syst` emes coop` erent pour r´ esoudre une tache sans aucune autorit´ e centrale
•
Exemple de pair-` a-pair massif: t´ el´ echargement de musique/film sur Internet
•
Partage d’information en g´ en´ eral - par exemple dans une
entreprise ou une association
Gestion d’information en P2P - avantages
•
Avantages techniques
• meilleure performance
• plus une donn´ees est populaire, plus c’est difficile de l’obtenir sur un serveur centralis´e
• en P2P, quand on la prend, on devient un serveur. De plus en plus de copies disponibles
• meilleure disponibilit´e
•
Avantages soci´ etaux
• moindre coˆut
• meilleur contrˆole sur ses propres donn´ees
• plus d’ind´ependance & de libert´e
• bien adapt´e aux structures non centralis´ees
Illustration: Facebook en P2P
•
Facebook stocke mes donn´ ees perso
•
Plein d’autres syst` emes aussi
•
Difficile de garder le contrˆ ole sur ces donn´ ees
•
Difficile de les garder ` a jour
•
En P2P
• Je garde mes donn´ees chez moi (sur “ma” machine `a “moi”)
• Je garde le contrˆole sur ces donn´ees
On va y arriver
•
Pourquoi c’est possible
• `a prix ´egal, la puissance des composants continue `a augmenter
• de plus en plus d’ordinateurs connect´es peuvent participer
• e.g., les boites tripleplay pourraient ˆetre plus utiles
•
Pourquoi c’est pas encore l` a
• business model pas tr`es clair
• plus complexe et mises-`a-jour difficiles
• typiquement pas d’administrateur de la base de donn´ees et pas de programmeur
• auto-administration, auto-tuning, auto-correction...
•
C’est compliqu´ e & il faudra le faire (plus de recherche!)
Quelques autres probl` emes techniques
•
On s’est habitu´ e ` a un Web g´ enial avec une qualit´ e m´ ediocre
• risques d’une technologie en d´eveloppement
• temps de passage tr`es court du labo au laptop
• complexit´e du probl`eme (distribution)
• le plus surprenant c’est que ¸ca marche
•
Il faut pouvoir mieux maˆıtriser
• syst`emes plus corrects, plus sˆurs, r´esistants aux pannes
• syst`emes plus performants
• exigence de qualit´e notamment pour applications industrielles
•
C’est pas donn´ e
• Contexte fluctuant: nombre d’utilisateurs, quantit´e de donn´ees
• Tester: difficile dans un contexte distribu´e
• V´erifier: difficile quand plusieurs codes collaborent
•
C’est compliqu´ e & il faudra le faire (plus de recherche!)
Risques et opportunit´ es
•
Je ne parle pas ici de R&O commerciaux
•
Risques
• Vie de plus en plus difficile pour les exclus
• Des moyens aux gouvernement pour nous censurer ou surveiller aux compagnies pour nous manipuler
au crime pour s’organiser
•
Opportunit´ es
• Les nouvelles technospeuventam´eliorer notre vie
• Nouvelles fonctionnalit´es
• Plus faciles `a utiliser (jeunes et seniors)
• Gestion du d´eveloppement durable
• Les nouvelles technospeuventnous rendre plus autonomes
C’est ` a nous de choisir ce qu’on fera du Web
•
Le rˆ ole de l’´ Etat (l’Europe, le monde)
• des lois intelligentes et applicables (protection vie priv´ee, etc.)
• r´egulation du march´e (interop´erabilit´e, etc.)
• actions pour r´eduire la fracture num´erique
• soutient du secteur (recherche, innovation)
•
Le rˆ ole des citoyens, associations, ONG
• encourager, aider, contrˆoler ce que fait l’´Etat
•
Le rˆ ole de l’enseignement
• enseigner comment mieux utiliser ces outils
• ¸ca prend plus de temps que de d´evelopper la technologie
•
Le rˆ ole de l’industrie: innover, r´ ealiser, diffuser
•