Applications traditionnelles de gestion de donn ´ees

(1)

2 mai 2016

INF344: Donn ´ees du Web

Les quatrevde la datamasse du Web

(2)

La datamasse

Ladatamasse, leBig Data, lesmasses de donn ´ees:

Donn ées collect ées pour certaines applications, par certaines entreprises, donn ées librement disponibles, etc.

Tr ès grande valeur à analyser (fouille, pr édiction)

Significativement plus complexeque les donn ´ees traditionnelles : Volume : ordres de grandeur au-dessus de ce qu’on peut

traiter de mani `ere centralis ´e

Vari ét é : types de donn ées (texte, multim édia, graphes, structur ées) vari és, organisation des donn ées vari ées

V élocit é : donn ées changeantes ou produites à grande vitesse (LHC : 100 millions de collision par seconde), parfois

(3)

2 mai 2016

Affronter la datamasse

Impacte des domaines vari és : fouille de donn ées, apprentissage, visualisation, respect de la vie priv ée. . . et bien s ûrgestion de donn ées

On a besoin denouveaux algorithmes, denouveaux outils, de nouveaux mod `eles

Ce cours : focus sur les probl `emes de gestion de donn ´eesissues du Web

On va bien au-del `a de SQL sur des SGBD relationnel. . . mais on retrouve lesm ˆemes concepts de base

(4)

Plan

Volume

Vari ´et ´e

V ´elocit ´e

V ´eracit ´e

Conclusion

(5)

2 mai 2016

Applications traditionnelles de gestion de donn ´ees

Donn ´ees d’unforum Web populaire 1000 posts par jour

5 Kio de donn ´ees par post 10 ans de dur ´ee de vie

⇒∼20Gio de donn ées. Tient facilement sur n’importe quel syst ème de gestion de donn ées (p. ex., MySQL).

Comptes d’unebanque 10 millions de clients 5 transactions par jour 100 octets par transaction

1 an d’historique dans le syst `eme de production

⇒∼2 Tio de donn ées. Tient dans un syst ème de bases de donn ées classiques, sur un serveur, ou, mieux, distribu é sur quelques serveurs (p. ex., Oracle, DB2, PostgreSQL).

(6)

Applications traditionnelles de gestion de donn ´ees

(7)

2 mai 2016

Applications traditionnelles de gestion de donn ´ees

(8)

Applications traditionnelles de gestion de donn ´ees

⇒∼2 Tio de donn ées. Tient dans un syst ème de bases de donn ées classiques, sur un serveur, ou, mieux, distribu é sur

(9)

2 mai 2016

Donn ´ees massives

Google Search:850 Tio de donn ´ees(2006) [Chang et al., 2006]

Google Earth:70 Tio de donn ´ees(2006) [Chang et al., 2006]

Facebook

1,5 milliards d’utilisateurs

∼10 Mio de donn ´ees par utilisateurs

⇒∼15 Pio de donn ´ees

Besoin d’autres formesde stockage et d’indexation de donn ´ees sur unegrappe de serveurs.

Pas seulement une question de taille :

Tr `es grand nombre derequ ˆetes par seconde

R éponse rapide aux requ êtes,o ù qu’on soit dans le monde

(10)

Donn ´ees massives

Facebook

(11)

2 mai 2016

Donn ´ees massives

Facebook

(12)

Donn ´ees massives

Facebook

(13)

2 mai 2016

Donn ´ees massives

Facebook

(14)

Principes g ´en ´eraux du stockage sur grappe

Deux grandes strat ´egies :

Arbre de recherche distribu ´e. Par exemple, BigTable [Chang et al., 2006] (Google), Apache HBase.

Table de hachage distribu ´ee[Karger et al., 1997]. Par exemple, Dynamo (Amazon), Apache Cassandra, Project Voldemort.

R ´eplication des donn ´eespour

1. Pas de perte de donn éessuite à une faille mat érielle 2. R épartir la chargedes lectures de donn ées

3. Eventuellement, plusieurs copies à diff érents emplacements pour´ unelocalit é g éographique

Limitations : requ êtesmoins expressivesque dans les syst èmes classiques,perte de coh érencedu syst ème

Voir INF728 et les s éances INF344 sur stockage distribu é, HBase pour plus de d étails

(15)

2 mai 2016

Principes g ´en ´eraux du stockage sur grappe

(16)

Principes g ´en ´eraux du stockage sur grappe

(17)

2 mai 2016

Principes g ´en ´eraux du stockage sur grappe

(18)

Plan

Volume

Vari ´et ´e

V ´elocit ´e

V ´eracit ´e

Conclusion

(19)

PAGE 9 / 31

2 mai 2016

Licence de droits d’usage

Diff érentes sources organisent diff éremment les m êmes donn ées

Jeffrey D. Ullman

List of publications from the DBLP Bibliography Server FAQ

Coauthor Index Ask others: ACM DL/Guide CiteSeer CSB Google MSN Yahoo

Home Page

2007

240 EE Foto N. Afrati, Chen Li, Jeffrey D. Ullman: Using views to generate efficient evaluation plans for queries. J. Comput. Syst. Sci. 73(5): 703724 (2007)

2005

239 EE Jeffrey D. Ullman: Gradiance OnLine Accelerated Learning. ACSC 2005: 36

238 EE Serge Abiteboul, Rakesh Agrawal, Philip A. Bernstein, Michael J. Carey, Stefano Ceri, W. Bruce Croft, David J. DeWitt, Michael J. Franklin, Hector GarciaMolina, Dieter Gawlick, Jim Gray, Laura M. Haas, Alon Y. Halevy, Joseph M. Hellerstein, Yannis E. Ioannidis, Martin L. Kersten, Michael J. Pazzani, Michael Lesk, David Maier, Jeffrey F. Naughton, HansJörg Schek, Timos K. Sellis, Avi Silberschatz, Michael Stonebraker, Richard T. Snodgrass, Jeffrey D. Ullman, Gerhard Weikum, Jennifer Widom, Stanley B.

Zdonik: The Lowell database research selfassessment. Commun. ACM 48(5): 111118 (2005) 237 EE Serge Abiteboul, Richard Hull, Victor Vianu, Sheila A. Greibach, Michael A. Harrison, Ellis Horowitz,

Daniel J. Rosenkrantz, Jeffrey D. Ullman, Moshe Y. Vardi: In memory of Seymour Ginsburg 1928 2004.

SIGMOD Record 34(1): 512 (2005)

2003

236 EE Jeffrey D. Ullman: A Survey of New Directions in Database System. DASFAA 2003: 3

235 EE Jeffrey D. Ullman: Improving the Efficiency of DatabaseSystem Teaching. SIGMOD Conference 2003:

13

234 EE Jim Gray, HansJörg Schek, Michael Stonebraker, Jeffrey D. Ullman: The Lowell Report. SIGMOD Conference 2003: 680

233 EE Serge Abiteboul, Rakesh Agrawal, Philip A. Bernstein, Michael J. Carey, Stefano Ceri, W. Bruce Croft, David J. DeWitt, Michael J. Franklin, Hector GarciaMolina, Dieter Gawlick, Jim Gray, Laura M. Haas, Alon Y. Halevy, Joseph M. Hellerstein, Yannis E. Ioannidis, Martin L. Kersten, Michael J. Pazzani, Michael Lesk, David Maier, Jeffrey F. Naughton, HansJörg Schek, Timos K. Sellis, Avi Silberschatz, Michael Stonebraker, Richard T. Snodgrass, Jeffrey D. Ullman, Gerhard Weikum, Jennifer Widom, Stanley B.

Zdonik: The Lowell Database Research Self Assessment CoRR cs.DB/0310006: (2003)

232 EE Anand Rajaraman, Jeffrey D. Ullman: Querying websites using compact skeletons. J. Comput. Syst. Sci.

66(4): 809851 (2003)

2001

231 EE Chen Li, Mayank Bawa, Jeffrey D. Ullman: Minimizing View Sets without Losing QueryAnswering Power.

ICDT 2001: 99113

230 EE Anand Rajaraman, Jeffrey D. Ullman: Querying Websites Using Compact Skeletons. PODS 2001 229 EE Foto N. Afrati, Chen Li, Jeffrey D. Ullman: Generating Efficient Plans for Queries Using Views. SIGMOD

Conference 2001: 319330

228 EE Edith Cohen, Mayur Datar, Shinji Fujiwara, Aristides Gionis, Piotr Indyk, Rajeev Motwani, Jeffrey D.

Ullman, Cheng Yang: Finding Interesting Associations without Support Pruning. IEEE Trans. Knowl.

Data Eng. 13(1): 6478 (2001)

2000

227 Hector GarciaMolina, Jeffrey D. Ullman, Jennifer Widom: Database System Implementation PrenticeHall 2000

226 EE Jeffrey D. Ullman: A Survey of AssociationRule Mining. Discovery Science 2000: 114 225 EE Edith Cohen, Mayur Datar, Shinji Fujiwara, Aristides Gionis, Piotr Indyk, Rajeev Motwani, Jeffrey D.

(20)

PAGE 9 / 31

2 mai 2016

Licence de droits d’usage

Diff érentes sources organisent diff éremment les m êmes donn ées

Advanced Scholar Search

Scholar Preferences Scholar Help

Scholar All articles Recent articles Results 1 10 of about 12 for author:"jd ullman". (0.07 seconds)

jd ullman J Ullman J Hopcroft A Rajaraman B Konikow ska A Aho

Querying websites using compact skeletons all 11 versions »

A Rajaraman, JD Ullman Journal of Computer and System Sciences, 2003 Elsevier Several commercial applications, such as online comparison shopping and process automation, require integrating information that is scattered across multiple w ebsites or XML documents. Much research has been devoted to this problem, ...

Cited by 13 Related Articles Web Search

[BOOK] Wprowadzenie do teorii automatów, jezyków i obliczen JE Hopcroft, JD Ullman, B Konikow ska 2003 Wydaw . Naukow e PWN Cited by 15 Related Articles Web Search

Improving the efficiency of databasesystem teaching all 3 versions »

JD Ullman Proceedings of the 2003 ACM SIGMOD international conference …, 2003 portal.acm.org ABSTRACT The education industry has a very poor record of produc tivity gains.

In this brief article, I outline some of the w ays the teaching of a college course in database systems could be made more ecient, and sta time used ...

A survey of new directions in database systems all 5 versions »

JD Ullman Database Systems for Advanced Applications, 2003.(DASFAA …, 2003 ieeexplore.ieee.org A survey of new directions in database systems. Ullman, JD Stanford University;

This paper appears in: Database Systems for Advanced Applications, 2003.

(DASFAA 2003). Proceedings. Eighth International ...

Cited by 3 Related Articles Web Search [CITATION] ????

AV Aho, R Sethi, JD Ullman 2003 ??: ???????

Cited by 6 Related Articles Web Search [BOOK] Automi, linguaggi e calcolabilità

… Hopcroft, R Motw ani, JD Ullman, L Bernardinello, L … 2003 Pearson Education Italia Cited by 5 Related Articles Web Search

[CITATION] ???????

H GarciaMolina, JD Ullman, J Widom 2003 ??: ???????

Cited by 4 Related Articles Web Search [BOOK] Implementacja systemów baz danych

H GarciaMolina, J Widom, M Jurkiew icz, JD Ullman 2003 Wydaw nictw a Naukow oTechniczne Cited by 3 Related Articles Web Search

[BOOK] Projektowanie i analiza algorytmów: klasyczna praca z teorii algorytmów komputerowych AV Aho, JE Hopcroft, JD Ullman, W Derechow ski 2003 Helion

Cited by 2 Related Articles Web Search [CITATION] ???????

AV AHO, JE HOPCROFT, JD ULLMAN 2003 ??: ???????

Result Page: 1 2 Next

(21)

2 mai 2016

Int ´egration des donn ´ees

But :obtenir des donn ées de diff érentes sources de donn ées avec une interface/requ êteunique

Exemples :

Science : interroger diff érentes bases de donn ées g énomiques Commerce : interroger les catalogues de diff érents vendeurs Administration : int égrer les donn ées financi ères de diff érentes branches

Web : trouver des donn ´ees sur une personne de nombreuses sources Web

T ˆache complexe : d ´ecrire des connections potentiellement

complexes entre les sources de donn ées, utiliser de las émantique Buzz word : Web s émantique

(22)

S ´emantique : la colle entre sources

Les sources de donn ´ees :

ont ét é d évelopp ées ind épendamment sont autonomes

tr ès h ét érog ènes

De las ´emantiqueest n ´ecessaire pour relier les concepts et leurs structures

De lalogiqueest utilis ée pour d écrire cette s émantique

(23)

2 mai 2016

Exemple

O `u puis-je voir un film de Woody Allen aujourd’hui `a Paris ? Woody Allenplays inun film X

Xis shown at theaterY Yis located inParis

Ignorer les sources non pertinentes : Air France, etc.

Trouver les sources pertinentes et comprendre comment les utiliser :

IMDB (Internet Movie Database) : films avec beaucoup d’informations ; fournit la liste des films de Woody Allen Allocin ´e : dit quand un film a lieu `a Paris

Combiner leurs r ´esultats

(24)

Deux approches principales

Poser les requ ˆetes dans unsch ´emaglobal

Pour r épondre, utiliser des donn ées sur lessch émas locaux Dans les deux approches, les formules relient les sch émas locaux au sch éma global

Approche entrep ˆot

L’instance globale est mat ´erialis ´ee

Les donn ées sont transform ées depuis les instances locales et charg ées dans l’instance globale

Les requ êtes sont évalu ées sur l’instance globale Approche m édiateur

L’instance globale est virtuelle

Les requ êtes sont évalu ées en utilisant des requ êtes aux instances

(25)

2 mai 2016

Vues

L’int égration peut être approch ée comme une vue sur les bases de donn ées locales

Une vue est unerequ ête nomm éequi peut être utilis ée dans d’autres requ êtes

Exemple

View1(X,Y1,Y2) : Flight(X)∧DepartureAirport(X,Y1)

∧ArrivalAirport(X,Y2)

View2(X,Y) : Place(X)∧Located(X,Y)∧Capital(Y)

Vue mat érialis ée : calcul ée à l’avance et stock ée, dans l’esprit de l’entrep ôt

En m émoire ou en cache Mises à jour co ûteuses

Maintenance : propager les mises à jours pour actualiser la vue Vue virtuelle : à la demande, dans l’esprit de la m édiation

Les requ ˆetes sont co ˆuteuses

(26)

Deux principales approches : comparaison

Approche entrep ˆot

Cr éation : co ût du calcul et du stockage Evaluation des requ êtes tr ès efficace´

Mises à jour co ûteuses : besoin de propager les mises à jour locales vers l’entrep ôt

Sinon les donn ées stock ées peuvent êtres obsol ètes Approche m édiateur

Cr ´eation : pas de co ˆut

Requ êtes : co ût de la reformulation, peut- être du calcul, peut- être de la communication

Mises `a jour : pas de co ˆut

Compromis classique en bases de donn ´ees entre mises `a jour et

(27)

2 mai 2016

L’approche m ´ediateur – d ´etails

Sch éma global : D éfinit unsch éma m édiateur

Vocabulaire structur é servant comme interface de requ ête pour les requ êtes utilisateur

Typiquement, un sch ´ema par domaine

Sch émas locaux : D éclare unesource de donn ées

Mod èle le contenu de la source à int égrer en termes du sch éma m édiateur

Connecte les concepts/relations de la source à celles du sch éma m édiateur

Traitement des requ ˆetes

Reformuler et d écomposer une requ ête utilisateur sur le sch éma global en des requ êtes sur le sch éma local qui sont évalu ées sur les sources de donn ées

Combiner les r éponses des requ êtes locales pour construire la r éponse à la requ ête globale

(28)

L’usage de la logique dans l’int ´egration

D éfinir un sch éma m édiateur Unsch éma de bases de donn ées

Contraintes : formules delogique du premier ordre D ´eclarer une source de donn ´ees

Une source est uneinstance de bases de donn ´ees

Liens avec le sch ´ema m ´ediateur : formules delogique du premier ordre

Requ ˆetes

Exprim ées comme des formules delogique du premier ordre L’ évaluation de la requ ête globale peut utiliser unoptimiseur de requ êtes

Chaque évaluation de requ ête locale peut utiliser unoptimiseur de requ êtes

(29)

2 mai 2016

Plan

Volume

Vari ´et ´e

V ´elocit ´e

V ´eracit ´e

Conclusion

(30)

Volatilit ´e de l’information du Web

La demi-vie du contenu du Web est de quelques ann ´ees [Koehler, 2003]

Sur les r éseaux sociaux comme Twitter, l’information ne peut parfois plus être recherch ée au bout d’une semaine [Twitter, 2011]

Extr ême diversit é detaux de rafraˆıchissementdu contenu des URLs, de la fraction de seconde à des dizaines d’ann ées Indispensable d’archiver l’information du Web d’aujourd’hui pour les historiens de demain [Masan és, 2005]

Utile pour un moteur de recherche comme Google de permettre de rechercher dans les actualit ´es r ´ecentes

(31)

2 mai 2016

Rafraˆıchissement des URL

Le contenu du Webchange Taux de changementsvariables :

page principale d’un site d’actualit ´es : toutes les minutes

article sur arXiv : essentiellement pas de changement

Collectecontinueet identification des taux de changements pour une collecteadaptative: comment d ´eterminer ladate de derni `ere modificationd’une page Web ?

(32)

Estampille HTTP

Deux m écanismes d’estampille temporelle en HTTP :balises entit éset dates de modification. Peuvent être fournies à chaque requ ête :

ETag: "497bef-1fcb-47f20645"

Last-Modified: Tue, 01 Apr 2008 09:54:13 GMT

Etag : identifiant unique pour le document fourni, change si le document change ; peut être utilis é dans des requ êtes avecIf-MatchetIf-None-Match.

Last-Modified : heure de derni ère modification ; peut être utilis é dans des requ êtes avecIf-Modified-Sinceet

If-Unmodified-Since.

Information g ´en ´eralement fournie et fiable pour le contenu

(33)

2 mai 2016

Estampilles dans le contenu des pages Web

Tr `es fr ´equentdans les sites Web dynamiques : soit comme une estampilleglobal(Last modified :) ;

soit sur des entr ´eesindividuelles: articles, commentaires, etc.

(est-ce que l’estampille globale est le maximum des estampilles individuelles ?) ;

parfois également dans des m éta-donn ées de la page Web : commentaires HTML, balises<meta>Dublin Core.

Relativement facile `a identifier et `a extraire de la page Web (mots-clefs, expressions rationnelles pour les dates).

Informel : parfois partiel (pas d’indication de temps), souvent sans fuseau horaire.

Pas n ´ecessairement fiable.

(34)

Estampilles s ´emantiques aditionnelles

Fichiers d’autres types que HTML peuvent avoir des m ´ecanismes d’estampille temporelles ´emantique:

PDF, documents Office, etc. : date decr éationet demodification disponible en m éta-donn ées. Assez fiable.

Flux RSS : estampilless ´emantiquesfiables.

Images, sons : m ´eta-donn ´eesEXIF(ou similaire). Pas toujours fiable, et la date de capture d’une image peut ne pas avoir de rapport avec la date de publication.

Contenu s émantique externe utilis é pour dater une page Web : Possibilit é d’apparier unflux RSSau contenu d’une page Web Sitemapfournie par le propri étaire du site.

(35)

2 mai 2016

Plan

Volume

Vari ´et ´e

V ´elocit ´e

V ´eracit ´e

Conclusion

(36)

Donn ´ees incertaines

Sources nombreuses dedonn ´ees incertaines: Erreurs de mesure

Int ´egration de donn ´ees de sources contradictoires

Correspondances impr écises entre sch émas h ét érog ènes Processus automatique incertaine (extraction d’information, traitement du langage naturel, etc.)

Jugement humain imparfait Mensonges, opinions, rumeurs

(37)

2 mai 2016

Donn ´ees incertaines

Sources nombreuses dedonn ´ees incertaines: Erreurs de mesure

Int ´egration de donn ´ees de sources contradictoires

Correspondances impr écises entre sch émas h ét érog ènes Processus automatique incertaine (extraction d’information, traitement du langage naturel, etc.)

Jugement humain imparfait Mensonges, opinions, rumeurs

(38)

Cas d’ ´etude : Extraction d’information Web

Never-ending Language Learning (NELL, CMU), http://rtw.ml.cmu.edu/rtw/kbbrowser/

(39)

2 mai 2016

Cas d’ ´etude : Extraction d’information Web

Google Squared (termin ´e), capture d’ ´ecran de [Fink et al., 2011]

(40)

Cas d’ ´etude : Extraction d’information Web

Suject Pr ´edicat Objet Confiance

Elvis Presley diedOnDate 1977-08-16 97.91%

Elvis Presley isMarriedTo Priscilla Presley 97.29%

Elvis Presley influences Carlo Wolff 96.25%

YAGO,http://www.mpi-inf.mpg.de/yago-naga/yago

(41)

2 mai 2016

Incertitude

dans l’extraction d’information Web

Le syst `eme d’extraction d’information estimpr ´ecis

Le syst `eme a une certaineconfiancedans l’information extraite, qui peut ˆetre :

uneprobabilit ´eque l’information soit vraie (p. ex., champs al ´eatoires conditionnels)

un score de confiance num ´eriquead-hoc

un niveaudiscretde confiance (faible, moyen, haut)

Et si cette information incertaine n’est pas quelque chose de final, mais est utilis ée comme une source de donn ées, p. ex., dans un syst ème d’interrogation ?

(42)

Diff ´erents types d’incertitude

Deux dimensions Diff ´erent types :

Valeurinconnue: NULL dans les SGBD

Alternativeentre plusieurs possibilit és : soit A soit B soit C Impr écision sur une valeur num érique: un capteur donne une valeur qui est une approximation de la valeur r éelle

Confiance dans un fait dans son ensemble: cf. extraction d’information

Incertitude structurelle: le sch éma des donn ées lui-m ême est incertain

Incertitudequalitative(NULL) ouquantitative(95%, faible confidence, etc.)

(43)

2 mai 2016

Syst `emes

Trio http://infolab.stanford.edu/trio/, calcule à la fois la v éracit é et lalign éedes donn ées

MayBMS http://maybms.sourceforge.net/, SGBD relationnel probabiliste complet au-dessus de PostgreSQL, utilisable pour des applications pratiques.

Voir les s ´eances sur gestion d’incertitude, MayBMS pour plus de d ´etails

(44)

Plan

Volume

Vari ´et ´e

V ´elocit ´e

V ´eracit ´e

Conclusion

(45)

2 mai 2016

Conclusion

Les 4 v de la datamasse sont des d ´efis pour le traitement des donn ´ees du Web

INF344 couvre :

Acquisition et enrichissement de donn ´ees Web (crawl, extraction d’informations, recherche d’informations, ranking Web, fouille d’opinions).

La mod élisation et le raisonnement sur les donn ées Web (Web s émantique, donn ées probabilistes).

Le stockage et le calcul sur les donn ´ees Web (MapReduce, HBase).

(46)

Bibliography I

Fay Chang, Jeffrey Dean, Sanjay Ghemawat, Wilson C. Hsieh,

Deborah A. Wallach, Mike Burrows, Tushar Chandra, Andrew Fikes, and Robert E. Gruber. Bigtable : A Distributed Storage System for Structured Data. InIntl. Symp. on Operating System Design and Implementation (OSDI), 2006.

Robert Fink, Andrew Hogue, Dan Olteanu, and Swaroop Rath.

SPROUT2 : a squared query engine for uncertain web data. In SIGMOD, 2011.

David R. Karger, Eric Lehman, Frank Thomson Leighton, Rina Panigrahy, Matthew S. Levine, and Daniel Lewin. Consistent Hashing and Random Trees : Distributed Caching Protocols for Relieving Hot Spots on the World Wide Web. InProc. ACM SIGACT Symp. on the Theory of Computing (STOC), pages 654–663, 1997.

(47)

Bibliography II

Julien Masan ´es. Web archiving methods and approaches : A comparative study. Library Trends, 54 :72–90, 2005. doi : 10.1353/lib.2006.0005.

Twitter. Historical data not working.

https://dev.twitter.com/discussions/2483, 2011.

(48)

Licence de droits d’usage

Contexte public}avec modifications

Par le t él échargement ou la consultation de ce document, l’utilisateur accepte la licence d’utilisation qui y est attach ée, telle que d étaill ée dans les dispositions suivantes, et s’engage à la respecter int égralement.

La licence conf ère à l’utilisateur un droit d’usage sur le document consult é ou t él écharg é, totalement ou en partie, dans les conditions d éfinies ci-apr ès et à l’exclusion expresse de toute utilisation commerciale.

Le droit d’usage d ´efini par la licence autorise un usage `a destination de tout public qui comprend : – le droit de reproduire tout ou partie du document sur support informatique ou papier,

– le droit de diffuser tout ou partie du document au public sur support papier ou informatique, y compris par la mise à la disposition du public sur un r éseau num érique,

– le droit de modifier la forme ou la pr ´esentation du document,

– le droit d’int égrer tout ou partie du document dans un document composite et de le diffuser dans ce nouveau document, à condition que : – L’auteur soit inform é.

Les mentions relatives à la source du document et/ou à son auteur doivent être conserv ées dans leur int égralit é.

Le droit d’usage d ´efini par la licence est personnel et non exclusif.

Tout autre usage que ceux pr évus par la licence est soumis à autorisation pr éalable et expresse de l’auteur :[email protected]