• Aucun résultat trouvé

La fiabilité des informations sur le web. Le cas de Wikipédia

N/A
N/A
Protected

Academic year: 2021

Partager "La fiabilité des informations sur le web. Le cas de Wikipédia"

Copied!
9
0
0

Texte intégral

(1)

HAL Id: hal-00283569

https://hal.archives-ouvertes.fr/hal-00283569

Submitted on 30 May 2008

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

Wikipédia

Bernard Jacquemin, Aurélien Lauf, Céline Poudat, Martine Hurault-Plantet,

Nicolas Auray

To cite this version:

Bernard Jacquemin, Aurélien Lauf, Céline Poudat, Martine Hurault-Plantet, Nicolas Auray. La

fi-abilité des informations sur le web. Le cas de Wikipédia. Actes de la 5e Conférence en Recherche

d’Information et Applications (CORIA 2008), Mar 2008, Trégastel, France. pp.449-456. �hal-00283569�

(2)

hal-00283569, version 1 - 30 May 2008

La abilité des informations sur le web: le as

Wikipédia Bernard Ja quemin 1 ,Aurélien Lauf 1 ,Céline Poudat 2 ,

MartineHurault-Plantet

1

et Ni olas Auray

2 1

LIMSI CNRS UPR 3251, Orsay (Fran e)

2

ENST, Paris(Fran e)

{Bernard.Ja quemin,Aurelien.Lauf,Martine.Hurault-Plantet}limsi.fr {Celine.Poudat,Ni olas.Auray}enst.fr

Résumé

Lesoutilsdere her hed'informationsurlewebdoiventtenir omptedes

phénomènesnouveauxliésàl'apparitiondesblogs,wikis,etautres

publi- ations ollaboratives.Parmi essites,l'en y lopédieWikipédia onstitue

une sour e importante d'information. La qualité de ses informations a

pourtant été ré emment mise en ause. Mieux onnaître les

omporte-ments des ontributeurs peut permettre de guider les utilisateurs dans

des ontenusdequalité parfoisdisparate. Pourexplorer ette voie,nous

présentons uneanalyse durle dediérentstypesde ontributeursdans

le ontrledelapubli ationd'arti les oni tuels.

Mots- lefs :Wikipédia,Fiabilité del'information,Conit, Travail

ol-laboratif.

Abstra t

OnlineIRtoolshavetotakeintoa ountnewphenomenalinkedtothe

ap-pearan eofblogs,wikiandother ollaborativepubli ations.Amongthese

ollaborative sites,Wikipedia representsa ru ialsour eofinformation.

However,thequalityofthisinformationhasbeenre entlyquestionned. A

betterknowledgeofthe ontributors'behaviorsshouldhelpusersnavigate

throughinformationwhosequalitymayvaryfromonesour etoanother.

Inordertoexplorethisidea,wepresentananalysisoftheroleofdierent

typesof ontributors inthe ontrol ofthepubli ationof oni tual

arti- les.

Keywords: Wikipedia, Information reliability, Coni t, Collaborative

work.

1 Introdu tion

Deplusenplusprésentdanslesrésultatsdesmoteursdere her he,leprojet

en y lopédiqueWikipédiaestdevenuparlesusagesuneressour e

information-nelle de référen e, et l'un des sites web les plus visibles et les plus

(3)

lequel l'expert et sa signature garantissaient la qualité des textes, Wikipédia

s'appuie sur inqprin ipesfondateurs

1

supposésgarantir ette qualité :projet

en y lopédique,neutralitédepointdevue, ontenulibre,règlesdesavoir-vivre,

et, enn, pas de règles xes en dehors de es prin ipes. Ainsi, si les

pro es-sus d'édition sont loin de eux de l'en y lopédie traditionnelle, les buts

af- hés de pertinen e en y lopédique et d'obje tivité

2

en restent assezpro hes

[Giles,2005,Endrezzi,2007℄. Néanmoins,laqualité del'en y lopédielibre fait

l'objetde débats: si[Giles,2005℄ a onstatéquelaqualité de Wikipédiaétait

nalement omparableà elledel'en y lopédieBritanni a,P.Assoulineet ses

étudiants[Gourdainetal.,2007℄sesontatta hésàmontrerle ontrairelorsqu'il

s'agitdess ien eshumaines.

Pourfairerespe tersesprin ipesfondateurs,la ommunautéwikipédiennea

progressivementmisenpla edesoutilsformelsouinformelsde ontrle.Ainsi,

auxarti lessontparfoisapposésdesbandeauxspé iques

3

évaluantlesarti les

enfon tiondeleurrespe t,ounon,desprin ipesfondateurs(parexemple

arti- lesdequalitéparoppositionàarti lessoupçonnésdenon-pertinen eouarti les

non neutres).Lespagesdedis ussion de esarti les oni tuelsa ueillentles

argumentsdes ontributeursetmédiateurs[Stviliaetal.,2005℄.Outre les

ban-deaux,unComité d'arbitrage(CAr) aétémisen pla epourréglerles onits

personnelssévèresentre ontributeurs.LeCArestunjurydeseptarbitresissus

de la ommunauté ontributri equi lesélit pourune période desix mois. Les

délibérationsetlesvotesduCArsontpubli set her hentautantquepossible

l'unanimité.Lesarbitresnesepronon entpassurle ontenu oulaligne

édito-riale,mais s'entiennentau prin ipefondamental de savoir-vivre (appelé aussi

wikilove). Ils ont despossibilitésdesan tion qui peuventaller dublo age

(in-terdi tionte hniqueettemporairede ontribuersurunouplusieursarti les)au

bannissementdénitif(interdi tiondeparti iperàtout ontenudeWikipédia).

Bien que relativement rare  seule une entaine d'utilisateurs sur les 31000

wikipédiens ont omparu devant le CAr en 5 ans , l'arbitrage onstitue un

outilimportantde gouvernan edeWikipédia.C'est àtravers es outils,et les

ontributeursquilesutilisent,ques'exer ele ontrledelapubli ation.

Après une des riptiondu orpus utilisé, nous établirons une typologie des

ontributeurssuivantdesparamètresquireètentleurimpli ationdansles

on-its et leur a tivité générale de publi ation et d'administration dans

l'en y- lopédie. Nous étudieronsensuite la répartition de es types de ontributeurs

dansl'éditiondesarti lessignalésparla ommunautéwikipédienne omme

par-ti ulièrement onformes,ouau ontrairenon onformes,auxprin ipesde

perti-nen een y lopédiqueet d'obje tivité.Nous on luronssurlesliensentretypes

de ontributeuret onformité d'unarti leauxprin ipesen y lopédiques.

1

http://fr.wikipedia.org/wiki/Wikipédia:Prin ipes_fondateurs 2

L'arti ulationentreneutralitédepointdevueetobje tivitéestréaliséeainsi:Cequeles

gens roient,voilàunfaitobje tif,etnouspouvonsprésenter elaassezfa ilementd'unpointde

vueneutre.(JimboWales,lefondateurdeWikipédia,http://fr.wikipedia.org/wiki/Wikipédia:

Neutralité_ de_ point_ de_ vue). 3

(4)

2 Corpus

Wikipédiaestuntermegénériquequire ouvreàlafoisuneinitiativede

réa-tiond'en y lopédieenligne

4

libre, ollaborativeetmultilingue,etl'ensembledes

instan esde etteen y lopédie,distin tesgéographiquementetsouvent

linguis-tiquement.Nousdisposonsdelasauvegarderéaliséele2avril2006,regroupant

tous lesarti les de Wikipédia-Fran e

5

depuisses débuts, soit plus de 600000

pages omprenant notamment prèsde370000pages d'arti lesauxquelles sont

asso iéesplusde40000pagesdedis ussionsurarti le.Les orpusquenous

étu-dionssontdespagesextraitesde ettebasetransforméesenXMLparWiki2Tei

6 .

Nousnoussommesparti ulièrementintéressésaux onitsentrewikipédiens

[Aurayet al.,2007, Kitturetal.,2007, Viégasetal.,2004℄ ar ils sont

révéla-teursdelamanièredontle ontrledelapubli ations'ee tue.Lepremierdes

orpus olle tés omprendles 1000arti lesde notre olle tionqui omportent

ouont omportéàunmomentdeleur évolutionunbandeaude ontroversede

neutralité,ainsiqueleuréventuellepagededis ussion.Environ1600

ontribu-teursapparaissentdans espages. Ces ontributeurs,bien qu'enpetit nombre,

ontunpoidsimportantdans Wikipédia arils ont parti ipéàenviron300000

arti lessur les 370000pages d'arti les de notre olle tion,soit 81%. Dans les

pagesd'arti lesetdedis ussions,lebalisagespé iquedesinformations onsiste

essentiellementàasso ierà haqueinterventionsataille,lenomdesonauteur,

etladatedesoninsertion.

L'autre orpusest onstituédesquatre-vingtspagesd'arbitragesquisesont

tenus durantlapériodedesdébuts deWikipédia-Fran eàavril2006.Le

balis-agede haquepage serépartiten rubriques qui répondentàla stru ture-type

desarbitrages. On aainsiune des ription du onit,qui identie leplaignant

et ladate de la plainte, le (ou les) a usé(s), la dé ision de re evabilité et la

dé isiondejugement.Ensuiteviennentlesargumentairesdesprotagonistes,les

dis ussions des arbitres sur la re evabilité de la plainte, et enn le jugement

proprement dit qui est omposé d'une proposition de san tion et d'un vote

desarbitres. Sil'unanimité nepeutsefaireautourde lapremièreproposition,

d'autrespropositionsetvotespeuventsuivre.

3 Typologie des wikipédiens en onit personnel

Dans la entaine d'arbitrage de notre orpus, ertains noms de

ontribu-teurs apparaissent plus souvent, soit dans le rle du plaignant qui dépose la

plainte,soit danslerledel'a usé.Ces deuxples,fréquen ede omparution

etrle danslaplainte,nous permettentdedégagerunepremièretypologiedes

ontributeursen onit.

Nous avonsdistinguétrois atégories de ontributeurs suivant lafréquen e

de omparution,lestrèshabituésqui umulententre3et14 omparutions

7

,les

4

Consultablesurhttp://www.wikipedia.org/.

5

Consultablesurhttp://fr.wikipedia.org/

6

Logi iellibredisponiblesurhttp://wiki2tei.sour eforge.net/ etdistribué onformémentà

la li en e BSD(http://www.opensour e.org/li en ses/b sd-li en se.ph p) . Il onvertit les balises

demiseenforme duwikitexteenbalisesXMLet insèreunen-tête des riptifdudo ument

onformeaumodèledelaTextEn odingInitiative(TEI)

7

(5)

habitués qui en ont deux, et les o asionnels qui ont une seule omparution.

Quantàleurrle danslaplainte,nousavonsdistinguélesplaignants, qui sont

plus souvent en position d'a usateurs, les a usés, qui ont plus de plaintes

déposées ontre eux qu'ils n'en déposent, et eux qui omparaissent de façon

assezéquilibréetanttenplaignantstanttena usés.Onvoitsurletableau1

queleswikipédiensqui omparaissentsouvent,lestrèshabitués,sontenmajorité

plaignants,alors que les o asionnels, qui n'ont omparu qu'une fois, sont en

majoritédesa usés.On onstateaussiquelamajoritéde euxquiont omparu

deuxfoisontétéune foisplaignants,unefoisa usés.

Comparutions Contributeurs Plaignant A usé Les 2

Trèshabitués 10 50% 30% 20%

Habitués 17 12% 29% 59%

O asionnels 74 30% 70% 0%

Tab.1Les omparutionsauComitéd'arbitrage

Nousavonsensuiteintroduitdans ette typologielemodede ontributionà

Wikipedia.Ainsi,nousavons onsidérélenombred'interventionsdansl'édition

del'ensembledes pagesd'arti leset dedis ussionsdeWikipédia-Fran e. Nous

avonsétabliquatre atégories,lestrèsgros ontributeurs dontle nombre

d'in-terventionsvarie entre environ12000et 40000pendantlapériode onsidérée,

lesgros ontributeurs,entre2800et 12000,les ontributeursmoyens entre600

et 2800, et lespetits ontributeurs, entre 1et 600. Nousavonsenn distingué

trois atégoriesde ontribution suivantque elle- i on ernait plussouventles

arti les,plussouventlesdis ussions,ouétaientrépartisentre lesdeux.

Contributions Contributeurs ->arti le -> dis ussion Les 2

Trèsgros ontributeurs 7 100% 0% 0%

Gros ontributeurs 23 96% 0% 4%

Contributeursmoyens 31 81% 0% 19%

Petits ontributeurs 40 70% 5% 25%

Tab.2Les ontributionsdesprotagonistesduComitéd'arbitrage

Le tableau 2montre que les ontributeurs en onit personnel parti ipent

dansl'ensembledavantageàl'élaborationdesarti lesqu'auxdis ussionsquiles

a ompagnent.Enrevan he,on onstatequemoinsils ontribuentauxarti les,

plusilsonttendan eàendis uter.En roisantlafréquen ede omparutionet

lataille desinterventions(tableau 3), onse rend ompte que lestrès habitués

du CAr sont en majoritédes gros ontributeurs, les o asionnels étant plutt

des petits ontributeurs. En roisant la taille des ontributions et lerle dans

laplainte(tableau 4),on onstate quelesgros ontributeurs sontplussouvent

plaignantset lespetits ontributeurs plussouventa usés.Lapartdes

protag-onistes qui sont, de façon omparable, tantt plaignants,tantta usés, reste

pour haquegroupemarginale.

Ces tableauxnous suggèrentquelesgros ontributeursàWikipédiaen ont

bien intégré les prin ipes fondamentaux, et tiennent à les faire respe ter. En

eet,latendan equiémergeestqueplusils ontribuentauxarti lesetplusils

(6)

Comparutions Contributeurs très gros gros moyen petit

Trèshabitués 10 20% 50% 30% 0%

Habitués 17 13% 29% 29% 29%

O asionnels 74 4% 18% 31% 47%

Tab.3Lestypesde ontributeursdansles omparutions

Contributions Contributeurs Plaignants A usés Les 2

Trèsgros ontributeurs 7 57% 29% 14%

Gros ontributeurs 23 39% 44% 17%

Contributeursmoyens 31 32% 58% 10%

Petits ontributeurs 40 15% 75% 10%

Tab.4Rle danslaplainte partaille de ontribution

[Bryantetal.,2005℄.Ce ontrles'exer edansle adreduCArparleurrleplus

intensif entantqueplaignant.Ils'exer emajoritairementvis-à-visde moyens

etpetits ontributeurs.

4 Les ontributeurs en onit dans les arti les

non neutres

En amontde l'arbitrage,lebandeau de ontroversede neutralité onstitue

pournouslepremierindi etangiblededésa ordentrewikipédiens.Nousavons

observéque77%desprotagonistesduCArgurentparmiles1600 ontributeurs

àau moins unarti le non neutre.Cette forte présen e suggèrequ'unegrande

partiedes onitsnaîtde ontroversessurl'obje tivité. Lestrèsgros

ontribu-teurs et lestrès habitués duCAr gurenttousdansle orpusdesarti lesnon

neutres,etlesplaignants presquetous(90%),alorsquelesa usés ysontmoins

présents(73%).Cesontlespetits ontributeursprésentsauCArquiparti ipent

lemoinsauxarti lesnonneutres(57%).

Pourdonnerune idéepluspré ise destypesde omportementsdes

wikipé-diensdans lepro essusde validationde l'information,nousétudions àprésent

leurs parti ipations àdes arti les ouverts parun bandeau parti ulier

8

. Nous

avonsutilisé esbandeauxpourtyperlesarti lesenarti les dequalité,arti les

en ontroversedeneutralité,arti lesen ontroversede pertinen e,etarti lesen

prote tion.

La gure 1représente, en ourbedé roissante,le nombrede ontributions

respe tivement aux arti lessousprote tion (A), auxarti les non neutres(B),

auxarti lesen ontroversedepertinen e(C),etauxarti lesdequalité(D),des

vingt ontributeurslesplus proliquesdu orpusdesarti lesnon neutres.Sur

esgraphes,leswikipédiensdestatutparti ulier

9

sontmarquésd'unastérisque,

etleur impli ationéventuelledansunarbitrageest indiquéeparune ligne

ver-8

Dénidans Wikipédia ommeétant untypede adre gurant dansles arti les pour

transmettreuneinformationouunlien.

9

Nousentendonsparstatutparti ulier unedistin tionspé iquededroitsetdefon tions

a ordéeà ertains ontributeursvolontairesélusparla ommunauté.Onyretrouveles

(7)

Fig.1Typesd'arti leset ontributeursen onit

ti ale proportionnelleau nombred'arbitrages.On observeque parmi lesvingt

prin ipaux ontributeurs auxarti les sous prote tion (1A), 35% ont omparu

devantleCAr.Leurrlelorsde esarbitragesestassezdisparate,tantt

plaig-nants, tantt a usés, habitués ou o asionnels devant le CAr. On note par

ontre qu'au sein des wikipédiens lesplus prolixesdans les arti lesde qualité

(1D),troisseulementsontimpliquésdansdesarbitrages,toujours omme

(8)

apparen e d'agressivité.Entre es deux tendan es, les ontributeurs aux

arti- lesnonneutresetauxarti lesnonpertinentsmontrentunetendan emoyenne

au onit. En eet25%des prin ipaux ontributeurs auxarti lesnon neutres

(gure 1B) et 20% des ontributeurs les plus on ernés par des arti les non

pertinents(gure1C)sontégalementprotagonistesd'unarbitrage.Parailleurs,

il est remarquableque lamajoritéde esgros ontributeursontégalementun

statutparti ulier.Cela onrmela orrélationdéjàsignaléeentrel'impli ation

forted'un ontributeur,tantparlenombrede ontributionsqueparunstatut

parti ulier,et saprésen e làoù lesprin ipes fondateursde Wikipédiaont

be-soind'êtredéfendus.Ilendé ouleunetendan eaurespe tdesrèglesdequalité

wikipédiennesdel'information làoù es ontributeursinterviennent.

5 Con lusion

Entantqu'espa e ollaboratifvisantà on entreretstru turerdes ontenus

en y lopédiques, Wikipédia est àl'origine de pro essus oopératifs,d'é hange

d'informationetdedésa ords.Àlasuited'uneétudedeshabitudesdes

wikipé-dienstantàtraversleurs ontributionsqu'au oursdes ontroverseset onits

nousavonsdégagédes omportementsdenatureàguiderd'autresutilisateurs

et à a orderune ertaine onan e àl'information.En eet,notre étude

ex-ploratoirea montré une tendan e des gros ontributeurs impliqués dans

l'ad-ministrationdeWikipédiaàs'investir pourfairerespe terlesrèglesduprojet,

notammentdanssonprin ipequalitatifdeneutralité depointdevue,quitteà

demanderunarbitragesile omportementd'un ontributeurn'estpas onforme

auprin ipeduwikilove.

Prin ipalement plaignantsmais peu habituésdu onit, es gros

ontribu-teurssemblento uperune position de ontrleéditorialet qualitatifsur

l'en- y lopédie.En ela,laprésen edetelswikipédiensparmiles ontributeursd'un

arti leapporteune ertaineabilitéàl'informationquiyaétédéposée.En

re-van he,uneforte on entrationde ontributeurshabituésdes onitspersonnels

pourraitindiquerunarti lesujetà aution.Cettetendan edemande ependant

àêtre onrmée d'unepartparune validation qualitativesur desarti lesnon

oni tuels,et d'autrepartparunexamendesmêmes lassesde ontributeurs

dansd'autresinstan esdeWikipédia.

Remer iements

Ce travailaétéréalisédans le adreduprojetAutograph

ANR-05-RNRT-03002(S0604108W).

Référen es

[Aurayet al.,2007℄ Auray,N., Poudat,C. etPons, P. (2007).

Demo ratiz-ings ienti vulgarization.Thebalan e between ooperationand oni t in

(9)

[Bryantetal., 2005℄ Bryant, S.L.,Forte,A.et Bru kman,A. (2005).

Be- omingWikipedian:transformationofparti ipationina ollaborativeonline

en y lopedia. In Pro eedings of the 2005 international ACM SIGGROUP

onferen e on Supporting group work, pages 110, Sanibel Island, Florida,

USA.ACM Press.

[Endrezzi,2007℄ Endrezzi, L.(2007). La ommunauté ommeauteur et

édi-teur:l'exemplede wikipédia. In Journéed'étude desURFIST :Évaulation

etvalidation de l'information surInternet,Paris.

[Giles,2005℄ Giles,J.(2005).Interneten y lopaediasgoheadtohead.Nature,

438(7070):900901.

[Gourdainetal.,2007℄ Gourdain, P., O'Kelly, F., Roman-Amat, B.,

Soulas,D.etvonDrostezuHülshoff,T.(2007).LaRévolutionWikipédia.

Lesen y lopédies vont-elles mourir? Éditions Milleet unenuits,Paris.

[Kitturetal.,2007℄ Kittur,A., Suh,B., Pendleton,B.et Chi,E. (2007).

Hesays,She Says:Coni t andCoordinationin Wikipedia. In Pro eedings

of the SIGCHI onferen e on Human fa tors in omputing systems, pages

453462,SanJose,Californie,USA.

[Stviliaetal.,2005℄ Stvilia, B., Twidale, M., Gasser, L. et Smith, L.

(2005). Information Quality Dis ussions in Wikipedia. Rapport te hnique

ISRNUIUCLIS2005/2+CSCW,UniversityofIllinoisatUrbana-Champaign.

[Viégasetal.,2004℄ Viégas, F. B., Wattenberg, M. et Dave, K. (2004).

Studying Cooperation and Coni t between Authors with history ow

Vi-sualizations. In Pro eedings ofthe SIGCHI onferen eon Humanfa tors in

Figure

Tab. 2  Les 
ontributions des protagonistes du Comité d'arbitrage
Fig. 1  Types d'arti
les et 
ontributeurs en 
onit

Références

Documents relatifs

Si vous souhaitez suivre exactement le circuit proposé, il vous faudra réserver pour vous, vos passagers et votre véhicule une traversée Toulon -> Ajaccio, puis un retour

Progressivement élaborée au fil de la carrière et de la vie de l’artiste au moyen d’un processus complexe d’interaction entre lui et le public via les médias, cette dernière

En aucun cas, la société AdVaes ne serait responsable des dommages (directs ou indirects) de quelque nature que ce soit résultant de l'utilisation ou de la confiance accordée à

On commence par proposer des collections représentées pour que les élèves puissent faire référence au groupement du matériel (« quand on a 10 sachets on peut les mettre dans

Savoirs : Aspect décimal (puisque les collections ne sont pas totalement groupées il faudra faire des conversions, comme par exemple 41 centaines = 4 milliers +

Un poomsé, est un ensemble de techniques que tu dois connaître : des coups de pied, des blocages, des coups de poing, des positions, des déplacements… Il en existe 8 à savoir

l’ancien champion du monde Garry Kasparov pour développer et crédibiliser son manga sur les échecs, illustré par Daitaro Nishihar. Véritable passionné de manga et de jeux

E Cliquez sur OK dans la boîte de dialogue Générateur de diagrammes pour créer le diagramme et appliquer le modèle. Le formatage du nouveau diagramme correspond à celui du diagramme