HAL Id: hal-00283569
https://hal.archives-ouvertes.fr/hal-00283569
Submitted on 30 May 2008
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of
sci-entific research documents, whether they are
pub-lished or not. The documents may come from
teaching and research institutions in France or
L’archive ouverte pluridisciplinaire HAL, est
destinée au dépôt et à la diffusion de documents
scientifiques de niveau recherche, publiés ou non,
émanant des établissements d’enseignement et de
recherche français ou étrangers, des laboratoires
Wikipédia
Bernard Jacquemin, Aurélien Lauf, Céline Poudat, Martine Hurault-Plantet,
Nicolas Auray
To cite this version:
Bernard Jacquemin, Aurélien Lauf, Céline Poudat, Martine Hurault-Plantet, Nicolas Auray. La
fi-abilité des informations sur le web. Le cas de Wikipédia. Actes de la 5e Conférence en Recherche
d’Information et Applications (CORIA 2008), Mar 2008, Trégastel, France. pp.449-456. �hal-00283569�
hal-00283569, version 1 - 30 May 2008
La abilité des informations sur le web: le as
Wikipédia Bernard Ja quemin 1 ,Aurélien Lauf 1 ,Céline Poudat 2 ,
MartineHurault-Plantet
1
et Ni olas Auray
2 1
LIMSI CNRS UPR 3251, Orsay (Fran e)
2
ENST, Paris(Fran e)
{Bernard.Ja quemin,Aurelien.Lauf,Martine.Hurault-Plantet}limsi.fr {Celine.Poudat,Ni olas.Auray}enst.fr
Résumé
Lesoutilsdere her hed'informationsurlewebdoiventtenir omptedes
phénomènesnouveauxliésàl'apparitiondesblogs,wikis,etautres
publi- ations ollaboratives.Parmi essites,l'en y lopédieWikipédia onstitue
une sour e importante d'information. La qualité de ses informations a
pourtant été ré emment mise en ause. Mieux onnaître les
omporte-ments des ontributeurs peut permettre de guider les utilisateurs dans
des ontenusdequalité parfoisdisparate. Pourexplorer ette voie,nous
présentons uneanalyse durle dediérentstypesde ontributeursdans
le ontrledelapubli ationd'arti les oni tuels.
Mots- lefs :Wikipédia,Fiabilité del'information,Conit, Travail
ol-laboratif.
Abstra t
OnlineIRtoolshavetotakeintoa ountnewphenomenalinkedtothe
ap-pearan eofblogs,wikiandother ollaborativepubli ations.Amongthese
ollaborative sites,Wikipedia representsa ru ialsour eofinformation.
However,thequalityofthisinformationhasbeenre entlyquestionned. A
betterknowledgeofthe ontributors'behaviorsshouldhelpusersnavigate
throughinformationwhosequalitymayvaryfromonesour etoanother.
Inordertoexplorethisidea,wepresentananalysisoftheroleofdierent
typesof ontributors inthe ontrol ofthepubli ationof oni tual
arti- les.
Keywords: Wikipedia, Information reliability, Coni t, Collaborative
work.
1 Introdu tion
Deplusenplusprésentdanslesrésultatsdesmoteursdere her he,leprojet
en y lopédiqueWikipédiaestdevenuparlesusagesuneressour e
information-nelle de référen e, et l'un des sites web les plus visibles et les plus
lequel l'expert et sa signature garantissaient la qualité des textes, Wikipédia
s'appuie sur inqprin ipesfondateurs
1
supposésgarantir ette qualité :projet
en y lopédique,neutralitédepointdevue, ontenulibre,règlesdesavoir-vivre,
et, enn, pas de règles xes en dehors de es prin ipes. Ainsi, si les
pro es-sus d'édition sont loin de eux de l'en y lopédie traditionnelle, les buts
af- hés de pertinen e en y lopédique et d'obje tivité
2
en restent assezpro hes
[Giles,2005,Endrezzi,2007℄. Néanmoins,laqualité del'en y lopédielibre fait
l'objetde débats: si[Giles,2005℄ a onstatéquelaqualité de Wikipédiaétait
nalement omparableà elledel'en y lopédieBritanni a,P.Assoulineet ses
étudiants[Gourdainetal.,2007℄sesontatta hésàmontrerle ontrairelorsqu'il
s'agitdess ien eshumaines.
Pourfairerespe tersesprin ipesfondateurs,la ommunautéwikipédiennea
progressivementmisenpla edesoutilsformelsouinformelsde ontrle.Ainsi,
auxarti lessontparfoisapposésdesbandeauxspé iques
3
évaluantlesarti les
enfon tiondeleurrespe t,ounon,desprin ipesfondateurs(parexemple
arti- lesdequalitéparoppositionàarti lessoupçonnésdenon-pertinen eouarti les
non neutres).Lespagesdedis ussion de esarti les oni tuelsa ueillentles
argumentsdes ontributeursetmédiateurs[Stviliaetal.,2005℄.Outre les
ban-deaux,unComité d'arbitrage(CAr) aétémisen pla epourréglerles onits
personnelssévèresentre ontributeurs.LeCArestunjurydeseptarbitresissus
de la ommunauté ontributri equi lesélit pourune période desix mois. Les
délibérationsetlesvotesduCArsontpubli set her hentautantquepossible
l'unanimité.Lesarbitresnesepronon entpassurle ontenu oulaligne
édito-riale,mais s'entiennentau prin ipefondamental de savoir-vivre (appelé aussi
wikilove). Ils ont despossibilitésdesan tion qui peuventaller dublo age
(in-terdi tionte hniqueettemporairede ontribuersurunouplusieursarti les)au
bannissementdénitif(interdi tiondeparti iperàtout ontenudeWikipédia).
Bien que relativement rare seule une entaine d'utilisateurs sur les 31000
wikipédiens ont omparu devant le CAr en 5 ans , l'arbitrage onstitue un
outilimportantde gouvernan edeWikipédia.C'est àtravers es outils,et les
ontributeursquilesutilisent,ques'exer ele ontrledelapubli ation.
Après une des riptiondu orpus utilisé, nous établirons une typologie des
ontributeurssuivantdesparamètresquireètentleurimpli ationdansles
on-its et leur a tivité générale de publi ation et d'administration dans
l'en y- lopédie. Nous étudieronsensuite la répartition de es types de ontributeurs
dansl'éditiondesarti lessignalésparla ommunautéwikipédienne omme
par-ti ulièrement onformes,ouau ontrairenon onformes,auxprin ipesde
perti-nen een y lopédiqueet d'obje tivité.Nous on luronssurlesliensentretypes
de ontributeuret onformité d'unarti leauxprin ipesen y lopédiques.
1
http://fr.wikipedia.org/wiki/Wikipédia:Prin ipes_fondateurs 2
L'arti ulationentreneutralitédepointdevueetobje tivitéestréaliséeainsi:Cequeles
gens roient,voilàunfaitobje tif,etnouspouvonsprésenter elaassezfa ilementd'unpointde
vueneutre.(JimboWales,lefondateurdeWikipédia,http://fr.wikipedia.org/wiki/Wikipédia:
Neutralité_ de_ point_ de_ vue). 3
2 Corpus
Wikipédiaestuntermegénériquequire ouvreàlafoisuneinitiativede
réa-tiond'en y lopédieenligne
4
libre, ollaborativeetmultilingue,etl'ensembledes
instan esde etteen y lopédie,distin tesgéographiquementetsouvent
linguis-tiquement.Nousdisposonsdelasauvegarderéaliséele2avril2006,regroupant
tous lesarti les de Wikipédia-Fran e
5
depuisses débuts, soit plus de 600000
pages omprenant notamment prèsde370000pages d'arti lesauxquelles sont
asso iéesplusde40000pagesdedis ussionsurarti le.Les orpusquenous
étu-dionssontdespagesextraitesde ettebasetransforméesenXMLparWiki2Tei
6 .
Nousnoussommesparti ulièrementintéressésaux onitsentrewikipédiens
[Aurayet al.,2007, Kitturetal.,2007, Viégasetal.,2004℄ ar ils sont
révéla-teursdelamanièredontle ontrledelapubli ations'ee tue.Lepremierdes
orpus olle tés omprendles 1000arti lesde notre olle tionqui omportent
ouont omportéàunmomentdeleur évolutionunbandeaude ontroversede
neutralité,ainsiqueleuréventuellepagededis ussion.Environ1600
ontribu-teursapparaissentdans espages. Ces ontributeurs,bien qu'enpetit nombre,
ontunpoidsimportantdans Wikipédia arils ont parti ipéàenviron300000
arti lessur les 370000pages d'arti les de notre olle tion,soit 81%. Dans les
pagesd'arti lesetdedis ussions,lebalisagespé iquedesinformations onsiste
essentiellementàasso ierà haqueinterventionsataille,lenomdesonauteur,
etladatedesoninsertion.
L'autre orpusest onstituédesquatre-vingtspagesd'arbitragesquisesont
tenus durantlapériodedesdébuts deWikipédia-Fran eàavril2006.Le
balis-agede haquepage serépartiten rubriques qui répondentàla stru ture-type
desarbitrages. On aainsiune des ription du onit,qui identie leplaignant
et ladate de la plainte, le (ou les) a usé(s), la dé ision de re evabilité et la
dé isiondejugement.Ensuiteviennentlesargumentairesdesprotagonistes,les
dis ussions des arbitres sur la re evabilité de la plainte, et enn le jugement
proprement dit qui est omposé d'une proposition de san tion et d'un vote
desarbitres. Sil'unanimité nepeutsefaireautourde lapremièreproposition,
d'autrespropositionsetvotespeuventsuivre.
3 Typologie des wikipédiens en onit personnel
Dans la entaine d'arbitrage de notre orpus, ertains noms de
ontribu-teurs apparaissent plus souvent, soit dans le rle du plaignant qui dépose la
plainte,soit danslerledel'a usé.Ces deuxples,fréquen ede omparution
etrle danslaplainte,nous permettentdedégagerunepremièretypologiedes
ontributeursen onit.
Nous avonsdistinguétrois atégories de ontributeurs suivant lafréquen e
de omparution,lestrèshabituésqui umulententre3et14 omparutions
7
,les
4
Consultablesurhttp://www.wikipedia.org/.
5
Consultablesurhttp://fr.wikipedia.org/
6
Logi iellibredisponiblesurhttp://wiki2tei.sour eforge.net/ etdistribué onformémentà
la li en e BSD(http://www.opensour e.org/li en ses/b sd-li en se.ph p) . Il onvertit les balises
demiseenforme duwikitexteenbalisesXMLet insèreunen-tête des riptifdudo ument
onformeaumodèledelaTextEn odingInitiative(TEI)
7
habitués qui en ont deux, et les o asionnels qui ont une seule omparution.
Quantàleurrle danslaplainte,nousavonsdistinguélesplaignants, qui sont
plus souvent en position d'a usateurs, les a usés, qui ont plus de plaintes
déposées ontre eux qu'ils n'en déposent, et eux qui omparaissent de façon
assezéquilibréetanttenplaignantstanttena usés.Onvoitsurletableau1
queleswikipédiensqui omparaissentsouvent,lestrèshabitués,sontenmajorité
plaignants,alors que les o asionnels, qui n'ont omparu qu'une fois, sont en
majoritédesa usés.On onstateaussiquelamajoritéde euxquiont omparu
deuxfoisontétéune foisplaignants,unefoisa usés.
Comparutions Contributeurs Plaignant A usé Les 2
Trèshabitués 10 50% 30% 20%
Habitués 17 12% 29% 59%
O asionnels 74 30% 70% 0%
Tab.1Les omparutionsauComitéd'arbitrage
Nousavonsensuiteintroduitdans ette typologielemodede ontributionà
Wikipedia.Ainsi,nousavons onsidérélenombred'interventionsdansl'édition
del'ensembledes pagesd'arti leset dedis ussionsdeWikipédia-Fran e. Nous
avonsétabliquatre atégories,lestrèsgros ontributeurs dontle nombre
d'in-terventionsvarie entre environ12000et 40000pendantlapériode onsidérée,
lesgros ontributeurs,entre2800et 12000,les ontributeursmoyens entre600
et 2800, et lespetits ontributeurs, entre 1et 600. Nousavonsenn distingué
trois atégoriesde ontribution suivantque elle- i on ernait plussouventles
arti les,plussouventlesdis ussions,ouétaientrépartisentre lesdeux.
Contributions Contributeurs ->arti le -> dis ussion Les 2
Trèsgros ontributeurs 7 100% 0% 0%
Gros ontributeurs 23 96% 0% 4%
Contributeursmoyens 31 81% 0% 19%
Petits ontributeurs 40 70% 5% 25%
Tab.2Les ontributionsdesprotagonistesduComitéd'arbitrage
Le tableau 2montre que les ontributeurs en onit personnel parti ipent
dansl'ensembledavantageàl'élaborationdesarti lesqu'auxdis ussionsquiles
a ompagnent.Enrevan he,on onstatequemoinsils ontribuentauxarti les,
plusilsonttendan eàendis uter.En roisantlafréquen ede omparutionet
lataille desinterventions(tableau 3), onse rend ompte que lestrès habitués
du CAr sont en majoritédes gros ontributeurs, les o asionnels étant plutt
des petits ontributeurs. En roisant la taille des ontributions et lerle dans
laplainte(tableau 4),on onstate quelesgros ontributeurs sontplussouvent
plaignantset lespetits ontributeurs plussouventa usés.Lapartdes
protag-onistes qui sont, de façon omparable, tantt plaignants,tantta usés, reste
pour haquegroupemarginale.
Ces tableauxnous suggèrentquelesgros ontributeursàWikipédiaen ont
bien intégré les prin ipes fondamentaux, et tiennent à les faire respe ter. En
eet,latendan equiémergeestqueplusils ontribuentauxarti lesetplusils
Comparutions Contributeurs très gros gros moyen petit
Trèshabitués 10 20% 50% 30% 0%
Habitués 17 13% 29% 29% 29%
O asionnels 74 4% 18% 31% 47%
Tab.3Lestypesde ontributeursdansles omparutions
Contributions Contributeurs Plaignants A usés Les 2
Trèsgros ontributeurs 7 57% 29% 14%
Gros ontributeurs 23 39% 44% 17%
Contributeursmoyens 31 32% 58% 10%
Petits ontributeurs 40 15% 75% 10%
Tab.4Rle danslaplainte partaille de ontribution
[Bryantetal.,2005℄.Ce ontrles'exer edansle adreduCArparleurrleplus
intensif entantqueplaignant.Ils'exer emajoritairementvis-à-visde moyens
etpetits ontributeurs.
4 Les ontributeurs en onit dans les arti les
non neutres
En amontde l'arbitrage,lebandeau de ontroversede neutralité onstitue
pournouslepremierindi etangiblededésa ordentrewikipédiens.Nousavons
observéque77%desprotagonistesduCArgurentparmiles1600 ontributeurs
àau moins unarti le non neutre.Cette forte présen e suggèrequ'unegrande
partiedes onitsnaîtde ontroversessurl'obje tivité. Lestrèsgros
ontribu-teurs et lestrès habitués duCAr gurenttousdansle orpusdesarti lesnon
neutres,etlesplaignants presquetous(90%),alorsquelesa usés ysontmoins
présents(73%).Cesontlespetits ontributeursprésentsauCArquiparti ipent
lemoinsauxarti lesnonneutres(57%).
Pourdonnerune idéepluspré ise destypesde omportementsdes
wikipé-diensdans lepro essusde validationde l'information,nousétudions àprésent
leurs parti ipations àdes arti les ouverts parun bandeau parti ulier
8
. Nous
avonsutilisé esbandeauxpourtyperlesarti lesenarti les dequalité,arti les
en ontroversedeneutralité,arti lesen ontroversede pertinen e,etarti lesen
prote tion.
La gure 1représente, en ourbedé roissante,le nombrede ontributions
respe tivement aux arti lessousprote tion (A), auxarti les non neutres(B),
auxarti lesen ontroversedepertinen e(C),etauxarti lesdequalité(D),des
vingt ontributeurslesplus proliquesdu orpusdesarti lesnon neutres.Sur
esgraphes,leswikipédiensdestatutparti ulier
9
sontmarquésd'unastérisque,
etleur impli ationéventuelledansunarbitrageest indiquéeparune ligne
ver-8
Dénidans Wikipédia ommeétant untypede adre gurant dansles arti les pour
transmettreuneinformationouunlien.
9
Nousentendonsparstatutparti ulier unedistin tionspé iquededroitsetdefon tions
a ordéeà ertains ontributeursvolontairesélusparla ommunauté.Onyretrouveles
Fig.1Typesd'arti leset ontributeursen onit
ti ale proportionnelleau nombred'arbitrages.On observeque parmi lesvingt
prin ipaux ontributeurs auxarti les sous prote tion (1A), 35% ont omparu
devantleCAr.Leurrlelorsde esarbitragesestassezdisparate,tantt
plaig-nants, tantt a usés, habitués ou o asionnels devant le CAr. On note par
ontre qu'au sein des wikipédiens lesplus prolixesdans les arti lesde qualité
(1D),troisseulementsontimpliquésdansdesarbitrages,toujours omme
apparen e d'agressivité.Entre es deux tendan es, les ontributeurs aux
arti- lesnonneutresetauxarti lesnonpertinentsmontrentunetendan emoyenne
au onit. En eet25%des prin ipaux ontributeurs auxarti lesnon neutres
(gure 1B) et 20% des ontributeurs les plus on ernés par des arti les non
pertinents(gure1C)sontégalementprotagonistesd'unarbitrage.Parailleurs,
il est remarquableque lamajoritéde esgros ontributeursontégalementun
statutparti ulier.Cela onrmela orrélationdéjàsignaléeentrel'impli ation
forted'un ontributeur,tantparlenombrede ontributionsqueparunstatut
parti ulier,et saprésen e làoù lesprin ipes fondateursde Wikipédiaont
be-soind'êtredéfendus.Ilendé ouleunetendan eaurespe tdesrèglesdequalité
wikipédiennesdel'information làoù es ontributeursinterviennent.
5 Con lusion
Entantqu'espa e ollaboratifvisantà on entreretstru turerdes ontenus
en y lopédiques, Wikipédia est àl'origine de pro essus oopératifs,d'é hange
d'informationetdedésa ords.Àlasuited'uneétudedeshabitudesdes
wikipé-dienstantàtraversleurs ontributionsqu'au oursdes ontroverseset onits
nousavonsdégagédes omportementsdenatureàguiderd'autresutilisateurs
et à a orderune ertaine onan e àl'information.En eet,notre étude
ex-ploratoirea montré une tendan e des gros ontributeurs impliqués dans
l'ad-ministrationdeWikipédiaàs'investir pourfairerespe terlesrèglesduprojet,
notammentdanssonprin ipequalitatifdeneutralité depointdevue,quitteà
demanderunarbitragesile omportementd'un ontributeurn'estpas onforme
auprin ipeduwikilove.
Prin ipalement plaignantsmais peu habituésdu onit, es gros
ontribu-teurssemblento uperune position de ontrleéditorialet qualitatifsur
l'en- y lopédie.En ela,laprésen edetelswikipédiensparmiles ontributeursd'un
arti leapporteune ertaineabilitéàl'informationquiyaétédéposée.En
re-van he,uneforte on entrationde ontributeurshabituésdes onitspersonnels
pourraitindiquerunarti lesujetà aution.Cettetendan edemande ependant
àêtre onrmée d'unepartparune validation qualitativesur desarti lesnon
oni tuels,et d'autrepartparunexamendesmêmes lassesde ontributeurs
dansd'autresinstan esdeWikipédia.
Remer iements
Ce travailaétéréalisédans le adreduprojetAutograph
ANR-05-RNRT-03002(S0604108W).
Référen es
[Aurayet al.,2007℄ Auray,N., Poudat,C. etPons, P. (2007).
Demo ratiz-ings ienti vulgarization.Thebalan e between ooperationand oni t in
[Bryantetal., 2005℄ Bryant, S.L.,Forte,A.et Bru kman,A. (2005).
Be- omingWikipedian:transformationofparti ipationina ollaborativeonline
en y lopedia. In Pro eedings of the 2005 international ACM SIGGROUP
onferen e on Supporting group work, pages 110, Sanibel Island, Florida,
USA.ACM Press.
[Endrezzi,2007℄ Endrezzi, L.(2007). La ommunauté ommeauteur et
édi-teur:l'exemplede wikipédia. In Journéed'étude desURFIST :Évaulation
etvalidation de l'information surInternet,Paris.
[Giles,2005℄ Giles,J.(2005).Interneten y lopaediasgoheadtohead.Nature,
438(7070):900901.
[Gourdainetal.,2007℄ Gourdain, P., O'Kelly, F., Roman-Amat, B.,
Soulas,D.etvonDrostezuHülshoff,T.(2007).LaRévolutionWikipédia.
Lesen y lopédies vont-elles mourir? Éditions Milleet unenuits,Paris.
[Kitturetal.,2007℄ Kittur,A., Suh,B., Pendleton,B.et Chi,E. (2007).
Hesays,She Says:Coni t andCoordinationin Wikipedia. In Pro eedings
of the SIGCHI onferen e on Human fa tors in omputing systems, pages
453462,SanJose,Californie,USA.
[Stviliaetal.,2005℄ Stvilia, B., Twidale, M., Gasser, L. et Smith, L.
(2005). Information Quality Dis ussions in Wikipedia. Rapport te hnique
ISRNUIUCLIS2005/2+CSCW,UniversityofIllinoisatUrbana-Champaign.
[Viégasetal.,2004℄ Viégas, F. B., Wattenberg, M. et Dave, K. (2004).
Studying Cooperation and Coni t between Authors with history ow
Vi-sualizations. In Pro eedings ofthe SIGCHI onferen eon Humanfa tors in