• Aucun résultat trouvé

Wikidata et Wiktionnaire : retour sur un échec annoncé. Pamputt, Wikiconvention francophone, 6-8 septembre 2019

N/A
N/A
Protected

Academic year: 2022

Partager "Wikidata et Wiktionnaire : retour sur un échec annoncé. Pamputt, Wikiconvention francophone, 6-8 septembre 2019"

Copied!
26
0
0

Texte intégral

(1)

Wikidata et Wiktionnaire : retour sur un échec annoncé

Pamputt, Wikiconvention francophone 6-8 septembre 2019

CC by-sa 3.0, https://commons.wikimedia.org/wiki/File:WiktionaryFr.svg

(2)

Plan

Ra ide historique

Avis légal de la Fondation sur les données lexicogra hiques Licence CC0 our les données lexicogra hiques ?

Wikimedia Commons Statistiques

(3)

Rapide historique

22 mars 2004 : création du Wiktionnaire en français

30 octobre 2012 : création de Wikidata

22 février 2018 : il est demandé à la communauté Wikidata

d’a rouver la licence CC0 our les données lexicogra hiques.

23 mai 2018 : les données lexicogra hiques sont activées sur Wikidata (seuls les lexèmes et les formes sont dis onibles)

18 octobre 2018 : les sens sont activés

(4)

Avant l’arrivée des données lexicographiques Avant l’arrivée des données lexicographiques

Wikimania 2016 : rencontre entre des contributeurs au Wiktionnaire et des dévelo eurs Wikidata

« Il y avait de leur art (dév. Wikidata) une véritable motivation à faire évoluer techniquement les Wiktionnaires et à enfin faire avancer la discussion avec les communautés de contributeurs, qui n’ont as été articulièrement attpirés ar la question jusqu’ici. »

ur, CC by-sa 4,0 mons.wikimedia.org/wiki/File:Pirate_meetu.jg

(5)

Avant l’arrivée des données lexicographiques

De nombreuses ro ositions de modèles de données

Date de début Auteur(s) principal(aux)

2013-02 JAn Dudík (cswikt), This, that and the other (enwikt), Darkdadaah (frwikt)

2013-06 Denny (WMDE)

2013-07 Micru (ca, wikidata), Francis Tyers (iswikt)

2013-08 Denny (WMDE)

2013-09 Ivadon (dewikt)

2013-10 Bigbossfarin (enwikt)

2014-10 GPHemsley (enwiki, wikidata)

2015-05 Denny (WMDE)

Toutes les ro ositions ont été traduites en français (sauf 2013-09, en allemand) our ouvoir en débattpre lus facilement (~63 ko de texte)

(6)

Avis légal de la Fondation Wikimedia (17/02/2018)

m:Wikilegal/Lexicogra hical_Data/fr

Informations lexicogra hiques non protégées ar le droit d’auteur :

Lemmes (le mot lui-même)

Définitions de jargon ou de mots avec des ex ressions figées

Prononciations

Informations grammaticales (masculin/féminin, nom/verbe/…, ...)

Collocations et ex ressions figées (exem le : «lourd silence »,

« luie battpante » ne sont as rotégeables)

(7)

Avis légal de la Fondation Wikimedia (17/02/2018)

m:Wikilegal/Lexicogra hical_Data/fr

Informations lexicogra hiques protégées ar le droit d’auteur :

Microstructure et macrostructure (l’organisation du dictionnaire).

Est-ce qu’im orter toutes les ages de catégories du Wiktionnaire (élément de la macrostructure) en tant qu’élément dans Wikidata est autorisé ?

Définitions

Étymologies

Informations ragmatiques (façon dont le mot est utilisée, s’il est archaïque, etc)

Informations encyclo édiques

Exem les de hrases (dans le cas d’exem les originaux)

(8)

Avis légal de la Fondation Wikimedia (17/02/2018)

Queestions ouvertes. Queid de ?

Choix d’une illustration associée à une définition

Liste de tous les mots d’un dictionnaire

Thésaurus

m:Talk:Wikilegal/Lexicogra hical Data

Un rout

(9)

Licence CC0 pour les données lexicographiques (22/02/2018)

Wikidata:Project_chat#Adding_the_Lexeme_names ace_to_the_licensing_footer_text

Discussions vives entre les artisans de la licence CC0 ermettpant une réutilisation la lus large ossible et des contributeurs aux

Wiktionnaires ( rinci alement) qui voient Wikidata comme un rojet concurrent qui va se faire en arallèle des Wiktionnaires

La discussion a araît comme un vote alors qu’il est très robable que les dévelo eurs de Wikidata aient révus d’a liquer la licence CC0 quel que soit le résultat

(10)

Licence CC0 pour les données lexicographiques (22/02/2018)

Wikidata:Project_chat#Adding_the_Lexeme_names ace_to_the_licensing_footer_text

Je considère que vous faites un fork du Wiktionnaire dans Wikidata

avec votre ro re calendrier.

Noé

(11)

Licence CC0 pour les données lexicographiques (22/02/2018)

Wikidata:Project_chat#Adding_the_Lexeme_names ace_to_the_licensing_footer_text

Je considère que vous faites un fork du Wiktionnaire dans Wikidata

avec votre ro re calendrier.

Noé

Ce rojet a commencé sous le nom

de « Données structurées our le Wiktionnaire ».

Queelque art en chemin, le but a changé, et il est devenu « Wikidata our les données lexicogra hiques ».

Je ense que ce changement était une erreur.

Je ne ense as qu'il uisse y avoir deux rojets lexicogra hiques rivaux chez Wikimedia.

Jheald

(12)

Licence CC0 pour les données lexicographiques (22/02/2018)

Wikidata:Project_chat#Adding_the_Lexeme_names ace_to_the_licensing_footer_text

Je considère que vous faites un fork du Wiktionnaire dans Wikidata

avec votre ro re calendrier.

Noé

Ce rojet a commencé sous le nom

de « Données structurées our le Wiktionnaire ».

Queelque art en chemin, le but a changé, et il est devenu « Wikidata our les données lexicogra hiques ».

Je ense que ce changement était une erreur.

Je ne ense as qu'il uisse y avoir deux rojets lexicogra hiques rivaux chez Wikimedia.

Jheald

C'est exactement ce que nous craignions de uis

le début sur le Wiktionnaire : que Wikidata commence à traiter les données lexicogra hiques sans même se soucier

de consulter les ersonnes qui créent et gèrent déjà des données lexicogra hiques sur Wikimedia chaque jour.

Com te tenu de la situation des licences et du manque flagrant de communication, deux rojets arallèles vont

travailler sur les mêmes roblèmes, mais sé arément.

Metaknowledge

(13)

Licence CC0 pour les données lexicographiques (22/02/2018)

Au bout d’une semaine de discussions, strakhov a fait les com tes Pour la licence CC0 : 26 ersonnes (~5910 modifications sur les Wiktionnaires, dont 5055 ar un seul contributeur)

Contre : 9 ersonnes (~158 027 modifications sur les Wiktionnaires)

Abstention : 3 ersonnes (~127 000 modifications sur les Wiktionnaires)

(14)

Licence CC0 pour les données lexicographiques (22/02/2018)

Au bout d’une semaine de discussions, strakhov a fait les com tes Pour la licence CC0 : 26 ersonnes (~5910 modifications sur les Wiktionnaires, dont 5055 ar un seul contributeur)

Contre : 9 ersonnes (~158 027 modifications sur les Wiktionnaires)

Abstention : 3 ersonnes (~127 000 modifications sur les Wiktionnaires)

Je voulais juste dire que le seul contributeur

significatif dans Wiktionary soutenant cettpe ro osition est

a aremment VIGNERON. Je ne vois as en quoi l'antagonisme d'un rojet entier est bon our nous, même s'il attpire d'autres ersonnes de l'extérieur. Je ne m'o ose as à la « structuration » de Wiktionary, car je trouve le travail effeectué là aussi assez ineffeicace, mais j'essaierais d'im liquer ces communautés au lieu de les contourner ici ar la force brute.

Leur demander et leur donner ce dont ils ont besoin. Si une artie im ortante des communautés Wiktionary ense que leur travail est lagié ou utilise

une mauvaise licence ar cettpe a roche des lexèmes de Wikidata et de la licence CC0, il est eut-être tem s de re enser la ro osition

(15)

Intermède : comment ça se passe avec Commons ?

CC by-sa 3.0https://commons.wikimedia.org/wiki/File:Commons-logo-en.svg

c:Commons:Structured_data

2017-2019 : rojet « Données structurées » sur Wikimedia Commons Stockage des (méta)données relatives aux fichiers multimédias de manière structurée

Le backend de Commons est migré sur Wikibase

(16)

Intermède : comment ça se passe avec Commons ?

CC by-sa 3.0https://commons.wikimedia.org/wiki/File:Commons-logo-en.svg

c:Commons:Structured_data

2017-2019 : rojet « Données structurées » sur Wikimedia Commons Stockage des (méta)données relatives aux fichiers multimédias de manière structurée

Le backend de Commons est migré sur Wikibase

Collaboration entre les développeurs de Wikidata et la

(17)

Finalement les lexèmes arrivent

22 mai 2018 : activation des lexèmes et des formes

il est demandé de ne as im orter de données des Wiktionnaires

22 se tembre : l’im ort de données ar bot est autorisé ar l’équi e Wikidata

18 octobre : les sens sont activés

(18)

grafana.wikimedia.org/d/00000000167/wikidata-datamodel

(19)

Engouement du début

https://grafana.wikimedia.org/d/00000000167/wikidata-datamodel

(20)

Engouement du début Intérêt moindre ?

grafana.wikimedia.org/d/00000000167/wikidata-datamodel

(21)

Engouement du début Intérêt moindre ? Arrivée de Elhuyar Fundazioa bot

https://grafana.wikimedia.org/d/00000000167/wikidata-datamodel

(22)

grafana.wikimedia.org/d/00000000167/wikidata-datamodel

(23)

Des personnes des Wiktionnaires ?

https://quarry.wmflabs.org/query/370426

Au 31 août :

80 utilisateurs ont fait plus de 100 contributions

~20 % de contributeurs au Wiktionnaire

22 ont fait plus de 1000 contributions (dont 3 bots)

Parmi les 20 plus gros contributeurs : 8 ont contribué

significativement (>1000 edits) à un Wiktionnaire (KaMan ( l), Vesihiisi (sv), Njardarlogar (en, nn), VIGNERON (fr, br),

Infovarius (ru), Thamizh arithi Maari (ta), Rua (en), -xfi- (cs))

Et 5 ont contribué ces 6 derniers mois

(24)

Wikidata : un Omegawiki bis ?

Omegawiki avait le but de fournir un dé ôt central de données lexicogra hiques. Ce rojet est objectivement un échec.

Tro technique : utile our ajouter/réutiliser des informations urement techniques (déclinaisons, conjugaison, …)

Attpention aux discussions. Une seule langue (anglais) (ou resque) conduit à une vision anglo-centrée et exclut de facto des

contributeurs. Comment assurer et encoder la diversité

(25)

Conclusion ?

Wikidata est vu comme un rojet concurrent aux Wiktionnaires Wikidata ne rofite as de l’ex érience des contributeurs aux Wiktionnaires

Contributions isolées sur les données lexicogra hiques – as encore de communauté structurée sur Wikidata

Mon avis : Wikidata sera rem li de données urement grammaticale (déclinaison, conjugaison, …) qui ourront être réutilisées ar les

Wiktionnaire. Je ne crois as au dévelo ement des sens.

(26)

Merci our votre attpention

Queestions ?

Commentaires ?

Discussion ?

Références

Documents relatifs

L’événement « manger une salade verte et une pizza aux quatre fromages » a une probabilité de 1/6. L’événement «manger une salade verte, une pizza végétarienne et une

II- Sur les conséquences de l’application de la loi FATCA par les Institutions financières françaises.. Sur les recommandations aux pouvoirs

Pour commencer, nous allons récupérer toutes les communes de France contenues dans la base de données, c’est-à-dire tous les éléments qui sont des instances ( wdt:P31 ) de commune

2°/ Sont également contestées les dispositions de l’article 82 de la loi déférée prévoyant, pour une période maximale de trois ans et sur les surfaces

136-1 du code électoral, le juge de l’élection, saisi par la Commission nationale des comptes de campagne et des financements politiques, peut déclarer inéligible le candidat

Le Père Noël se promènera du manège, Place Henri Barbusse, au Carrousel, Place de l’Abbaye.. • Photo avec le Père Noël Place

S’il est facile d’imaginer la configuration de l’énoncé, sa construction effec- tive demande

Il a donc un centre de sym´ etrie qui est confondu avec O puisqu’il est le point de concours des parall` eles aux c´ eviennes ` a mi-distance entre les c´ eviennes et les hauteurs