• Aucun résultat trouvé

Médias traditionnels, médias sociaux: caractériser la réinformation

N/A
N/A
Protected

Academic year: 2021

Partager "Médias traditionnels, médias sociaux: caractériser la réinformation"

Copied!
2
0
0

Texte intégral

(1)

HAL Id: hal-01843692

https://hal.inria.fr/hal-01843692

Submitted on 19 Jul 2018

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Médias traditionnels, médias sociaux: caractériser la réinformation

Cédric Maigrot, Ewa Kijak, Vincent Claveau

To cite this version:

Cédric Maigrot, Ewa Kijak, Vincent Claveau. Médias traditionnels, médias sociaux: caractériser la réinformation. TALN 2016 - Traitement Automatique du Langage Naturel, Jul 2016, Paris, France. pp.1. �hal-01843692�

(2)

edias traditionnels, m´

edias sociaux: caract´

eriser la r´

einformation

C´edric Maigrot

Ewa Kijak

Vincent Claveau

{pr´

enom}.{nom}@irisa.fr

edias traditionnels, m´

edias sociaux: caract´

eriser la r´

einformation

C´edric Maigrot

Ewa Kijak

Vincent Claveau

{pr´

enom}.{nom}@irisa.fr

Peut-on distinguer les m´

edias traditionnels et de r´

einformation automatiquement ?

ú M´edias de plus en plus pr´esents sur les r´eseaux sociaux

ú Sources d’informations parfois non professionnelles ou pros´elyte

ú Modifications ou d´eformations des informations pour servir un propos ú Existe t-il des diff´erences de forme et/ou de contenu entre ces m´edias ?

edias traditionnels

2 Existence d’une publication papier ou une chaˆıne de t´el´evision 2 Appartenance `a une soci´et´e de presse identifiable

edias de r´

einformation

2 Opposition aux m´edias traditionnels revendiqu´ee

2 R´ev´elation d’informations cach´ees par les m´edias de masse, souhait de diffuser la v´erit´e

Corpus

2 Messages Facebook (contenu du message, image d’illus-tration du message, nombre de mentions j’aime, . . .). 2 Messages provennant de groupes appartenant `a des

m´e-dias traditionnels et `a des m´edias de r´einformation, en fran¸cais et en anglais.

traditionnels r´einformation Total

Francophones 11 sources 34 sources

157 885 mess. 278 351 mess. 436 236 mess.

Anglophones 14 sources 11 sources

194 434 mess. 105 094 mess. 299 528 mess.

2 Annotation manuelle en trois classes :traditionnel, r´einformation ou autre (cas de sources non jug´ees comme sources d’information) par trois annotateurs. 2 Annotation bas´ee sur les sources des m´edias

2 Accords inter-annotateurs ´elev´es : κ de Fleiss [1] = 0.874 ; α de Krippendorff [2] = 0.875

Classification automatique

Pr´etraitements :

1. Lemmatisation avec TreeTaggger [3]

2. Remplacement des urls, hashtags et sources respectivement par les balises [URL] [HASHTAG] et [SOURCE], ensuite trait´es comme des mots 3. Si une URL est d´etect´ee dans le message initial, le contenu de la page point´ee par cette URL est ajout´e au message

Le contenu plus important que les descripteurs de surface, mais ...

ú Descripteurs de surface les plus discriminants 1. Taille du texte

2. Pr´esence des symboles ? et !

3. Orientation des pronoms personnels

ú Exemples de descripteurs de contenu discriminants

1. ’RSS’ et ’votre abonnement’ pour la langue fran¸caise 2. ’accessibility’ et ’privacy’ pour la langue anglaise

ú Descripteurs r´ev´elateurs du niveau de langage 1. WTF, DIY, pic pour r´einformation

2. pr´esence de marques de citations, opinion pour traditionnel ú Pr´esence de fautes d’orthographe qui cr´eent des cas d’erreur

(e.g repondre `a la place de r´epondre est caract´eristique des m´edias de r´einformation)

Perspectives

2 Travail sur un descripteur de respect de la norme orthographique /

stylo-m´etrie

2

Application `

a

la d´etection de fausses informations dans les

r´eseaux sociaux [4]

Ø Utilisation des contenus multim´edias associ´es aux messages (e.g image,

vid´eo)

Ø Analyse des aspects sociaux : r´eputation du m´edia, propagation des

infor-mations dans le graphe social, . . .

Ø Application des m´ethodes de Deep Learning `a cette probl´ematique

ef´

erences

[1] M. Davies et J.L. Fleiss. “Measuring agreement for multinomial data”. In : Biometrics (1982), p. 1047– 1051.

[2] K. Krippendorf. Content Analysis : An Introduction to its Methodology. Sage Publications, 1980. [3] Helmut Schmid. “Probabilistic Part-of-Speech Tagging Using Decision Trees”. In : International

Confe-rence on New Methods in Language Processing. Manchester, UK, 1994, p. 44–49.

[4] Christina Boididou et al. “Verifying multimedia use at mediaeval 2015”. In : Proceedings of the Me-diaEval 2015 Multimedia Benchmark Workshop. 2015.

Corpus et r´esultats mis `a jour disponibles `a l’adresse : https://www-linkmedia.irisa.fr/hoax-detection/

Références

Documents relatifs

On calcule un score tf-idf pour les mots des tweets collectés : on considère que l’ensemble des tweets associés à chaque événement constitue un "document" et que

Vous découvrirez dans cette vidéo comment : * recueillir les données fournies par les réseaux eux-mêmes, * tirer pleinement parti des outils de gestion et de surveillance des

Également, plusieurs études transversales ont démontré l’existence d’une relation positive entre l’utilisation passive de Facebook et l’envie, alors qu’aucune

Patrick Badillo (2014), « Réorganisation des médias : la « presse » d'information en France entre destructions et créations », XIXème Congrès de la Sfsic, 4-6 juin 2014

Dans la presse, en com- parant les résultats des régions fran- cophones du Nord à celles du Sud, nous observons que le nombre d’ar- ticles consacrés à la santé, la prévention

Colloque de clôture du réseau thématique langage & communication (2015-2019) Langage et communication: enjeux et impacts sociétaux.. I) Contextualisation

18 Si dans les pays dits démocratiques l’influence des forces politiques et économiques sur les médias peut paraître plus subtile, dans certains pays dont les régimes sont

Ainsi, nous observons une nouvelle fois que les jeunes sont plus critiques que les autres vis-à-vis du travail des journalistes alors que les personnes les plus âgées (55 ans