• Aucun résultat trouvé

d'AlgoLinkedsur l'utilisation des technologies Qwam

N/A
N/A
Protected

Academic year: 2022

Partager "d'AlgoLinkedsur l'utilisation des technologies Qwam"

Copied!
20
0
0

Texte intégral

(1)

communiqués de presse auprès

des journalistes pertinents grâce à l'analyse

sémantique »

Retour d'expérience d'AlgoLinked sur

l'utilisation des

technologies Qwam

www.algolinked.com

www.qwamci.com

Séminaire DIXIT - Innovations et nouveaux usages du Search et du Content Analytics : de la recherche d'information à la valorisation des (méga)données

Vendredi 17 Juin 2016 - de 13h30 à 18h

(2)

2

PLAN

PLATEFORME ALGOLINKED

ALGORITHME SEMANTIQUE QWAM

QUESTIONS - REPONSES

(3)
(4)

4

Nous sommes une plateforme de mise en relation entre

LES MEDIAS LES PETITES ORGANISATIONS

Start-up TPE, PME

Petites associations Professions libérales

Petites collectivités Tous médias

(TV, radio, presse, blog…)

(5)

5

CONSTAT N°1

99% 4 millions d’organisations sont

exclues du marché des Relations

avec les médias

(6)

6

CONSTAT N°2

Sollicitation des journalistes Infobésité de l’information Information mal ciblée

30 à 1 000

emails/ jour

(7)

7

CONSTAT N°3

Recherche l’authenticité

Contact avec une source

d’information qualifiée

(8)

8

Sélection des journalistes

L’algorithme sémantique

L’algorithme sémantique intervient tout au long du parcours client

Relance des journalistes

Recherche d’experts Lancement d’appels à

témoignages

(9)

Etape 1 : rédaction du communiqué de presse dans l’assistant de rédaction en ligne

(10)

Etape 2a : l’algorithme sémantique extrait les mots clés identifiés dans le contenu du communiqué de presse

(11)

Etape 2b : les journalistes sélectionnés sont affichés par ordre de pertinence

(12)

Etape 3 et 4 : le communiqué de presse est envoyé immédiatement ou planifié

(13)

Etape 5 : le client suit les statistiques d’ouverture et rappelle les journalistes

(14)
(15)

+ 22.000 Journalistes

www.unsite.fr

www.autresite.fr

...

Surveillance et récupération d’articles

Constitution d’une base de données (association d’articles aux journalistes par crawl web) au sein du data center Ask’n’Read de Qwam – concept général :

+ 50.000 sources actives / jour

Base de données

Pour chaque journaliste, on cherche sa signature dans les articles des médias sur lesquels il écrit

(16)

Journaliste 1

Spécialité 1 Spécialité 2

...

Journaliste 2 ...

Article 1 Article 2 ...

n-gram 1 n-gram 2 n-gram 3 ...

...

Constitution de la base – les données :

Chaque article associé à un journaliste est découpé en n-grams (unigrammes et expressions) dont seuls les plus pertinents sont gardés

Calcul de pertinence (poids) des n-grams :

- Poids via calculs de fréquences

- Poids en fonction du type (personne, société...) Chaque journaliste de la base est associé à ses spécialités (économie, droit...)

data center Ask’n’Read

(17)

Communiqué de presse (CP) d’un utilisateur

Découpage du CP en n-grams

Extrait des n-grams pertinents par calcul de poids

(poids en fonction du contenu du CP & des n-grams des articles de la base) top des n-grams = thématiques du CP

Ex : "service juridique", "jeune entrepreneur", "inégalités sociales"...

Modifications éventuelles des n-grams (suppressions/ajouts) par l’utilisateur Ajout éventuel de spécialités

Ex : "Justice", "Entrepreneuriat", "Droit",...

Appel de l’API Qwam par le site AlgoLinked (paramètre : CP)

Réponse de l’API Qwam (liste de n-grams)

(18)

Interrogation de la base de données à partir des n-grams du CP :

Ex : "@(title,description,text) (("service juridique") | ("jeune entrepreneur") ... "

& des spécialités demandées :

Ex : "Justice", "Entrepreneuriat", "Droit",...

Récupération des journalistes associés triés par poids

(poids n-grams + poids spécialités (calculs de fréquences en fonction des spécialités de la base))

Liste de journalistes pertinents + articles liés aux n-grams du CP

& spécialités couvertes

Second appel de l’API Qwam

(paramètres : n-grams + spécialités)

Réponse de l’API Qwam (liste de journalistes)

(19)

Retour (liste des journalistes) au format JSON – extrait :

(20)

www.algolinked.com Solène Chartier

www.qwamci.com Christian Langevin [email protected]

Références

Documents relatifs

Turkle met l’accent sur les nouvelles solitudes ainsi que sur les nouvelles intimités, que ce soit avec les robots dans la première partie de l’ouvrage, ou avec les machines

Figure 1 shows the performance evolution of the proposed methods based on n-grams to detect the deception in Arabic.. This performance evolution is calculated for Twitter (right

Abstract This work explores the exploitation of pre-processing, feature extrac- tion and the averaged combination of Support Vector Machines (SVM) outputs for the open-set

The best results for the task of determining whether the author is a bot or a human in English were obtained using SVM with char n-grams with range (1, 3) and word n-grams with

In this paper, we describe the approach to detect bot and human (male or female) out of the authors of tweets as a submission for Bots and Gender Profiling shared task at PAN 2019..

Our main goal is to investigate whether word embeddings could perform well on a multi-topic author attribution task.. The semantic information in word embeddings has been shown

 POS generation: Once the JSON list is obtained, the POS generation phase cre- ates a POS file with the same structure of the class file and relabels certain tokens (adding our

→ Comment utiliser les planisphères de référence pour localiser et caractériser un lieu.. → Comment utiliser les planisphères de référence pour localiser et caractériser