• Aucun résultat trouvé

Les moteurs de recherche au service de la valorisation des données

N/A
N/A
Protected

Academic year: 2022

Partager "Les moteurs de recherche au service de la valorisation des données"

Copied!
22
0
0

Texte intégral

(1)

Les moteurs de recherche au service de la valorisation

des données

Comment Jouve a assisté l'INPI dans la mise en œuvre

(2)

2

© 2016

Vos interlocuteurs

Bernard Barbier Chef de projets métier

INPI Alain Pubert

Centre de compétences Search & BigData JOUVE IT Solutions

(3)
(4)

4

© 2016

Jouve IT Solutions

Intégrateur expert des moteurs de recherche depuis plus de 20 ans

Conseil et expertise pour le choix de technologies.

Mise en œuvre d’applications orientées recherche (SBA), de la spécification à l’infogérance.

Valorisation de contenus par les traitements sémantiques.

• Aide à la migration de solutions propriétaires vers des architectures open source.

• Solutions de traitements distribuées à grande échelle : mise en place de Datalake et d’architectures Big Data innovantes répondant à des problématiques métiers.

(5)

L’INPI

L’INPI, Institut National de la Propriété Industrielle, est un établissement public autonome sous la tutelle du Ministère de l’Economie, de l’Industrie et de l’Emploi.

L’institut a pour mission de développer et d’organiser la propriété industrielle afin de protéger l’innovation.

(6)
(7)

Contexte

Qu’est ce qu’une marque :

• La marque est un « signe » servant à distinguer précisément un produit ou un service de ceux des concurrents.

• Une marque doit pouvoir être représentée graphiquement : un mot, un nom, un slogan, des chiffres, des lettres, un dessin ou un logo.

• La marque peut être protégée indéfiniment, à condition d’être renouvelée tous les 10 ans.

• La marque doit être disponible.

La mission de l’INPI dans le domaine des marques :

Recevoir, examiner et enregistrer les demandes de marque.

Diffuser l’information sur les marques auprès du grand public.

Accompagner les clients à l’occasion du dépôt de leurs marques.

Un outil :

• Une application de recherche d’antériorités (RA).

10 000 recherches par an pour les marques et 5 000 pour les sociétés.

bases-marques.inpi.fr/

(8)
(9)

Enjeux

Enjeux :

• L’INPI doit assurer une mission d’information dans le domaine de la propriété industrielle, en permettant notamment à un déposant de vérifier la disponibilité de sa marque avant son dépôt.

• Une marque est disponible lorsqu’elle ne reproduit ou n’imite pas une marque bénéficiant d’un droit antérieur, créant un risque de confusion pour le consommateur.

• Le langage des marques est en évolution constante.

Objectifs de la recherche d’antériorités :

• La recherche d’antériorités doit être complète, fiable et pertinente.

• Elle doit être efficiente et adaptée aux domaines des marques.

• Le service de recherche doit être interactif, paramétrable et évolutif pour s’adapter aux nouvelles tendances sur les dépôts de noms de marques.

(10)

10

© 2016

Le service de recherche d’antériorités par similarités

Le service de recherche :

• A utilisation interne

• Pour vérifier la disponibilité d’une marque

• Via une recherche par similarité

• En s’appuyant sur Apache Solr

3,7 millions de marques

5,3 millions

de sociétés

(11)
(12)

12

© 2016

Marque à déposer :

« Blé d’or »

« bredol »

« Blondor »

« Dorure de blé »

Visuel

Phonétique

Sémantique

Recherche par similarité

Un service de recherche efficient

(13)

Un service de recherche efficient

Mise en œuvre d’une « distance orthographique » pour déterminer la proximité entre le signe recherché et les antériorités.

7 calculs de

distances

Utilisation conjointe des uni-grams, bi-grams, tri-grams et skip-grams

Anagramme, masques de voyelles/consonnes

Visuel

Libellé Score EASYSAT 100,00%

EASYSTAT 83,95%

EASY a STAT 83,95%

RENAULT

EASYSEAT 78,85%

EASYVAT 76,44%

EASYSAF 74,52%

EASYSEA 67,45%

EASI-SET 60,00%

EASYBAR 60,00%

...

MEDIASAT 46,23%

Demande de dépôt :

EASYSAT

(14)

14

© 2016

Un outil interactif, paramétrable et évolutif

Un service de recherche qui se doit d’être interactif, paramétrable et évolutif pour s’adapter aux nouvelles tendances sur les dépôts de noms de marques.

(15)

Un outil interactif, paramétrable et évolutif

Un service de recherche qui se doit d’être interactif, paramétrable et évolutif pour s’adapter aux nouvelles tendances sur les dépôts de noms de marques.

Interactif :

Vision de l’analyse et possibilité d’agir.

(16)

16

© 2016

Un outil interactif, paramétrable et évolutif

Un service de recherche qui se doit d’être interactif, paramétrable et évolutif pour s’adapter aux nouvelles tendances sur les dépôts de noms de marques.

Paramétrable :

L’administrateur peut facilement modifier le thésaurus.

(17)

Un outil interactif, paramétrable et évolutif

Un service de recherche qui se doit d’être interactif, paramétrable et évolutif pour s’adapter aux nouvelles tendances sur les dépôts de noms de marques.

Evolutif :

La conception orientée en enchaînement des règles d’analyse et de recherche au sein du moteur Apache SOLR facilite l’ajout de nouvelles règles.

plus de 70 règles

algorithmiques

Utilisation des

filtres SOLR

(18)

18

© 2016

Un outil interactif, paramétrable et évolutif

la ville en fête le lagon bleu de Corse select

le lagon bleu décor select ? ou

Mise en œuvre d’une nouvelle règle de découpage qui s’adapte à la nouvelle tendance issue du web : pourvoir découper un terme arbitraire au delà de 2 mots qui était la règle jusqu’à maintenant.

lelagonbleudecorselect

lavillenfete

le lagon bleu de Corse select le lagon bleu décor select

Sémantique

(19)

Un résultat complet, fiable et pertinent

La recherche d’antériorités doit être pertinente et compréhensible.

Visuel

Phonétique

Sémantique

Recherche par similarités

(20)

20

© 2016

Un résultat complet, fiable et pertinent

La recherche d’antériorités doit être pertinente et compréhensible.

Libellé Score

ELEPHANT ROSE 96,00%

La marque apparaît dans les résultats grâce à

une similitude phonétique ELEFANROZ

Phonétique

/elefãroz/

(phonétique)

(21)

Conclusion

L’INPI dispose d’un service offrant les moyens d’accompagner les clients dans leurs dépôts de marques.

Le service de recherche par similarité s’appuie sur de nombreux algorithmes intégrés à Apache Solr qui garantissent son efficacité et sa précision pour identifier les marques antérieures qui pourraient créer un risque de confusion dans l’esprit du consommateur.

L’outil s’adapte facilement aux évolutions du langage des marques.

(22)

22

© 2016

Références

Documents relatifs

Résumé : A travers cette séquence, on abordera le fonctionnement basique d'un moteur de recherche, les différences produites par une même recherche effectuée avec quatre moteurs

Cette session permettra de comprendre les règles de base du droit d’auteur, et comment ce droit s’applique concrètement aux activités de recherche?. Voici quelques-unes des

La politique de collecte active auprès des chercheurs de l’Inserm permet la mise à disposition d’un « panel » d’archives plus riche pour les chercheurs en histoire ou

Les feuilles, les branches et le tronc ont &té recueillis et pesés séparément, puis transportés au laboratoire, séchés à 70% jusqu'à c e qu'ils atteignent une

varient beaucoup selon la localisation et la superficie de l'aire à traiter, selon la localisation et le type de piste d'atterrissage, selon le genre d'ap- p a r e

En moyenne, la production annuelle de cônes semble.. assez faible (10

EFFETS DE SEPT TRAITEMENTS DE FERTILISATION SUR LA PRODUCrION DE CONES ET DE GRAINES D'UN PEUPLEMENT DE SAPIN WUMIER AGE DE El

A partir des résultats préliminaires de l'étude effectuée dans le Parc des Laurentides, des observations faites par d'autres person- nes et de visites de sites où l'orignal