Les moteurs de recherche au service de la valorisation
des données
Comment Jouve a assisté l'INPI dans la mise en œuvre
2
© 2016
Vos interlocuteurs
Bernard Barbier Chef de projets métier
INPI Alain Pubert
Centre de compétences Search & BigData JOUVE IT Solutions
4
© 2016
Jouve IT Solutions
Intégrateur expert des moteurs de recherche depuis plus de 20 ans
• Conseil et expertise pour le choix de technologies.
• Mise en œuvre d’applications orientées recherche (SBA), de la spécification à l’infogérance.
• Valorisation de contenus par les traitements sémantiques.
• Aide à la migration de solutions propriétaires vers des architectures open source.
• Solutions de traitements distribuées à grande échelle : mise en place de Datalake et d’architectures Big Data innovantes répondant à des problématiques métiers.
L’INPI
L’INPI, Institut National de la Propriété Industrielle, est un établissement public autonome sous la tutelle du Ministère de l’Economie, de l’Industrie et de l’Emploi.
L’institut a pour mission de développer et d’organiser la propriété industrielle afin de protéger l’innovation.
Contexte
Qu’est ce qu’une marque :
• La marque est un « signe » servant à distinguer précisément un produit ou un service de ceux des concurrents.
• Une marque doit pouvoir être représentée graphiquement : un mot, un nom, un slogan, des chiffres, des lettres, un dessin ou un logo.
• La marque peut être protégée indéfiniment, à condition d’être renouvelée tous les 10 ans.
• La marque doit être disponible.
La mission de l’INPI dans le domaine des marques :
• Recevoir, examiner et enregistrer les demandes de marque.
• Diffuser l’information sur les marques auprès du grand public.
• Accompagner les clients à l’occasion du dépôt de leurs marques.
Un outil :
• Une application de recherche d’antériorités (RA).
• 10 000 recherches par an pour les marques et 5 000 pour les sociétés.
bases-marques.inpi.fr/
Enjeux
Enjeux :
• L’INPI doit assurer une mission d’information dans le domaine de la propriété industrielle, en permettant notamment à un déposant de vérifier la disponibilité de sa marque avant son dépôt.
• Une marque est disponible lorsqu’elle ne reproduit ou n’imite pas une marque bénéficiant d’un droit antérieur, créant un risque de confusion pour le consommateur.
• Le langage des marques est en évolution constante.
Objectifs de la recherche d’antériorités :
• La recherche d’antériorités doit être complète, fiable et pertinente.
• Elle doit être efficiente et adaptée aux domaines des marques.
• Le service de recherche doit être interactif, paramétrable et évolutif pour s’adapter aux nouvelles tendances sur les dépôts de noms de marques.
10
© 2016
Le service de recherche d’antériorités par similarités
Le service de recherche :
• A utilisation interne
• Pour vérifier la disponibilité d’une marque
• Via une recherche par similarité
• En s’appuyant sur Apache Solr
3,7 millions de marques
5,3 millions
de sociétés
12
© 2016
Marque à déposer :
« Blé d’or »
« bredol »
« Blondor »
« Dorure de blé »
Visuel
Phonétique
Sémantique
Recherche par similarité
Un service de recherche efficient
Un service de recherche efficient
Mise en œuvre d’une « distance orthographique » pour déterminer la proximité entre le signe recherché et les antériorités.
7 calculs de
distances
Utilisation conjointe des uni-grams, bi-grams, tri-grams et skip-gramsAnagramme, masques de voyelles/consonnes
Visuel
Libellé Score EASYSAT 100,00%
EASYSTAT 83,95%
EASY a STAT 83,95%
RENAULT
EASYSEAT 78,85%
EASYVAT 76,44%
EASYSAF 74,52%
EASYSEA 67,45%
EASI-SET 60,00%
EASYBAR 60,00%
...
MEDIASAT 46,23%
Demande de dépôt :
EASYSAT
14
© 2016
Un outil interactif, paramétrable et évolutif
Un service de recherche qui se doit d’être interactif, paramétrable et évolutif pour s’adapter aux nouvelles tendances sur les dépôts de noms de marques.
Un outil interactif, paramétrable et évolutif
Un service de recherche qui se doit d’être interactif, paramétrable et évolutif pour s’adapter aux nouvelles tendances sur les dépôts de noms de marques.
Interactif :
Vision de l’analyse et possibilité d’agir.
16
© 2016
Un outil interactif, paramétrable et évolutif
Un service de recherche qui se doit d’être interactif, paramétrable et évolutif pour s’adapter aux nouvelles tendances sur les dépôts de noms de marques.
Paramétrable :
L’administrateur peut facilement modifier le thésaurus.
Un outil interactif, paramétrable et évolutif
Un service de recherche qui se doit d’être interactif, paramétrable et évolutif pour s’adapter aux nouvelles tendances sur les dépôts de noms de marques.
Evolutif :
La conception orientée en enchaînement des règles d’analyse et de recherche au sein du moteur Apache SOLR facilite l’ajout de nouvelles règles.
plus de 70 règles
algorithmiques
Utilisation des
filtres SOLR
18
© 2016
Un outil interactif, paramétrable et évolutif
la ville en fête le lagon bleu de Corse select
le lagon bleu décor select ? ou
Mise en œuvre d’une nouvelle règle de découpage qui s’adapte à la nouvelle tendance issue du web : pourvoir découper un terme arbitraire au delà de 2 mots qui était la règle jusqu’à maintenant.
lelagonbleudecorselect
lavillenfete
le lagon bleu de Corse select le lagon bleu décor select
Sémantique
Un résultat complet, fiable et pertinent
La recherche d’antériorités doit être pertinente et compréhensible.
Visuel
Phonétique
Sémantique
Recherche par similarités
20
© 2016
Un résultat complet, fiable et pertinent
La recherche d’antériorités doit être pertinente et compréhensible.
Libellé Score
ELEPHANT ROSE 96,00%
La marque apparaît dans les résultats grâce à
une similitude phonétique ELEFANROZ
Phonétique
/elefãroz/
(phonétique)
Conclusion
L’INPI dispose d’un service offrant les moyens d’accompagner les clients dans leurs dépôts de marques.
Le service de recherche par similarité s’appuie sur de nombreux algorithmes intégrés à Apache Solr qui garantissent son efficacité et sa précision pour identifier les marques antérieures qui pourraient créer un risque de confusion dans l’esprit du consommateur.
L’outil s’adapte facilement aux évolutions du langage des marques.
22
© 2016