HAL Id: hal-00707738
https://hal.archives-ouvertes.fr/hal-00707738
Submitted on 13 Jun 2012
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
PatClust: une plateforme pour la classification sémantique des brevets
Abdoulaye Guissé, Khaled Khelif, Martine Collard
To cite this version:
Abdoulaye Guissé, Khaled Khelif, Martine Collard. PatClust: une plateforme pour la classification sémantique des brevets. IC2009, 2009, Hammamet, Tunisie. pp.AFIA2009. �hal-00707738�
! {prenom.nom}@sophia.inria.fr
" # # $ # #
% & # # # & '
" & $ # #
( ( % % # $
$ % ( & ) #( $ $ & ( # $
# & # # # # ( ##* & #
# & # ( + # ' % ,
% # # ( & +
( ## - ( & # # $
% # " % # # #
# % % * ( $ & '
# && % + ( + #
% ' . % # & # * +# %
# *$ $ % & * #
% # - *& ' /( + #
# & ( # # #
& ! & ( $
# # ' / # & # + #
& & ( + % '
. # # # % # - # &
& & # # + # $ ,
& ' /( # % # - # $ !
& ( # # # # &
+ ' 0 & % ( ( # #
& # # & + #
% '
/( # ( # $ !
& + & # # # %
' 0 # & ( $ ( + #
# # ( $ 1 & & # ' && ( #
# % & ( # % # 2
( & 3 # ( # # ( $ 4 # 3564
# # # % # #
356 764' % + # & # # '
! "
/( # # # # #
( $ ( $ $ # # &
# # # % % # % # # # * 3 $
4' # % # # # + # #
* # ' 5 ( # # * #
# # # # ' /
( # # # - % ( $ '
( # # * # && "
( ) ( ) ( )
( )− ( )
∈
∑
+
=
3 48
( )
" / # # * '( )
" / # # # 56 76'4
3 " / ( # # # ( $ '
4
3 " & # # *
!
5 # # # % # &
% # + ' # # - & - #
$ & # & & &
+ % ' & + + #
& # # + 3#'-' # ( # 4' /
& + # # # # # # &
( $ ' 7 # (
# & # # ( $ & & 9
3 8::;4 % ( ! ' #
# # $ # # & + # #
( $ ' / # # # & # #
# & # # # ( $ ' & &
+ # # ! & # # '
% + # & %
# 56 76 "
"
" /( & # # # % % " :'
" / # # % '
+ # # && && &
# # + - + # % # % '
# !
$ " # # $ & 0
"
< " #
&
$ &
#
%
% 7 # &
%
!
%
+ +
9 $ %
9 (
&
+ # &
& "
+
( ) ∑ (= ) [ ( ) ]
∈
∈
−
−
=
( ) [ ( ) ]
∑
∈∈ + −
=
=
#
# # # & #
# # & > # % &
# & % - ( % # # ' ( # #
$ & 3% 6 $ =4 " & (
& "3# # 4 & (
# %
& & # & # ' /( 0
3 ' 8::?4 & & $ # & % #
% # # - + & ( + #
& 3% # % 4 # # ' / @
0 # - # & % % $ #
% # ( # & % - + + 3A # B4
# - # # ( # & % ' 5 ( + # &
# # & ( # # # & @ (
3 ' 8::?4' # $ $ & ( $ &
1 ( + # # ( $ # # + '
# "
& & # ( # & # C#
# # ' / & & & + # # # " #
& # 3# 4 #
& ( # &
( $ & ( & &
# 8' % # + ( $ &
$ & & $ &
'
# # %
& # - % ( &
# # ' /( ( # # &
+ # + ' /' # - # #
# - > # # # #'-' ' # #
&& % # # ' 0 & &
# # % "
& # # # # '
$ # # # # # & % '
( & + # # # # '
& & $ # # # # (
% ' # & & # # '
& % "
$
92 % ( & + ( # % ( & + '
( & + # # # % #
# # ' & % "
92 "
% % & + '
& & # # '
& & # &
( &D& # '
( & + & # # '
& & # &
( &D& # & # &D&
+ # '
& % "
) (
# % # $ & # #
? # ' / 5 = & % # #
& # # # '
& # & $ #
& & * # & # # # &
% & & & $ & %
& ' / $ % % # $ # /.59=
& % $ # # ' #
# - &
# & ( & ( # '
# & * - % #
& # & & + '
= "EE$ ' #' & ' E$F & E# E# E % % !
( ) ∑ ( )
∈∈
=
%
% %
% =
8
( )
( )
( )
∑
∑
∈∈
∈∈
=
%
%
%
%
%
&
( )
%( )
& =
( ) ∑ ( )
∈∈
=
%
% %
% =
8
( )
( )
( )
∑
∑
∈∈
∈∈
=
%%
%
%
%
&
'
Isim Esim EsimCentroides Isimsem Esimsem Approche standard 0.309 0.201 0.749 0.162 0.015 Propagation des poids 0.810 0.160 0.937 0.500 0.017 Distance sémantique 0.794 0.151 0.999 0.515 0.016
* " & # 56 76
$ " " / # ( # 56 76
$ " #" / # # # # # ( #
$ 56 76
(
$ " )" / # # # # # ( # #
& 56 76
+
% ( *$ 3 5 8::; :8?8;G4
( # % $ & # &&
( & & # ' % $ #
C# ( # ( & ( D
# ' . & # # # # #
$ % # ! & '
9 HI 9' J 7 . 5K ' J 6 9 K. ' J 79 6' 38::;4' # $
& # , " + & L 0 # $ 9 $ ' $
& J # % ' 8= = ' 8: 8? 8::;'
1 / 6 ' J 7 . 5K ' J H H I0' 38::?4' 9 $ #
5 + $ & % H $ # 7 & ' < . %
& # # 3<. 4 # 9 $ # M ' =N '
=8 ' =OO= =G:? 8::?'
19./ ' J 1 / 6 ' J 7 . 5K ' 38::?4 $ 0 $ $
9 $ & # 0 #' , $ # (:? . 8::?'