• Aucun résultat trouvé

Adaptation de la structure dans XML

Chapitre 4 Dictionnaire en mandarin

4.2 Adaptation de la structure dans XML

Pour la macrostructure du dictionnaire, dans le DiCoLiLex du français, le niveau de balisage le plus haut est <mot>, suivi de <vocable>, mais en général, un fichier contient un seul vocable regroupant les copolysèmes de ce vocable. Les lexies d’un vocable ont toutes la même partie du discours. Cependant, en mandarin, un sémantème peut correspondre à des lexies qui possèdent une même forme, mais appartiennent à des catégories grammaticales différentes, comme nous avons expliqué à la section §3.1, p. 28. Ainsi, nous avons mis les vocables ayant le même signifiant, mais de différentes parties du discours dans un même fichier.

Pour la microstructure du dictionnaire, d’une part, nous avons ajouté de nouveaux éléments, notamment la glose et le pinyin pour les sinogrammes afin de faciliter la lecture pour les locuteurs non natifs. Plus précisément, nous avons ajouté le pinyin comme attribut des balises <vocable> et <élément> pour indiquer la prononciation de ces éléments représentés par les sinogrammes. Nous avons également ajouté une glose comme attribut de la balise <élément> et comme balise <glose> à l’intérieur de la balise <lexie> afin de donner une traduction des lexies. D’autre part, nous avons supprimé les éléments non pertinents pour le mandarin, par exemple, le genre, la définitude et le nombre sous la balise <caractéristiques>, étant donné que les vocables chinois ne possèdent pas ces éléments de syntactique.

De plus, nous avons modifié les endroits où peuvent se trouver des balises <régime>, car en mandarin, les mots-clés ou leurs actants peuvent apparaître avant la valeur de la FL. Par exemple, le générique de la lexie HONTE est : Gener(honte) = sentiment de ~, mais son équivalent en mandarin est : Gener(耻chǐ辱rǔ) = [~]感gǎn. Par conséquent, nous adaptons la structure à l’intérieur de <valeur> pour que les paires de balises <régime>…</régime> puissent apparaître avant et après <élément>…</élément>.

En outre, le DEC utilise le tableau de régime pour décrire la correspondance entre les actants sémantiques et les actants syntaxiques profonds de la lexie en question : le nombre de colonnes correspond au nombre d’actants sémantiques, et le nombre de lignes correspond au

nombre maximal de possibilités d’expressions existantes pour les actants syntaxiques profonds (Mel’čuk, Clas et Polguère, 1995, p. 119-120). Les régimes des lexies sont très importants si nous voulons faire de la génération automatique de textes, puisqu’ils permettent de générer correctement les numéros des actants syntaxiques profonds dans la SSyntP à partir des actants sémantiques dans une SSém. Cependant, les informations de régime sont absentes dans le DiCoLiLex. Nous avons donc ajouté une balise <régime> à l’intérieur de <lexie> pour fournir le régime de la lexie en question.

Voici un exemple d’un vocable nominal encodé dans un fichier XML :

<vocable identificateur="担心_n" pinyin="dānxīn"> <caractéristiques>

<pdd>n.</pdd> </caractéristiques>

<lexie identificateur="1" date="2018-05-11" statut="3"> <glose>inquiétude (litt. 'porter coeur')</glose>

<étiquette-sémantique pinyin="fùmiàn qínggǎn" glose="sentiment négatif"> 负面情感</étiquette-sémantique>

<forme-propositionnelle>

<étiquette-sémantique pinyin="gèrén" glose="individu">个人 </étiquette-sémantique><actant numéro="1">X</actant>对 <actant numéro="2">Y</actant>的<lexie-ref/> </forme-propositionnelle> <régime> <pdd>N</pdd>=<actant numéro="1">X</actant>对<pdd>N</pdd>= <actant numéro="2">Y</actant>的<lexie-ref/> </régime> <fonction-lexicale> <fonction type="standard">Magn</fonction>

<valeur statut="3"><élément pinyin="nóngnóng" glose="dense">浓浓</élément> <régime>的</régime></valeur>

<valeur statut="3"><élément pinyin="qiángliè" glose="fort">强烈</élément> <régime>(的)</régime></valeur>

</fonction-lexicale> <fonction-lexicale>

<fonction type="standard">AntiMagn</fonction>

<valeur statut="3"><élément pinyin="yìsī" glose="un fil">一丝</élément> </valeur>

</fonction-lexicale> <fonction-lexicale>

<fonction type="standard">Oper1</fonction>

<valeur statut="3"><élément pinyin="gǎndào" glose="ressentir">感到</élément> <régime><lexie-ref/></régime><contrainte>pas de l'actant Y sur

<lexie-ref/></contrainte></valeur>

<valeur statut="3"><élément pinyin="yǒu" glose="avoir">有</élément> <régime><lexie-ref/></régime><contrainte>pas de l'actant Y sur <lexie-ref/></contrainte></valeur>

</fonction-lexicale> <fonction-lexicale>

<fonction type="standard">Oper12</fonction>

</régime><élément pinyin="gǎndào" glose="ressentir">感到 </élément><régime><lexie-ref/></régime></valeur>

<valeur statut="3"><régime>对<pdd>N</pdd>=<actant>Y</actant></régime> <élément pinyin="yǒu" glose="avoir">有</élément><régime>

<lexie-ref/></régime></valeur> </fonction-lexicale>

<fonction-lexicale>

<fonction type="standard">Magn+Oper1</fonction>

<valeur statut="3"><élément pinyin="chōngmǎn" glose="se remplir de">充满 </élément><régime><lexie-ref/></régime></valeur>

<valeur statut="3"><élément pinyin="shēngǎn" glose="ressentir profondément"> 深感</élément><régime><lexie-ref/></régime></valeur>

</fonction-lexicale> <fonction-lexicale>

<fonction type="standard">Perm1Manif</fonction>

<valeur statut="3"><élément pinyin="liúlù chū" glose="révéler">流露出 </élément><régime><lexie-ref/></régime></valeur>

<valeur statut="3"><élément pinyin="lùchū" glose="montrer">露出 </élément><régime><lexie-ref/></régime></valeur>

</fonction-lexicale> <fonction-lexicale>

<fonction type="standard">NonPerm1Manif</fonction>

<valeur statut="3"><élément pinyin="yǎnshì" glose="dissimuler">掩饰 </élément><régime><lexie-ref/></régime></valeur>

</fonction-lexicale> <fonction-lexicale>

<fonction type="standard">V0</fonction>

<valeur statut="3"><élément pinyin="dānxīn" glose="s'inquiéter">担心_v#1 </élément></valeur>

</fonction-lexicale> <fonction-lexicale>

<fonction type="standard">QSyn</fonction>

<valeur statut="3"><élément pinyin="bù'ān" glose="trouble">不安_n </élément></valeur>

<valeur statut="3"><élément pinyin="dānyōu" glose="inquiétude">担忧_n </élément></valeur>

<valeur statut="3"><élément pinyin="fánnǎo" glose="tracas">烦恼_n#1 </élément></valeur>

<valeur statut="3"><élément pinyin="hàipà" glose="peur">害怕_n </élément></valeur>

<valeur statut="3"><élément pinyin="jiāolǜ" glose="anxiété">焦虑_n </élément></valeur>

<valeur statut="3"><élément pinyin="kǒngjù" glose="peur">恐惧_n </élément></valeur>

<valeur statut="3"><élément pinyin="tǎntè" glose="inquiétude">忐忑_n </élément></valeur>

<valeur statut="3"><élément pinyin="yōulǜ" glose="souci">忧虑_n </élément></valeur>

</fonction-lexicale> </lexie>

</vocable>

Figure 3. Description du vocable 担dān心xīn ‘inquiétude’ dans le DiCoLiLex-ZH

Voir l’Annexe 2 pour le fichier modifié « _flexidico.rnc » qui représente un schéma validant la structure XML de notre dictionnaire en mandarin.