Un Module Nooj Pour Le Traitement Automatique Du Chinois : FORMALISATION DU VOCABULAIRE ET DES TÊTES DES GROUPES NOMINAUX

Bok av Lin-H
Cette tude prsente le dveloppement du module permet de reconnatre dans les textes les units lexicales en chinois moderne puis les groupes nominaux noyaux. Pour atteindre ces deux objectifs principaux, nous devions rsoudre les problmes suivants: 1) identifier les units lexicales en chinois moderne; 2) dterminer leurs catgories; 3) C'est ainsi que nous avons t amen constituer d'abord un corpus regroupant des textes littraires et journalistiques publis au XX sicle. Ces textes sont crits en chinois moderne avec des caractres traditionnels. Grce ces donnes textuelles, nous avons pu receuillir des informations linguistiques telles qu'units lexicales, structures syntagmatiques ou rgles grammaticales. Ensuite, nous avons construit des dictionnaires lectroniques dans lesquels chaque unit lexicale est reprsente par une entre, laquelle sont associes des informations linguistiques telles que catgories lexicales, classes de distribution smantique ou descriptions formelles de certaines formes lexicales. ce stade, nous avons cherch identifier les units lexicales du lexique chinois et leurs catgories en les recensant.