Liknande böcker
Cat�gorisation Automatique de Textes Et Cooccurrence de Mots
Bok av Rehel-S
Ayant pour objectif de rendre un programme informatique capable d'assigner de faon autonome des documents textuels leur classe d'appartenance, la catgorisation automatique de textes est rendue possible grce l'apprentissage supervis. Un entranement du programme est effectu sur un ensemble de documents auxquels des tiquettes de catgorie ont dj t assignes par des humains. Or, la constitution de cet ensemble d'entranement se rvle un processus long et coteux. Ce mmoire propose une faon d'amliorer la capacit d'un classificateur bien accomplir sa tche dans des situations o un entranement sur un nombre suffisant de textes n'aura pas t possible. L'approche suggre consiste tudier une forme d'association, la cooccurrence, entre les mots provenant d'un ensemble de textes libells et ceux provenant d'un ensemble de textes non libells, plus volumineux. On espre ainsi augmenter faible cot le vocabulaire utile la classification de textes, en minimisant le nombre de documents tiqueter.