Identifiant pérenne de la notice : 21075432X
Notice de type
Notice de regroupement
Note publique d'information : Les travaux exposés dans cette thèse se situent dans le cadre de la classification
conceptuelle automatique. Nous présentons un formalisme de représentations de données
structurées et imprécises fondées sur la notion d'attribut et de valeur : les arborescences
symboliques nuancées (ASN). La définition de treillis de nuances permet de prendre
en compte l'imprécision d'une valeur. Les attributs peuvent être de plusieurs types
: simple, structure ou même récursif et permettent de manipuler des données de nature
arborescente. L'introduction de contraintes de validité entre les valeurs des attributs
donne la possibilité de représenter des connaissances sur le domaine d'application.
Nous proposons des algorithmes permettant de manipuler des observations définies à
partir du modèle proposé et de trouver des concepts aisément interprétables. Dans
un premier temps, nous définissons une correspondance de galois entre des entités
et leurs descriptions à partir d'attributs nuancés mais non structurés, et nous proposons
un algorithme de calcul des concepts. Ensuite, nous précisons les algorithmes de généralisation
et de comparaison de deux ASN et nous présentons un algorithme incrémental de construction
du treillis de galois entre des entités et des ASN. Nous étendons ainsi les treillis
de galois au cas de données arborescentes et nuancées. Les concepts trouvés sont décrits
de manière imprécise par des ASN. Le treillis des concepts étant de grande taille,
l'introduction d'un indice de distance défini sur les ASN nous permet de générer un
sous-treillis de galois formé de concepts ne dépassant pas un seuil donné de généralité.
Enfin, nous définissons une mesure de similarité sur les ASN et nous proposons un
algorithme d'extraction d'un graphe hiérarchique de concepts à partir d'un treillis
de galois. Dans la dernière partie de la thèse, nous présentons le système CID fondé
sur le formalisme des ASN et nous terminons par deux exemples d'application.