Extraction et formalisation de la connaissance d’une base de données multi-relationnelle

Séminaire du GRIIS
  • Quand ? 12/12/2018 de 12:00 à 13:00 (America/New_York / UTC-500)
  • Où ? Au local D4-2011 de la Faculté des sciences
  • Nom du contact
  • Participants Mickaël Wajnberg, doctorant à l'UQAM
  • Ajouter l'événement au calendrier iCal

Résumé : L’extraction de connaissances est une discipline qui cherche à détecter des tendances, des groupes ou des motifs dans les grands jeux de données. Elle a principalement été développée autour de cas de tables de données uniques. Or, la plupart des systèmes d’information actuels se basent sur une représentation en base de données relationnelle multi-table, alias, jeu de données multi-relationnel. La fouille de données multi-relationnelles vise à combler un certain manque de précision et une perte de contextualité qui apparait lorsque les tables d’un tel jeu de données se font analyser séparément ou, alternativement, lorsque toutes les données sont jointes dans une table unique.

L’analyse relationnelle de concepts (ARC) est une méthode capable d’extraire des connaissances d'un jeu de données multi-relationnelles et de les expliciter sous forme de : (1) motifs (patterns) et règles d’association ou (2) groupes homogènes (clusters). C’est une extension du paradigme mathématique d’analyse formelle de concept qui admet une seule table. L'ARC permet, notamment, de traiter plusieurs types d’objets —chacun représenté au sein de sa propre table, alias contexte— inter-reliés au travers de relations binaires inter-contextes. Ce format est clairement compatible avec les données liées et le formalisme RDF. La méthode analytique associée emploie des mécanismes de propositionnalisation. Ceux-ci sont inspirés des logiques de description pour ramener les liens inter-objets à des descripteurs propres de ces objets.

Un premier cas d’application du procédé d’ARC est en cours : il consiste à croiser les données neurologiques d’Imagerie par Résonance Magnétique fonctionnelle, spatialement précises, avec les données d’électroencéphalogrammes, temporellement précises, pour fournir aux neurologues partenaires un outil d’aide à l’interprétation.

En outre, l’ARC permettrait aussi de confronter les connaissances contenues dans un jeu de données à ce qui est déjà connu sur le domaine d’origine de celles-ci, exprimé, par exemple, sous forme d’une ontologie. Notamment, en exhibant des sous-groupes d’objets aux propriétés communes, l'ARC pourrait détecter l’existence de sous-classes potentiellement pertinentes au sein d’une classe connue. Alternativement, elle peut valider la pertinence de certaines restrictions de propriétés au sein d’une classe. De plus, l’ARC suggérerait des types plus restrictifs pour les objets peuplant une ontologie en utilisant les associations entre descripteurs.

Toutes les personnes intéressées sont cordialement invitées.