Université de Versailles


Conclusion sur l’appariement



Yüklə 0,87 Mb.
səhifə16/23
tarix30.10.2017
ölçüsü0,87 Mb.
#22015
1   ...   12   13   14   15   16   17   18   19   ...   23

5.4Conclusion sur l’appariement


L’intégration des BDG doit, la plupart du temps, inclure un processus d’appariement. Ce chapitre a proposé un processus générique qui définit les phases communes au processus d’appariement (enrichissement, sélection, mesure, filtrage ou prolongation, regroupement, analyse) et leur enchaînement. Ce processus s’appuie sur une boîte à outils d’appariement. Ces outils permettent de comparer la sémantique, la géométrie et les liens topologiques des objets candidats à l’appariement. Afin d’illustrer ce processus générique, le prototype utilisé pour apparier les données routières de la BD CARTO et de GEOROUTE a été présenté. Le processus d’appariement permet aussi d’extraire des connaissances multi-représentations décrivant les différences entre les objets appariés à l’aide d’opérations de généralisation. Ces connaissances en sont encore à l’état d’ébauche.

Les processus d’appariement sont complexes, ils confrontent un grand nombre d’informations et enchaînent plusieurs d’outils. La conception d’un processus d’appariement est donc une tâche fastidieuse. Néanmoins, la définition d’un processus générique facilite largement cette tâche. Cependant, la conception de ceux-ci peut encore être simplifiée en assistant l’utilisateur dans :



  • le choix des outils d’appariement,

  • le paramètrage de ces outils,

  • le choix des filtres,

  • l’enchaînement des outils.

Pour ce faire, des techniques d’apprentissage par induction [Gascuel 87] pourraient aussi être utiles.

6.Conclusion


Pour conclure, nous allons résumer les contributions majeures de cette thèse (6.1) et dégager les perspectives principales (6.2).

6.1Contribution de la thèse


Trois apports essentiels découlent de cette thèse. Tout d’abord, une taxonomie des conflits d’intégration pour les BDG a été établie (6.1.1). Puis, grâce à cette taxonomie, un processus d’intégration des BDG vectorielles (6.1.2) a été défini. Celui-ci fait appel à un processus d’appariement (6.1.3), ce qui constitue le troisième apport de cette thèse.

Le processus d’intégration / appariement défini dans cette thèse, a permis d’obtenir une BDG multi-représentations à partir des trois principales bases de données de l’IGN (BD TOPO, BD CARTO et GEOROUTE) pour le thème routier dans la région de Lagny. Cette BDG multi représentation répond aux besoins des applications multi-représentations.


6.1.1Taxonomie des conflits d’intégration pour les BDG


Plusieurs taxonomies ont déjà été réalisées pour les BD classiques. Mais, jusqu'à présent, aucune n’avait pris en compte les spécificités de l’information géographique. Cette taxonomie [Spaccapietra et al. 96] [Parent et al. 96] a ainsi permis de recenser les problèmes à résoudre pour intégrer les BDG. Elle étend les taxonomies réalisées pour les BD classiques et inclut les problèmes d’intégration des BDG décrit dans les articles précédents ([Gouvernement du Québec 92] [Rigaux et Scholl 95] [Shepherd 92] [Laurini 96]). Cette taxonomie a fait apparaître un grand nombre de conflits supplémentaires liés à la nature de l’information géographique, il en résulte six classes :

  1. les conflits de sources de données qui apparaissent quand les types de sources de données employées ou les caractéristiques de celles-ci sont différentes,

  2. les conflits d’hétérogénéité qui portent sur les critères globaux à définir pour chaque BDG (modèles de données, positionnement des éléments, modélisation de l’altitude, mode de représentation, méta-données liées aux géométries et relations topologiques),

  3. les conflits de définition des classes qui regroupent les problèmes liés à la classification des éléments des BDG, à leur spécification et au découpage des phénomènes du monde réel en objet,

  4. les conflits de structures qui surviennent lorsque les éléments en correspondance sont décrits par des concepts différents (classe, attribut, relation) ou lorsque qu’une information gérée par la BDG correspond à une information qui doit être déduite,

  5. les conflits de description sémantiques et géométriques qui résultent des différences entre les propriétés (attributs, méthodes) des classes en correspondance,

  6. les conflits de données qui surviennent lorsque les objets en correspondance ont des valeurs différentes pour des attributs en correspondance.

6.1.2Définition d’un processus d’intégration de BDG


Plusieurs processus d’intégration de BDG avaient déjà été proposés, mais ils étaient incomplets ou se limitaient à certains cas particuliers. La taxonomie des conflits d’intégration a permis de définir pour les BDG vecteurs, un processus générique d’intégration [Devogele et al. 97]. La complexité des conflits rencontrés nous a poussé à choisir un processus déclaratif en trois phases afin de le décomposer au maximum en sous-tâches. Pour cela, nous avons repris chacune des 3 phases définies dans le processus d’intégration de [Parent et Spaccapietra 96] et nous les avons adaptées afin de tenir compte des spécificités des BDG. Il se décompose comme suit :

6.1.2.1Définition du processus de pré-intégration pour les BDG


La pré-intégration inclut toutes les activités préliminaires qui ont pour objectif de faire converger les descriptions initiales. Elle consiste à réarranger les schémas en entrée pour les rendre plus homogènes sur le plan sémantique et syntaxique pour parvenir au même niveau de compréhension des données.

La première tâche consiste à choisir un modèle de données pour la BD intégrée. Le modèle orienté objet a été choisi afin de bénéficier de sa capacité à modéliser des phénomènes complexes. De même, un système de référence doit être retenu durant cette phase.

La deuxième tâche a pour but d’enrichir les BDG à l’aide de méta-données, de mécanismes de traduction et de nouvelles données. Ces données sont les informations implicites qui ont été matérialisées pour mettre les BD en conformité.

Enfin, dans la dernière tâche, les règles de normalisation spécifiques aux BDG qui ont été définies (suppression des restrictions, niveau de décomposition homogène, suppression des classes d’objets géométriques), sont appliquées à l’ensemble des BDG à intégrer pour les rendre plus homogènes.


6.1.2.2Extension du langage de déclaration des correspondances


L’objectif de la déclaration de correspondance est d’identifier et de fournir toutes les correspondances entre les schémas de données à un niveau sémantique et entre leurs instances. Elle s’appuie sur la déclaration d’assertions de correspondance inter schémas (ACI) qui mentionnent les éléments en correspondance.

Pour intégrer les BDG, la syntaxe des déclarations de correspondance a été étendue, afin de permettre la déclaration des conflits d’intégration propres aux BDG. Ces extensions sont novatrices, car elles autorisent la déclaration de conflits de spécifications (4.3.3.1), de granularité (4.3.5.1) et proposent une syntaxe relativement simple pour les conflits de classification (4.3.1.1) et de fragmentation (4.3.2.1).

Afin de les déclarer, les assertions incluent des attributs virtuels, des classes virtuelles et autorisent l’expression de critères de sélection. Une déclaration au niveau des types des attributs a aussi été définie pour permettre une intégration optimale des attributs en correspondance faible (4.3.4.1.3).

6.1.2.3Extension des techniques d’intégration


L’intégration proprement dite traite toutes les ACI déclarées dans la phase précédente. Elle résout les conflits décrits dans les déclarations, fournit le schéma de la base intégrée et produit les règles de traduction des schémas initiaux vers le schéma intégré, et les règles réciproques.

Cependant, avant d’intégrer les BDG, une stratégie d’intégration doit être choisie en fonction de l’objectif de l’intégration. Nous avons ainsi défini deux stratégies d’intégration (mono représentation et multi-représentation). La stratégie mono représentation (4.3.1.2.1) produit une représentation unique des phénomènes du monde réel en retenant l’information la plus précise sans redondance. La stratégie multi-représentation (4.3.1.2.2) par contre, conserve les représentations à différents niveaux de détail et les relie entre elles.

Pour chaque conflit et chaque stratégie, nous avons déterminé une technique d’intégration. Ces techniques permettent d’intégrer les classes, les attributs, les géométries et les relations en correspondance. Elles s’appuient sur les techniques d’intégration de schéma classiques et de fusion des objets géographiques. Celles-ci ont été améliorées pour maintenir l’ensemble de l’information initiale.

6.1.3Définition d’un processus d’appariement


Le processus d’intégration de BDG doit le plus souvent inclure un processus d’appariement qui établit des correspondances fiables entre les objets représentant le même phénomène du monde réel, à l’aide un grand nombre d’informations (sémantique, géométrique et topologique) et de plusieurs outils.

Dans le domaine de l’appariement, trois apports sont à noter :



  • la définition d’une boîte à outils regroupant les outils nécessaires au processus d’appariement. Ces outils ont été organisés en cinq groupes (outils sémantiques, outils topologiques, outils géométriques de type distance, outils géométriques de type forme, outils mixtes) en fonction de la caractéristique qu’ils mesurent.

  • la définition d’un processus générique à partir de l’analyse des différents processus d’appariement réalisés au COGIT ([Bucaille 97] [Branly 97] [Devogele et al. 96 a]). Il emploie la boîte à outils d’appariement précédemment citée. Le but de ce processus générique est de définir les phases communes à un processus d’appariement quelles que soient les données à apparier et de déterminer leur enchaînement.

Le processus générique a été illustré dans cette thèse par le prototype développé pour apparier les données routières de la BD CARTO et GEOROUTE sous GéO2, avec des résultats concluants.

  • la qualification des appariements obtenus par extraction d’opération de généralisation pour aider les processus de contrôle de cohérence, de propagation des mises à jour ou d’apprentissage (par analogie) pour la généralisation. Cette qualification est encore à l’état d’ébauche néanmoins, les opérations peuvent déjà être inférées à l’aide des mesures réalisées lors du processus d’appariement.

Yüklə 0,87 Mb.

Dostları ilə paylaş:
1   ...   12   13   14   15   16   17   18   19   ...   23




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin