Chapitre I - Etat de l’art
Introduction
Depuis le milieu des années 60, les Systèmes d'Information Géographique ont connu un essor considérable. Avec le développement toujours croissant des voies de communication, ces SIG se sont de plus en plus tournés vers la conception d'applications destinées à la gestion de réseaux : gestion des réseaux souterrains comme l'eau ou le gaz, gestion des réseaux électriques pour EDF-GDF, gestion des réseaux téléphoniques pour France Télécom, gestion de la voirie urbaine pour les collectivités locales...
Ces réseaux n'existent pas indépendamment de leur environnement. Au contraire, ils représentent des informations géographiques à part entière, qui ont donc besoin d'être situées dans un contexte environnemental (route passant au bord d'un lac et traversant une forêt). Cette nécessité conduit à construire des applications de type réseau possédant une part d'informations thématiques.
Dans une première partie, nous définissons l'information géographique d'une façon générale (modes d'acquisition, méthodes de stockage, normes) et établissons quelques définitions sur les graphes. Nous proposons ensuite un ensemble de requêtes destiné à examiner le pouvoir d'expression des SIG de type réseau. Dans une seconde partie nous présentons un état de l'art sur les Systèmes d'Information Géographique physiques et logiques de type réseau. Nous montrons leur force et leur faiblesse due à un manque certain dans la résolution des requêtes effectuée par ces SIG.
I- Définitions
Le domaine de cette thèse concerne les SIG de type réseau. Ce domaine recouvre deux champs d'étude : l'information géographique et les réseaux.
Une information géographique décrit un objet du monde réel pouvant être localisé géographiquement. Cet objet pour pouvoir être utilisé doit être acquis, c'est-à-dire analysé et récupéré du monde réel. Une fois acquis, cet objet peut alors être stocké suivant différents formats. Différents modes de stockage existent permettant de stocker l'information géographique : les bases de données géographiques qui utilisent les différents modèles de stockage, et les cartes papier. Les paragraphes suivants décrivent l'information géographique depuis ses couches basses (mode de récupération), jusqu'à ses couches hautes (modes de stockage). Un paragraphe présente les normes mises en place depuis peu pour l'information géographique. Ces normes deviennent peu à peu indispensables, du fait de la multiplicité des SIG et du coût d'acquisition de l'information géographique qui ne permet pas à chaque concepteur d'application géographique de récolter l'information qui lui est nécessaire.
Les SIG de type réseau modélisent l'information géographique sous forme d'un graphe. Sur ce graphe s'effectueront des recherches de chemin. Un paragraphe de ce chapitre présente donc les définitions sur les graphes (notion de noeud, d'arc, de recherche de chemin) utiles pour cette étude. Avec ces définitions, nous pouvons définir un jeu de requêtes qui va permettre de juger du pouvoir d'expression des SIG de type réseau et de positionner notre travail par rapport à ces SIG.
I-1. Définitions sur l'information géographique
Un Système d'Information Géographique (SIG) a pour but de gérer l'information géographique. D'après [45], un SIG comporte principalement quatre parties : un sous-système d'entrée de données qui collecte et/ou traite les données spatiales dérivées de cartes existantes, de capteurs...; un sous-système de stockage qui organise les données spatiales dans une forme facilement accessible à l'utilisateur, à des fins d'analyses et de mises à jour rapides et efficaces de la base de données spatiales; un sous-système de manipulation et d'analyse de données; un sous-système de présentation de données qui est capable d'afficher tout ou partie de la base de données originelle aussi bien que de manipuler les données pour les rendre sous une forme différente.
Il est donc nécessaire, avant toutes choses, de définir l'"information géographique". Nous étudions ensuite les différentes formes possibles d'acquisition et de stockage de cette information géographique. Ces informations une fois acquises sont répertoriées dans des cartes papier et, suivant leur mode de stockage, stockées dans des bases de données spatiales. Nous décrivons les principales cartes papier existantes ainsi que les principales bases de données spatiales. Enfin nous étudions les propositions de normes qui commencent à être développées dans le domaine de l'information géographique.
I-1.1 L'information géographique
Une information géographique décrit un objet, un phénomène ou encore une action du monde réel [9]. Cette information apporte à la fois des renseignements sur l'objet lui-même (forme, couleur, nom, type de l'objet) et sur sa localisation dans l'espace par rapport à un référentiel ou par rapport à d'autres objets. Une information géographique possède [21, 29, 40] :
- des propriétés non-localisées (e.g., nom d'une ville, population, coût moyen des hôtels). Ces propriétés sont généralement de type alphanumérique. Elles représentent la sémantique de l'information.
- des propriétés localisées (ou de localisation, ou chronologiques). Ces propriétés regroupent des données géométriques représentant les coordonnées spatiales de l'objet (généralement sous la forme de coordonnées (x,y,z) dans l'espace), et des données topologiques représentant la connectivité des objets entre eux, la notion d'adjacence, d'orientation, de contenance...
- une dimension temporelle (propriété chronologique). Cette dimension permet de suivre l'"historique" d'une information géographique en suivant l'évolution de ses propriétés non-localisées et localisées en fonction du temps.
Figure I-1. L'information géographique
Les propriétés localisées et les propriétés non-localisées peuvent dépendre les unes des autres [44].
Des concepts spatiaux (comme par exemple, la proximité d'un objet géographique par rapport à un autre) peuvent être mesurés soit en utilisant les données géométriques des informations (en utilisant le calcul d'une distance euclidienne), soit en utilisant les données topologiques des informations (notion d'adjacence).
L'information géographique possède plusieurs stades d'existence [40] : elle va devoir être acquise, c'est-à-dire perçue, par différents moyens, pour ensuite pouvoir être utilisée en la stockant dans des cartes ou dans des bases de données (alors appelées bases de données spatiales).
Figure I-2. Les différents stades de l'information géographique.
I-1.2 Acquisition et stockage de l'information géographique
Le DCDSTF (Digital Cartographic Data Standard Task Force), organisme établissant des normes pour l'information géographique aux Etats-Unis [29], a défini deux concepts pour une information géographique : une "entité" représente l'information géographique telle qu'elle apparaît dans la réalité, un "objet" représente l'élément résultant d'une interprétation de cette réalité. Dans tout ce qui suit, nous utiliserons ces deux concepts pour différencier l'information géographique réelle et l'information géographique interprétée.
Un objet résulte de l'interprétation par un être humain (dans le cas d'une carte papier construite manuellement) ou par un ordinateur (dans la cas des bases de données) des entités du monde réel. L'objet correspondant à une entité identifiant une gare routière sera par exemple un carré (alors même que cette gare n'a pas la forme d'un carré). Cette interprétation est réalisée dans le but de stocker l'information, soit sous une forme papier, soit dans des bases de données. Avant ce stockage qui va permettre d'utiliser réellement l'information géographique, il faut tout d'abord acquérir cette information, puis définir un modèle de stockage de l'objet.
I-1.2.1 Acquisition de l'information géographique
Il existe trois manières principales d'acquérir l'information géographique : l'arpentage, la photogrammétrie et la télédétection [29].
- L'arpentage relève essentiellement du travail des géomètres. Il consiste à mesurer la localisation d'entités à la surface de la Terre, selon les trois dimensions de l'espace (dimensions horizontales ou verticales). La précision de la mesure est de l'ordre de 0,1 mètre. La technique de l'arpentage consiste à déterminer la position d'une entité par rapport à trois repères fixes. Ces repères (appelés repères géodésiques) sont localisés très précisément dans l'espace. Leur nombre est limité et fixe. Ils constituent un maillage du territoire. Ce maillage est maintenant complété par un Système de Positionnement Global (GPS). Ce système détermine la localisation des entités par l'intermédiaire de satellites qui positionnent ces entités par rapport à des bornes GPS fixes. L'arpentage permet de réaliser des relevés topographiques. Ces relevés seront ensuite recensés dans une carte. L'arpentage est essentiel car il permet de réaliser des cartes à très grande échelle (de l'ordre du 1/200). Ces cartes sont la base de la gestion de réseau en zone urbaine. Le guidage d'un véhicule dans une ville, par exemple, nécessite de posséder une très bonne précision sur le réseau routier.
- La photogrammétrie fournit des photos aériennes de la surface de la Terre. Les informations saisies doivent être visibles pour un oeil humain, ce qui limite considérablement l'observation : les conditions d'observation (luminosité, temps non nuageux...) doivent être satisfaisantes pour permettre d'utiliser les informations récoltées.
Ces photos aériennes peuvent être analysées pour fournir des mesures précises du positionnement d'entités. La précision de la mesure est de l'ordre du mètre. Elle dépend cependant de l'altitude à laquelle la photographie a été réalisée. La photogrammétrie est à l'origine de la plupart des données topographiques (altitudes de surface) utilisées à la base des SIG. Dans le cadre d'un réseau routier, la photogrammétrie permet, par exemple, de prendre en compte la configuration précise d'un carrefour routier ou d'un échangeur d'autoroutes. Elle permet donc à un utilisateur de trouver très précisément un chemin d'un point à un autre, en connaissant la topographie du réseau qu'il va emprunter.
- La télédétection fournit des images prises par des caméras depuis des plates-formes aériennes ou satellitaires. Les informations observées sont captées grâce à la longueur d'émission de leurs ondes électromagnétiques. Elles peuvent être captées sous forme analogique (par photographies du spectre observé) ou numérique (transmises à une station au sol ou enregistrées à bord des plates-formes). Les observations issues de la télédétection dépendent du spectre de longueur d'ondes observé. Ce spectre peut aller jusqu'aux infrarouges et aux ondes radar, ce qui permet de percevoir des informations non visibles pour l'oeil humain. L'échelle de saisie de l'information est très variable. Elle dépend de l'altitude du satellite, des caractéristiques de l'instrument de prise de vues... La précision est donc également très variable. Une fois saisies, ces données sont analysées afin d'identifier les entités présentes sur l'image. Ce processus d'analyse est souvent très complexe et très difficile. Dans le cadre des réseaux, c'est le seul moyen pour couvrir rapidement tout un territoire, la photogrammétrie et l'arpentage étant des modes d'acquisition beaucoup plus longs et fastidieux. La télédétection permet d'avoir une vue d'ensemble de ces réseaux. Elle fournit la matière première à de nombreuses cartes qui sont ensuite affinées par arpentage.
I-1.2.2 Modèles de stockage de l'information géographique
Les données acquises ne sont utilisables que si elles peuvent être stockées et enregistrées de manière permanente. Il existe deux modes de stockage pour l'information géographique : la carte papier et les bases de données géographiques.
Le stockage de l'information géographique dans une base de données nécessite l'adoption d'un modèle de données, structure déterminant le mode d'organisation des objets résultant de l'interprétation des entités géographiques réelles.
Avant de pouvoir stocker l'information géographique, il faut tout d'abord la numériser. Cette numérisation [12, 37], réalisée en général à l'aide de scanners, a pour but de transformer en une série de données alphanumériques codables les informations présentes dans une image, une photo, ou dans une carte réalisée à l'aide des relevés topographiques et de constituer ainsi des bases de données géographiques. Deux structures de stockage permettent de conserver l'information géographique [12, 21, 29, 56] : le format raster et le format vecteur. Chacune de ces structures permet de définir les propriétés géométriques et topologiques de l'information géographique.
I-1.2.2.1 Le modèle raster
Le modèle raster (ou format matriciel) est le modèle le plus simple d'utilisation. Il divise l'ensemble de la zone étudiée en une grille (une matrice) de cellules régulières. Cette grille représente une subdivision continue et régulière de la zone. Chaque cellule est un carré de taille fixée appelé pixel, représentant l'unité élémentaire de ce type de stockage. Chaque pixel est identifié par une valeur particulière modélisant un ensemble d'attributs (alphanumériques) de l'information géographique étudiée. Chaque pixel possède des coordonnées de la forme (i,j) dans la matrice représentant la zone à étudier (indice de la ligne et indice de la colonne). Ces coordonnées représentent les propriétés géométriques de l'information géographique : elles permettent de localiser précisément les pixels composant les informations géographiques dans la zone étudiée, et donc de localiser cette information dans cette zone. Le format matriciel implique donc une dépendance entre les propriétés géométriques et topologiques de l'information géographique.
La juxtaposition des pixels recrée l'apparence visuelle du plan et de chaque information géographique.
Figure I-3. Le modèle raster
Un ensemble de cellules et de leurs valeurs associées est appelé une couche. Une zone de l'espace peut être scindée en plusieurs couches, chacune identifiant les différentes valeurs possibles pour un attribut de l'information géographique. Ainsi une couche peut représenter le type de sol, l'utilisation du sol...
Ce format matriciel induit l'existence de certaines opérations élémentaires : les fonctions de recodage des pixels, de superposition des couches, d'étalement de la couverture spatiale étudiée, de filtrage d'une matrice d'information, de calcul des distances, de positionnement d'une zone tampon autour d'objets, d'identification de zones, de calcul de superficie de zones.... Grâce à ces fonctions élémentaires, il est possible de réaliser très facilement certaines requêtes sur le SIG : la superposition de couches dans le but d'effectuer une sélection de certains pixels répondant à un critère donné est, par exemple, une opération très simple et très rapide.
|
Figure I-4. Superposition de différentes couches dans le modèle raster
L'intérêt de ce format réside dans son coût de saisie relativement bas : en format raster, il est possible de saisir des fonds de plan peu onéreux en vue de les afficher sur l'écran. La numérisation des données est également très rapide. Du fait de ces avantages, toutes les images satellitaires, ainsi que la plupart des photos aériennes sont saisies en mode raster [21, 29].
Le format raster s'utilise essentiellement à des fins d'analyses : superposition de plusieurs couches d'information, chaque couche étant stockée en format raster, permettant des traitements d'analyse spatiale; superposition de deux couches réalisées à des dates différentes afin de suivre l'évolution de l'information géographique... Il est très utilisé par les SIG dédiés aux collectivités locales, afin d'établir des statistiques par exemple (calculer le taux d'accidents de la circulation par type de zones d'habitation traversées consiste à superposer deux couches d'information : une couche pour les zones d'habitation et une couche pour les accidents sur le réseau routier).
I-1.2.2.2 Le modèle vecteur
Dans le modèle vecteur (ou format vectoriel), chaque objet est identifié individuellement. Ce format est basé sur la notion de vecteur, où un vecteur représente un segment de droite. A la différence du format matriciel, il ne réalise pas une couverture continue de l'espace. Chaque information géographique représente un objet doté de caractéristiques géographiques et alphanumériques. La structure des objets dans le format vecteur se décompose en deux parties : une partie topologique (représentant l'organisation des données entre elles), et une partie géométrique (correspondant aux coordonnées géométriques des objets). A la différence du format raster, ces deux parties sont indépendantes et la topologie des informations peut être représentée sans sa géométrie.
Le format vectoriel utilise trois notions pour représenter la localisation géométrique des données spatiales : le point, la ligne et le polygone. Le point modélise des informations possédant une seule paire de coordonnées. La ligne est représentée par une suite de segments de droite. Elle représente des éléments linéaires possédant une dimension de longueur. Chaque segment est limité par deux points. La suite des coordonnées des points intermédiaires représente les coordonnées de la ligne (d'où la notion de vecteur). La zone permet d'identifier les éléments surfaciques. Elle est représentée par l'enveloppe externe des polygones qui la contiennent. Elle est donc représentée par un ensemble de segments représentant les limites de son territoire. La notion de zone permet de représenter des entités complexes (enclaves, trous...) grâce à des assemblages de polygones exclus et inclus dans la définition de la zone.
|
Figure I-5. Le modèle vecteur
Dans le format vectoriel, chaque objet construit ainsi possède un ensemble d'attributs qui lui sont propres.
En plus de ces coordonnées, la topologie des objets est représentée, pour exprimer leur localisation relative. Cette notion permet d'optimiser le nombre d'enregistrement de coordonnées. Par exemple, dans le cas de l'étude d'informations géographiques de type réseau, grâce aux coordonnées des noeuds et à cette notion de topologie, il est possible d'en déduire les coordonnées de tous les objets du réseau.
Figure I-6. Codage en format vectoriel d'un réseau
Les opérations élémentaires des SIG vectoriels sont sensiblement les mêmes que les opérations des SIG matriciels : recodage des informations, superposition de couches (fusion d'objets vectoriels), construction de zones tampon autour des objets, calcul de superficie, calcul de distances... Certaines opérations (recherche de chemins...) ne sont cependant possibles qu'avec ce format.
L'intérêt du format vecteur réside dans son identification de chaque information géométrique individuellement. L'information est plus compacte et plus facile à utiliser que dans le format raster. Pour ces raisons, il est souvent utilisé pour exploiter l'information géographique à des fins de mises-à-jour, de calculs (calcul de probabilité...) et pour tous les traitements nécessitant d'individualiser les objets et de les modéliser par une géométrie. Ce modèle est par exemple obligatoirement utilisé pour coder les informations géographiques résultant de l'arpentage.
I-1.2.2.3 Raster ou vecteur ?
Le modèle raster présente l'avantage d'offrir une numérisation facile et rapide, d'offrir une vitesse de traitement des requêtes (booléennes essentiellement) très rapide, d'être très visuelle et très rapidement appréhendable par les utilisateurs.
Il présente par contre l'inconvénient d'être très lourde à manipuler, d'occuper beaucoup de place mémoire pour le stockage des données, d'impliquer une perte de détails due à l'imprécision des pixels et de ne pas posséder d'objets individualisés.
Ces inconvénients limitent essentiellement l'utilisation du format raster au traitement des images satellitaires et des photos aériennes, et aux applications gérant des fonds de plans et se limitant à des traitement d'analyse thématique (juxtaposition de couches d'informations...).
Il est utilisé comme modèle de stockage dans des applications comme l'application construite par la ville de Santa Monica (aux Etats-Unis) pour évaluer les risques encourus par la population en cas de déversement de matières toxiques sur la voie publique [29]. Cette application nécessite de posséder plusieurs couches d'informations comportant les plans des rues et des égouts (densité du flux routier, réseau urbain, réseau des égouts, principaux oléoducs), la localisation et la description des matières dangereuses, la localisation des institutions publiques (écoles...) avec des données démographiques, et une carte détaillée de l'utilisation du sol. Elle permet, en superposant ces couches, de situer l'endroit de déversement de la matière toxique, son impact sur la population (zone à risques ou non), et les principaux égouts qui vont permettre de l'évacuer. Cette application n'est pas utilisée dans la planification de l'évacuation de la matière dangereuse, mais uniquement pour évaluer la répartition des risques sur le territoire.
Le modèle vecteur présente l'avantage de fournir une information compacte et facile à utiliser, et de pouvoir utiliser chaque objet indépendamment des autres objets.
Il présente par contre l'inconvénient de résulter d'une numérisation très longue, d'être beaucoup plus difficile à mettre en oeuvre que le format raster (problème d'identification des objets lors de la numérisation) et d'offrir une vitesse de traitement des requêtes très peu rapide.
Ce modèle est utilisé dès que le besoin se fait sentir de disposer de données localisées et individuelles. Dans le mode vectoriel, les opérations sont généralement plus longues à être effectuées que dans le mode matriciel, mais elles sont plus précises car effectuées à partir des coordonnées des objets et non en comptant des cellules.
Il est utilisé comme modèle de stockage dans des SIG comme le SIG VISAGE [24] destiné à l'entretien des routes départementales, ou le SIG développé pour le département de la Loire en vue de rassembler des informations décrivant le patrimoine routier et son évolution [24], ou encore l'application Cartabus [24] basée sur le SIG APIC [4, 5], destinée à gérer l'organisation du ramassage scolaire en bus. Le modèle vectoriel est également utilisé dans certaines versions de l'application de Santa Monica vue précédemment, afin cette fois-ci de planifier des interventions en temps réel pour évacuer les matières toxiques déversées sur la voie publique.
Aucun de ces deux modèles n'est supérieur à l'autre. Ils sont tous deux complémentaires [56]. Le modèle raster est plus spécifiquement dédié aux applications gérant la superposition de couches, alors que le format vecteur permet d'identifier les objets un à un. L'idéal, pour un SIG, est de posséder ces deux modes de stockage : certaines informations destinées à des fonds de plans où à des analyses de recouvrement d'espace sont stockées en mode raster, mais toutes les informations spécifiques au système et nécessitant des analyses plus individuelles sont stockées en mode vecteur. Ceci permet à la fois d'optimiser l'espace nécessaire pour stocker les données, et de permettre toutes les manipulations possibles sans pour autant rendre trop difficile la numérisation des données. Les données de type vecteur sont alors superposées aux données de type raster.
Il est également possible d'entreposer les données dans un format et de les traiter dans un autre. Il faut alors disposer d'un algorithme de conversion efficace permettant de passer des matrices aux vecteurs et inversement [29]. Cela peut permettre de réaliser des gains en traitement de l'information (format matriciel plus rapide) et en occupation de l'espace de stockage (format vectoriel plus compact).
Notons que les SIG de type vectoriel sont la base des SIG dans le domaine des transports : certaines opérations par contre, comme la recherche d'itinéraires le long d'un réseau routier, ne sont possibles que dans le cas des SIG vectoriels. Par contre, les SIG matriciels se prêtent bien aux études mélangeant la gestion de réseaux (visualisation du réseau, étude des caractéristiques du réseau...) et leur environnement (cas des bassins versants nécessitant l'étude de la flore environnante).
Chacun de ces deux modèles induit des opérateurs spécifiques.
Dans toute la suite de cette étude, nous considérons disposer d'un type abstrait de données modélisant la représentation spatiale, et ce quelle que soit sa forme (vecteur ou raster, mono ou multi-représentations...).
I-1.2.3 Les cartes et bases de données de référence des SIG
Deux modes de stockage permettent de conserver l'information géographique : les cartes et les bases de données.
Ces modes de stockage ne sont pas indépendants, les cartes étant souvent numérisées, suivant l'un des modèles de stockage précédents, afin de fournir des données enregistrées dans la base de données, et inversement les bases de données permettant de constituer des cartes en rassemblant des objets. Chacun de ces modes crée un modèle symbolisé, interprété de l'entité géographique de base (une église peut par exemple être symbolisée par rond avec une croix, ce qui ne correspond en rien à sa réalité géographique).
Il existe deux sortes de cartes papier [24] : des cartes à caractère topographique et des cartes thématiques.
- Les cartes à caractère topographique fournissent la localisation précise des objets visibles sur le terrain ou enterrés, ainsi que des limites administratives.
Ces cartes comportent différentes sortes d'échelles :
. moyenne et petite échelle, correspondant aux échelles inférieures au 1/100.000 (1 cm sur la carte représente 1 km sur le terrain réel) : ces échelles permettent de représenter des grandes zones de terrain;
. grande échelle, correspondant aux échelles comprises entre le 1/10.000 et le 1/500 (1 cm représente de 100 m à 5 m) : ces échelles permettent essentiellement d'étudier des zones de l'ordre des communes;
. très grande échelle, correspondant à des échelles de l'ordre du 1/200 (1 cm sur la carte représente 2 m sur le terrain) : ces échelles permettent de représenter des données de la voie publique.
Les cartes topographiques servent à représenter des informations comme le relief (par des courbes de niveau), l'hydrographie, les routes, les chemins et les rues, les limites administratives (limites de cantons et communes), l'occupation du sol par des lieux habités, certaines cultures, les forêts... Les objets contenus dans ces cartes sont représentés soit à l'échelle proportionnellement à leurs véritables dimensions, soit suivant des signes conventionnels (une gare routière est représentée par un carré noir avec l'inscription "Gare routière"...).
Une image photographique du terrain (aérienne ou satellitaire) peut souvent servir de fond de carte topographique.
Les cartes topographiques sont éditées par des organismes officiels comme l'IGN (Institut Géographique National) ou le cadastre. Les cartes topographiques de l'IGN couvrent essentiellement les moyennes, petites ou grandes échelles. Le cadastre, par l'édition des plans cadastraux, couvre la totalité du territoire français à grande et très grande échelle. Ces plans cadastraux représentent le parcellaire foncier (voies et lieux-dits, propriétaires, propriétés non bâties, propriétés bâties) ainsi que la plupart des informations topographiques citées précédemment.
- Les cartes thématiques ajoutent à un fond de plan généralement issu de cartes topographiques des données décrivant un phénomène, un thème d'information particulier (par exemple, zones d'influence des accidents de la route, réseau routier, villes...). Ces cartes sont généralement superposées afin de répondre à des requêtes booléennes ("Quelles sont les villes dont la circulation sera affectée par un accident survenu en campagne ?").
Il existe deux sortes de cartes thématiques :
. les cartes thématiques synthétiques représentant le résultat d'un calcul multi-critères (taux d'accidents routiers par zones d'habitation, par exemple),
. les cartes thématiques analytiques permettant de visualiser un thème unique dans son ensemble (nombre d'accidents de la route sur chaque voie du réseau routier).
Les cartes ne sont que des supports papier de l'information géographique. Cela a pour avantage de rendre cette information facilement consultable et très visuelle, donc très facilement appréhendable par un utilisateur. L'inconvénient principal réside dans la mise à jour de ces cartes. Intégrer une nouvelle route ou un nouveau bâtiment dans une carte nécessite de "redessiner" la carte toute entière, ce qui suppose un nombre considérable d'opérations.
Afin de pallier à ces inconvénients, les cartes ont été numérisées et stockées dans des bases de données.
L'intégration de données géographiques dans les bases de données a donné lieu à la création de bases de données spatiales. Ces bases de données et les traitements qui leur sont associés permettent de créer des cartes "papier" (qui pourront à leur tour être numérisées et intégrées dans d'autres bases de données). Cette intégration présente de nombreux avantages :
- les données sont très facilement accessibles,
- les mises à jour des données sont "rapides" et ne nécessitent pas de reconstruire toutes les informations précédemment entrées dans la base de données,
- la constitution de nouvelles cartes est "facile" car il suffit de réaliser des traitements (de superposition par exemple) sur les informations de la base de données.
L'intégration dans des bases de données a également l'avantage de permettre des contrôles sur la cohérence des données entre elles, de permettre du partage d'informations multi-utilisateurs, et surtout d'offrir la possibilité de bénéficier d'un langage d'interrogation sur la base de données.
Elle présente par contre l'inconvénient de devoir définir des modes de stockage de l'information géographique (modes raster ou vecteur) et des fonctions de conversion entre ces modes.
Il existe quatre bases de données de référence en France [22, 24, 38] : la base de données cadastrales, la base de données topographiques (BD Topo de l'Institut Géographique National), la base de données cartographiques (BD Carto de l'IGN), et la base de données routières (Géoroute de l'IGN). Ces bases de données ont permis de constituer des cartes qui servent à leur tour de cartes de référence. Elles utilisent la base de données toponymique qui inventorie plus de 2.000.000 de noms géographiques.
- La base de données cadastrales permet de stocker les informations contenues dans les plans cadastraux. Elle regroupe donc les voies et lieux-dits, les propriétaires, les propriétés non bâties et bâties, les limites administratives, le relief (par des courbes de niveau), l'hydrographie, les routes, les chemins et les rues, les forêts...
- La base de données topographiques (BD Topo) est une base de données structurée topologiquement (c'est-à-dire sous forme de graphe) dont le contenu varie du 1/5.000 au 1/50.000. Tous les objets sont saisis en coordonnées tridimensionnelles (coordonnées x, y, z). La BD Topo est donc stockée en format vecteur.
Le contenu de la BD Topo est proche de celui d'une carte IGN au 1/25.000. Elle sert de référence pour les applications allant du territoire d'une commune à celui d'un département. Elle décrit les voies de communication routières et ferroviaires, les lignes de transport d'énergie, le réseau hydrographique, les bâtiments, les limites administratives, le relief et la végétation. Les entités physiques sont saisies par restitution des photographies aériennes, avec une précision de l'ordre du mètre.
- La base de données cartographiques (BD Carto) est plus synthétique que la BD Topo : elle contient des données au 1/100.000. Elle sert de référence pour des applications départementales, régionales et nationales. Elle décrit sensiblement les mêmes objets que la BD Topo : les voies de communication routières et ferroviaires, le réseau hydrographique, les lignes de transport électrique, les unités administratives, l'occupation du sol, le relief et le franchissement entre réseaux (ponts, viaducs...). Les objets résultent de la saisie des entités géographiques à partir de cartes au 1/25.000 et au 1/50.000, et à partir d'images satellitaires. Sa précision est de l'ordre du décamètre. Les données sont organisées suivant leur thème sous forme de couches. Chaque couche peut être exploitée individuellement dans un domaine d'application particulier.
- La base de données routières (Géoroute) est la plus récente de toutes ces bases de données. Encore imparfaitement connue, elle tend à se développer de plus en plus dans le cadre des SIG de type réseau [59]. Elle a pour vocation première de fournir les informations nécessaires à l'organisation des déplacements en milieu urbain (villes de plus de 10.000 habitants uniquement) et inter-urbain. Elle décrit le réseau routier français : routes nationales, routes départementales, autoroutes, voirie des unités urbaines de plus de 10.000 habitants comprenant les rues, les adresses postales, les parkings.... Les voies de communications décrites sont très détaillées : les demi-tours et les sens uniques sont indiqués, par exemple, ainsi que les limitations de vitesse, le poids roulant autorisé, le gabarit autorisé... Géoroute utilise pour source géométrique les données de la BD Topo et de la carte au 1/25.000, ainsi que les données correspondant au thème routier de la BD Carto. La précision des données de Géoroute est de 5 mètres en zone urbaine, et de 10 à 20 mètres en campagne.
Un objet Géoroute comporte trois composantes : une composante "réseau routier" qui décrit physiquement et logiquement le réseau routier (description du réseau, logique de circulation, adresses postales), une composante "adressage" qui correspond aux éléments adressables (éléments ponctuels ou surfaciques : bâtiments, équipements routiers, zones industrielles...), une composante "administratif" pour décrire le découpage administratif français. En zone urbaine, Géoroute est constituée d'un graphe planaire unique; en zone interurbaine, les données sont disposées sur trois couches indépendantes (routier, administratif, occupation et usage du sol), ces couches pouvant être superposées à l'édition.
I-1.3 Les normes sur l'information géographique
Les informations géographiques sont utilisées de plus en plus fréquemment, par des collectivités locales, des administrations, des entreprises et même par des utilisateurs individuels. Tous ces utilisateurs ont besoin de bases de données permettant de contenir leurs informations, afin de pouvoir les analyser par l'intermédiaire d'un Système d'Information Géographique. Bien qu'il existe des bases de données spatiales servant de référence (BD Topo, BD Carto, BD cadastrale et Géoroute), ces bases de données ne couvrent pas toujours tout le territoire français, et les collectivités ayant besoin de données géographiques sont souvent obligées de créer leurs propres bases de données (en utilisant les techniques d'acquisition de l'information vues précédemment). Pour pouvoir réutiliser ces données géographiques et ne pas avoir à saisir plusieurs fois les mêmes données entre collectivités différentes, il était nécessaire de mettre en place des normes d'échange de l'information géographique [24, 62]. Plusieurs formats d'échange existent actuellement : la norme française EDIGéO; le standard américain DIGEST (Digital Information Geographic Exchange Standard), format militaire élaboré par les nations membres de l'OTAN pour échanger l'information géographique; le standard américain SDTS (Spatial Data Transfert Standard) obligatoire depuis février 1994 pour toutes les agences fédérales concernant l'information géographique.
La norme française EDIGéO (Echanges de Données Informatisées dans le domaine de l'Information Géographique) est en passe de devenir la norme européenne d'échange de données géographiques. Mise en place en 1992 à l'initiative du CNIG (Comité National de l'Information Géographique) et de l'AFNOR (Association Française de Normalisation), cette norme est basée sur le standard américain DIGEST. EDIGéO permet d'échanger, grâce à son modèle conceptuel de données, aussi bien des données vecteur et leurs attributs, que des données raster. EDIGéO commence à s'imposer sur le marché de l'information géographique : les principaux éditeurs de SIG, ainsi que l'IGN proposent des données au format EDIGéO, ou des traducteurs entre leur format interne et le format de cette norme.
EDIGéO définit quatre modèles conceptuels regroupant les différentes formes de données existantes :
- modèle topologique : données vecteur organisées sous forme d'un graphe planaire,
- modèle réseau : données vecteur organisées sous forme d'un graphe non planaire,
- modèle "spaghetti" : données vecteur non organisées sous forme d'un graphe,
- modèle matriciel : données matricielles (raster).
A ces quatre modèles conceptuels est associé un "modèle de qualité" qui identifie les données du producteur et définit les éléments de mesure ou d'appréciation de la qualité de ces données.
Les données géographiques sont regroupées dans des "métafichiers" EDIGéO, c'est-à-dire des fichiers structurés pour contenir des données géographiques organisées selon les modèles conceptuels EDIGéO. Ce sont ces fichiers, ainsi que les fichiers décrivant la qualité des données qui peuvent être échangés.
EDIGéO fait partie d'un projet plus vaste de normalisation de l'information géographique. Ce projet français décrit l'information "topofoncière de base" à grande échelle, les spécifications du système de référence géodésique (redéfinition du système basé sur les bornes GPS permettant d'acquérir l'information géographique), des critères de qualité des données géographiques (numériques ou non), et définit le format EDIGéO d'échange des données numériques. L'information topofoncière de base est composée de trois couches d'informations géographiques : les canevas denses de référence résultant d'une densification (d'un maillage) des réseaux nationaux et destinés à assurer la cohérence des références géographiques afin d'y rattacher toutes les données localisées, l'information cadastrale numérique résultant de la numérisation de l'intégralité du contenu des plans cadastraux, l'information topographique provenant de la BD Topo pour des échelles allant du 1/5.000 au 1/25.000, et de levés terrestres ou photogrammétriques appuyés sur les canevas denses de référence pour des échelles allant du 1/500 au1/5.000.
I-1.4 Conclusion
Depuis le début du développement des Systèmes d'Information Géographiques, dans les années 60, l'information géographique a connu un développement considérable. Originellement stockées sur des cartes papier, ces données géographiques ont dues être informatisées afin d'être plus accessibles.
Avec le développement des nouvelles technologies (satellites..), de nouvelles formes d'acquisition ont vu le jour : relevés topométriques basés sur un système de bornes GPS, photos aériennes et satellitaires. Ces formes d'acquisition et l'informatisation des données géographiques ont conduit au développement de modèles de stockage permettant de numériser l'information géographique. Ces modèles sont utilisés dans les bases de données géographiques (ou bases de données spatiales) pour stocker l'information géographique numérisée. Toutes ces innovations technologiques conduisent peu à peu à la définition de normes définissant précisément l'information géographique et établissant des formats d'échange de cette information.
Notons que l'introduction des bases de données dans le domaine de l'information géographique permet de structurer cette information selon différents niveaux d'abstraction. En effet, il existe des bases de données incluant cette notion d'abstraction par le biais de l'héritage (bases de données orientées objet) ou par le biais d'objets complexes (bases de données étendues). Les cartes papier ne possédant pas d'encart détaillant une partie d'espace précis sont représentées à une échelle donnée et ne permettent pas cette structuration.
Dostları ilə paylaş: |