Lors de l'extraction des primitives, l'objectif est de sélectionner l'information pertinente qui se trouvait noyée dans la masse de l'information brute acquise. Il s'agit d'éliminer plus de bruit que d'information signifiante afin d'augmenter la discrimination. Autrement dit, la question qui se pose est comment réduire sans être réducteur ?
Le dilemme qui se présente est alors le suivant : une trop grande approximation entraîne une perte d'information. En effet, certaines lettres étant plus informantes que d'autres, il est nécessaire de conserver une description précise du mot. Or, la complexité du système de reconnaissance augmente avec le niveau descriptif des primitives.
Pour résoudre ce problème de complexité, la segmentation du mot en lettres semble la seule issue qui nous permette d'utiliser des primitives évoluées. Il est inutile de rappeler la difficulté de segmenter les mots du fait de l'interdépendance du tracé des lettres.
D'une façon plus générale, le résultat de chaque extraction de primitives peut être considéré comme une forme particulière de segmentation ou de réduction de l'information. La segmentation implique toujours le risque de fragmentation d'une unité d'information, qu'il s'agisse de la segmentation du mot en lettres ou bien de l'extraction de primitives sur la lettre. D'autre part, la réduction occasionnée par l'approximation constitue une sélection souvent arbitraire de l'information. Dans ces deux cas, il y a donc inévitablement un risque de perte d'information. Notre objectif dans le prochain chapitre va consister à réduire ce risque dans une étude approfondie de la segmentation.
CHAPITRE II
ETUDE DE LA SEGMENTATION
Introduction
Après avoir établi un bilan des principaux outils et des méthodes dont nous disposions pour la reconnaissance des textes manuscrits, il nous faut en venir à l'obstacle auquel se sont affrontés tous les chercheurs : la segmentation. Segmentation des lignes en mots, segmentation des mots en lettres, la segmentation, cette opération si facilement réalisée par le lecteur qu'elle en est devenue inconsciente, il nous a semblé nécessaire de l'aborder sous un angle différent, celui du mot, des groupes de lettres ou des fragments de lettres plutôt que celui des caractères, avec une autre stratégie faisant appel à l'aide des mathématiques, notamment aux transformées.
Lors de l'étude de la modélisation des mots manuscrits, il est apparu que le résultat de l'extraction de chaque primitive pouvait être considéré comme une forme particulière de segmentation ou de réduction de l'information. Dans ces deux cas, il y a un risque de perte d'information.
L'idée qui est à l'origine de la première partie de ce chapitre, est que ce risque de perte d'information peut être minimisé en remplaçant l'approche locale de la segmentation et de la réduction par une approche globale, ceci grâce à l'utilisation de transformées mathématiques. En effet, les transformations globales comme la transformation de Fourier constituent un changement de représentation réversible (les transformations étudiées sont orthogonales) donc sans perte d'information. Ce changement a pour but la concentration d'une information qui est noyée dans le bruit ou parmi d'autres données redondantes ou non significatives.
L'objectif est de construire, à partir de la segmentation globale et de la réduction globale appliquées à une image transformée, des primitives qui dépendent encore de la totalité des pixels de l'image (primitives globales), afin d'extraire des informations réparties (non localisées) auxquelles l'oeil humain pourrait avoir naturellement accès. Quelle est la nature de ces informations ? Elle dépend de la transformation mathématique que l'on utilise. Nous nous sommes principalement intéressé aux transformées de Hough et de Fourier, car nous avons axé notre recherche sur l'analyse et la segmentation de l'écriture plutôt que sur la reconnaissance ou la classification, objectifs pour lesquels d'autres transformées sont plus appropriées.
Les études s'appliquant à l'extraction de primitives globales de l'écriture manuscrite sont bien moins nombreuses que les études, devenues classiques, relatives aux primitives locales, c'est pourquoi, aujourd'hui où des moyens de calcul importants nous ouvrent de nouvelles perspectives avons-nous voulu, pour répondre à la question sur la nature des informations globales, procèder à une recherche méthodique, théorique puis expérimentale, recherche que nous ferons suivre de quelques applications.
Dans la deuxième partie de ce chapitre, nous mènerons une étude complémentaire de la segmentation - la segmentation par l'extraction de graphèmes - qui constitue une approche plus classique mais aussi qui conduit à des résultats plus pratiques. Nous montrerons que la segmentation en graphèmes nécessite la connaissance de plusieurs informations sur l'écriture, informations qui peuvent être obtenues à partir de l'approche globale de la segmentation étudiée dans la première partie.
1. Segmentation globale de l'image par application de transformées mathématiques
Notre étude portera principalement sur l'apport des transformées de Hough et de Fourier.
Dostları ilə paylaş: |