2. Les perspectives à partir du graphe structurel du mot non segmenté
La reconnaissance du mot n'est plus tributaire de la segmentation en graphèmes, notamment en ce qui concerne la sensibilité à l'inclinaison du mot, ou à l'absence de minimum local de son contour. Même s'il y a encore une segmentation explicite à un niveau inférieur à celui de la lettre (segmentation en arcs), la segmentation en lettres est implicite (reconnaissance des lettres dans le mot) ou hypothétique (reconnaissance des lettres indépendamment des mots). D'une manière analogue à l'utilisation des graphèmes, on envisagera également la reconnaissance globale du mot indépendamment des lettres.
Le niveau de description du mot obtenu directement par le graphe structurel, sans représentation intermédiaire en graphèmes ou autre, est élevé et précis (suivant l'ajustement de l'approximation polygonale). C'est en quelque sorte une représentation brute. Elle rejoint celle obtenue par [LEROUX 91ab] grâce à l'approximation polygonale du squelette et est très proche également de celle obtenue par [TACONET 92] grâce à l'intersection avec l'axe rectiligne du mot.
2.1. Reconnaissance des lettres dans le mot
Ainsi que les deux méthodes basées sur le même principe que nous avons déjà proposé (cf. § 1.1.1. et 1.2.1.), cette méthode suit la stratégie M4 de reconnaissance des lettres guidée par le mot, en une seule procédure d'appariement utilisant un dictionnaire de codage au niveau des lettres.
M4.4 : Matching des lettres dans le mot ASCII basé sur le graphe structurel
A partir de chaque mot hypothétique, on procède à un découpage approximatif de l'image du mot en zones plus ou moins redondantes (fenêtres horizontales se recouvrant). Ce découpage permet d'isoler dans le graphe du mot à reconnaître, les arcs de chaque zone. La reconnaissance consiste alors à rechercher l'isomorphisme optimal de sous-graphes des lettres du mot hypothétique, dans le graphe du mot à reconnaître, qui est momentanément délimité horizontalement en fonction de ses lettres.
Mis à part l'optimisation liée à la méthode M4 (compression du dictionnaire), cette méthode nécessite seulement une adaptation de l'algorithme existant.
De manière analogue à l'utilisation des graphèmes, la recherche descendante des lettres guidée par les mots peut être remplacée par une recherche ascendante systématique des lettres indépendamment des mots.
2.2. Reconnaissance des lettres indépendamment du mot
Cette méthode est également basée sur l'appariement de sous-graphes de lettres dans le graphe du mot non segmenté. Cependant, il n'y a plus de segmentation implicite du graphe du mot en zones correspondant à la largeur des lettres du mot hypothétique. Cette fois, on va apparier systématiquement chaque graphe des lettres de l'alphabet à différentes positions dans le graphe du mot. Pour limiter la complexité de cette recherche exhaustive, on restreint l'appariement sur une fenêtre horizontale qui parcourt de proche en proche tout le mot. Le réglage de la largeur de cette fenêtre est délicat, car elle doit être supérieure à la largeur d'une lettre, mais pas trop afin d'éviter que le coût d'appariement ne soit trop élevé.
La reconnaissance du mot à partir des lettres est basée sur le matching M9 déjà présenté auparavant.
M5.2 : Appariement des graphes structurels des lettres
M9 : Matching des mots ASCII avec les lettres ASCII
La difficulté de l'application du matching M9 dans ce cas repose sur le calcul d'un classement de probabilités alors que les lettres ne se situent pas exactement à la même position dans le mot, les hypothèses étant plus ou moins exclusives. En effet, puisque le mot n'est plus segmenté une fois pour toutes avant la reconnaissance, on aboutit à une segmentation floue (dépendante de la reconnaissance des lettres) du mot en un ensemble de lettres. La position de chacune de ces lettres, ou bien seulement leur ordre, sera pris en compte dans le matching, éventuellement en autorisant dans certains cas la permutation des lettres de positions voisines.
Dans les deux cas de l'appariement de sous-graphes de lettres dans celui du mot (cf. § 2.1. et 2.2.), on note l'importance de la fenêtre horizontale pour la réussite du matching des lettres, ce qui montre la sensibilité de l'approche. En utilisant le matching directement au niveau du graphe entier des mots, sans utiliser les lettres, on réduit l'importance de cette fenêtre horizontale à un simple réglage destiné à réduire la complexité, sans autres conséquences.
2.3. Reconnaissance du mot indépendamment des lettres
Le principe de la reconnaissance structurelle globale des mots est simplement l'appariement des graphes des mots entiers. La stratégie est typiquement celle de M2 (approche descendante du mot et recherche combinatoire en largeur), même si, nous l'avons déjà indiqué pour la reconnaissance directe des mots codés en graphèmes, le dictionnaire de graphes des mots peut être précalculé à partir d'un alphabet de graphes de lettres de référence.
M2.2 : Appariement des graphes structurels des mots entiers
La taille du vocabulaire que l'on peut utiliser dans cette stratégie dépend des performances obtenues. Sauf amélioration, notamment mais pas seulement, de la réduction de la complexité d'appariement au moyen d'une fenêtre horizontale (voir précédemment), cette approche est à réserver à un vocabulaire de petite taille.
A l'instar des méthodes que nous avons proposées à partir de la segmentation en graphèmes, la principale difficulté de la reconnaissance de l'écriture basée sur le graphe du mot non segmenté réside dans la représentativité de l'alphabet manuscrit pour le cas omniscripteur. Que cela soit pour la reconnaissance des lettres ou bien pour la reconnaissance du mot entier, dans les deux cas, l'utilisation de l'appariement structurel ne nécessite qu'une adaptation de l'algorithme déjà existant. Elle consiste à restreindre l'appariement à l'intérieur d'une fenêtre horizontale afin d'éviter de comparer inutilement des zones sans correspondances dans les mots, ou bien pour réduire la complexité de la recherche de sous-graphes de lettres dans le graphe du mot.
Dostları ilə paylaş: |