Année 2005-2006 Sujets de stages recherche proposés dans la spécialité Génie Informatique
1 Modelisation conceptuelle multi-niveaux 2 Application d'une méthode de segmentation de page par champs de Markov à l'analyse de documents de la Renaissance
3 Clustering : vers un Apprentissage semi-supervisé
4 Clustering : étude comparative
5 Recherche de symboles sur des images de documents graphiques par une approche structurelle génétique
6 Analyse de données, apprentissage et classification pour l'analyse et l'interprétation d'images de documents structurés
7 Évaluation de performances en analyse et interprétation d'images de documents structurés
8 Système d’aide au codage et à l’indexation contrôlée des ressources comportant du texte et des images médicales
9 Diagnostic différentiel de l’hétérogénéité diffuse de la perfusion cérébrale en TEMP : Définition de paramètres d’hétérogénéité et fusion d’information
10 Méthodologie de l'agentification aspectuelle versus la conception en génie logiciel
11 Agentification aspectuelle massive appliquée à différents systèmes complexes : écosystèmes, learning, reconnaissance de formes
12 Conscience artificielle : approche agent et lien avec des systèmes robotisés
13 Emotions artificielles : approche agent et processus, applications
14 Amélioration d’images en temps réel par ondelettes à partir d’une séquence d’images
15 Analyse d'une plate-forme de clustering d'agents
16 Modélisation de robots
17 Etude et application de la méthode TAEMS pour spécifier et développer des SMA
18 Réseaux Bayésiens et Détection d'Activités Illégales sur un Réseau
19 Réseaux Bayésiens et Criminologie
20 Modèles causaux multi agents
21 Algorithmes génétiques multi-critere adaptatifs
22 Extraction de champs numériques dans des documents manuscrits par HMM et CRF
23 Interface cerveau-machines : mise en oeuvre et applications
24 Détection et diagnostic de l’hypovigilance du conducteur dans le cadre de l’aide à la conduite automobile
25 Détection des voies de circulation pour l’assistance à la conduite automobile
26 Contribution à l'élaboration d'une commande tolérante aux fautes Application à un actionneur de moteur Diesel
27 Contribution à l'élaboration d'un contrôleur prédictif neuronal : Application à la commande d'un moteur Diesel
28 Etude comparative des techniques de détection
29 Surveillance d’un système industriel complexe
30 Segmentation de régions par mesure de texture couleur
31 Reconnaissance d’objets texturés dans un document Mise en œuvre d’outils de Traitement d’image : texture et couleur
32 Suivi de véhicules dans les séquences d'images routières par attributs texturaux
33 Suivi de la route dans les séquences d'images routières par attributs texturaux
34 Navigation dans une base de scénarii et décision en contexte
Sujet 1: Modelisation conceptuelle multi-niveaux
Encadrement : B.Sadeg (si au Havre), M.Mainguenaud (si a Rouen)
Sujet :
L'objectif est d'etudier dans le cadre d'applications geographiques temps reel (exemple : la gestion d'une flotte de mobiles dans le cadre de leurs deplacements) les informations associees a plusieurs niveaux d'abstraction.
Suivant le niveau de representation des informations (au niveau d'une region, au niveau d'une ville, au niveau d'un quartier, au niveau d'une rue) l'application d'operateurs va renvoyer des resultats necessitant des informations alphanumeriques et des informations graphiques de
representation spatiale du phenomene. Le probleme consiste a determiner les informations pertinentes qui peuvent etre transferees d'un niveau vers un autre tant dans le sens ascendant (du rue vers quartier) que dans le sens descendant (de quartier vers rue).
Ce travail s'incrit dans le cadre d'un travail mene en cooperation entre le laboratoire PSI (Rouen) et le laboratoire LIH (Le Havre) en liaison avec le Groupe de Recherche SIGMA-Cassini (CNRS GDR2340) - Groupe de Travail Mobilite et Temps Reel.
Domaines : Systeme d'Information Geographique, Bases de Donnees, Systeme
Temps Reel.
Contacts :
bruno.sadeg@univ-lehavre.fr
michel.mainguenaud@insa-rouen.fr
Sujet 2 : Application d'une méthode de segmentation de page par champs de Markov à l'analyse de documents de la Renaissance
Durée: 6 mois
Encadrement: Thierry Paquet (Thierry.Paquet@univ-rouen.fr), Stéphane Nicolas (Stephane.Nicolas@univ-rouen.fr)
Présentation du sujet:
Dans le cadre d'un projet européen de valorisation du patrimoine culturel et scientifique, intitulé MADONNE (MAsse de DOnnées issues de la Numérisation du patrimoiNE), on vous propose d'adapter une méthode de segmentation de page de documents manuscrits non contraints, à l'analyse de documents de la Renaissance. Cette méthode, développée au laboratoire PSI dans le cadre d'un projet d'analyse automatique des brouillons de l'écrivain Gustave Flaubert, est basée sur une modélisation par champs de Markov. Dans un premier temps il s'agira d'adapter cette méthode à l'analyse de documents de la Renaissance du corpus MADONNE. Le contenu de ces documents est mixte, textuel et graphique. L'analyse consistera donc à identifier les parties textuelles et les parties graphiques (essentiellement des lettrines). Pour les parties textuelles, on envisagera éventuellement une analyse de la mise en page (segmentation en blocs, lignes). Il sera donc nécessaire d'établir un modèle pour ce type de documents, de déterminer le jeu de caractéristiques à extraire des images de documents et d'étiqueter un certain nombre d'images afin de pouvoir réaliser un apprentissage automatique des paramètres du modèle. Dans un second temps il s'agira de réfléchir à l'implation d'une méthode basée sur un autre type de modélisation, les champs conditionnels (CRF). Dans les domaines du text mining et du web mining, ce type de modélisation a montré sa supériorité sur les modèles de Markov classiques pour l'analyse de séquences. Cependant l'application des CRF à l'analyse de structures bidimensionnelles n'est pas triviale, et peu de travaux ont été réalisés dans ce domaine jusqu'à présent.
Sujet 3 : Clustering : vers un Apprentissage semi-supervisé
Ce sujet s'inscrit dans une perspective Fouille de données. L'idée est de proposer dans un premier temps une version supervisée de l'algorithme d'apprentissage incrémental de carte auto-organisatrice IGNG [Prudent 04, 05] à l'image de l'algorithme LVQ (Linear Vector Quantization). La suite consiste à mettre en oeuvre un processus d'aide à l'étiquetage de données inconnues. L'idée étant de mettre au point un système capable d'initier l'apprentissage sur une base de données limitée en taille. Cette première modélisation est exploitée ensuite pour proposer une aide à l'étiquetage de données inconnues par la mise en place d'un mécanisme de contrôle de l'évolution de l?apprentissage par l'alternance de phases d?apprentissage, de test et de clustering. Un facteur déterminant dans ce processus sera la définition de certains paramètres capables de guider efficacement l?apprentissage, et en particulier, un facteur confiance/fiabilité pour piloter l?étiquetage semi-automatique des
données.
Niveau : M2
Lieu : Laboratoire PSI
Contact : Abdel.Ennaji@univ-rouen.fr, Yann.Prudent@univ-rouen.fr
Sujet 4: Clustering : étude comparative
En clustering et analyse de données, plusieurs algorithmes et modèles sont disponibles actuellement. Les performances de ces techniques dépendent de plusieurs facteurs et il n'est pas toujours facile de comparer les performances de tels algorithmes.
Ce stage consiste donc à mener une étude qualitative sur un ensemble bie connu d?algorithmes de clustering (partitionnement, hiérarchique, cartes auto-organisatrices) et d?établir un protocole de test et de comparaison de ces algorithmes (benchmarks, critères de comparaison, etc.).
Niveau : M2
Lieu : laboratoire PSI
Contact : Abdel.Ennaji@univ-rouen.fr, Yann.Prudent@univ-rouen.fr
Sujet 5: Recherche de symboles sur des images de documents graphiques par une approche structurelle génétique
Sujet 6: Analyse de données, apprentissage et classification pour l'analyse et
l'interprétation d'images de documentsstructurés
Contexte
Ce sujet se situe dans les domaines de l'analyse de données et de l'analyse et l'interprétation d'images de document. L'analyse et l'interprétation d'images de document sont des processus faisant intervenir un certain nombre de traitements, depuis des traitements bas niveau agissant sur l'image (binarisation, nettoyage, redressement, segmentation) jusqu'à des traitement d'interprétation (reconstruction de la structure logique du document). Des algorithmes de classification interviennent à divers stades de ce processus pour effectuer des tâches telles que :
• la reconnaissance de caractères
• la reconnaissance de fontes
• la discrimination texte/graphique
• l'étiquetage logique des objets physiques
• la reconnaissance de type de document
La plupart des systèmes fonctionnels existant s'attache à des cas d'usage précis. Ces systèmes exploitent les particularités du cas d'usage auquel ils s'attachent, les rendant peu adaptables pour d'autres cas d'usage.
Les particularités d'un cas d'usage peuvent porter, par exemple sur le type des documents traités et/ou sur la finalité des traitements auxquels ils sont soumis. Dans ce sujet, nous visons à nous détacher d'un cas d'usage particulier pour atteindre une certaine généricité. Pour ce faire, nous disposons d'une base d'images de document générée de façon synthétique.
Cette base est complétée par des informations de vérité terrain de différentes natures :
1
• scalaires
• vectorielles
• symboliques
• syntaxiques
• structurelles
L'objectif de ce sujet est de mettre en oevre les algorithmes d'analyse de données de la littérature afin de sélectionner les caractéristiques et les algorithmes de classification associés les plus pertinents pour les différents traitements utilisés en analyse et interprétation d'images de document et nécessitant des tâches de classification. Les algorithmes d'apprentissage et de classification devront ensuite être mis en oevre pour l'évaluation des résultats.
Encadrement
Pierre Héroux, Eugen Barbu, Sébastien Adam, Éric Trupin
Sujet 7 : Évaluation de performances en analyse et interprétation d'images de documents structurés
Contexte
Le sujet proposé se situe dans le domaine de l'évaluation de performances des systèmes d'analyse et d'interprétation d'images de documents structurés. L'analyse et l'interprétation d'images de document sont des tâches complexes qui font intervenir un grand nombre de traitements depuis les traitements bas niveau agissant sur l'image (correction des défauts de l'acquisition : orientation, déformation, bruit, binarisation), des traitements intermédiaires d'analyse de la structure physique (segmentation) et d'interprétation (classification). La plupart des systèmes d'analyse et d'interprétation d'images de documents structurés s'attachent à des cas d'usage particulier. Par conséquent, les documents traités et les traitements mis en oeuvre sont dédiés aux cas d'usages abordés. Il est alors difficile de pouvoir comparer de façon objective les performances de ces différents systèmes ou des traitements qu'ils utilisent.
Un certain nombre de bases font référence dans la communauté scientifique de l'analyse de documents. Ces bases sont composées d'images de documents d'une part, et d'autre part, de vérité terrain à laquelle sont confrontés les résultats du traitement automatique. Cependant, la vérité terrain de ces bases est bien souvent dédiée à l'évaluation d'un nombre de traitements restreint rendant ces bases inexploitables pour l'évaluation d'autres traitements et du système dans sa globalité.
Sujet
Nous avons développé une application permettant la génération synthétique d'images de documents et de la vérité terrain associée. L'ambition de cette application est de proposer un format permettant d'évaluer une large gamme de traitement utilisé en analyse et inteprétation d'image de document et ce, indépendament de la nature des documents et du cas d'usage. De ce fait, le format de vérité terrain se veut être le plus exhaustif possible pour permettre d'évaluer un large panel de traitement.
L'objectif de ce stage est de proposer un ensemble de métriques permettant l'évaluation des traitements utilisés en analyse et interprétation d'images de document. L'évaluation de certaines tâches a déjà fait l'objet de certains travaux publiés (OCR, indexation, segmentation...) Une étude bibliographique de ces travaux devra déboucher sur une implantation des métriques de la littérature. En revanche, les évaluations pour d'autres tâches n'ont été que très peu abordées. L'objectif est ici de reprendre un certain nombre de métriques utilisées de façon classique et de la catégoriser en fonction des structures de données traitées :
• Taux de reconnaissance
• Matrices de confusion
• Courbe taux de lecture/taux de confusion Évaluation de performances en analyse et interprétation d'images de
• Distance entre chaînes (utilisée par exemple pour évaluer des OCR)
• Distance entre graphes (utilisée par exemple pour évaluer la reconnaissance de structures)
• Compromis rappel/précision
Compétences requises
• Programmation Java (de préférence), C++ ou C
• Une connaissance des technologies XML est appréciée.
Encadrement
Pierre Héroux, Eugen Barbu, Sébastien Adam, Éris Trupin
Collaborations
Des collaborations pourront être envisagées avec des membres du projet EPEIRES travaillant sur l'évaluation de performances en reconnaissance de symboles.
Sujet 8: "Système d’aide au codage et à l’indexation contrôlée des ressources
comportant du texte et des images médicales"
Co-encadrement : A. Rogozan (PSI) & Stéfan Darmoni (CIMEF)
Sujet 9: "Diagnostic différentiel de l’hétérogénéité diffuse de la perfusion cérébrale en TEMP : Définition de paramètres d’hétérogénéité et fusion d’information"
Co-encadrement : A. Rogozan (PSI) & I. Gardin (Quantif)
Sujet 10: méthodologie de l'agentification aspectuelle versus la conception en
génie logiciel
Encadrement: Alain Cardon, AlainCardon@aol.com
Sujet 11: Agentification aspectuelle massive appliquée à différents systèmes
complexes : écosystèmes, learning, reconnaissance de formes ...
Encadrement: Alain Cardon, AlainCardon@aol.com
Sujet 12: conscience artificielle : approche agent et lien avec des systèmes
robotisés
Encadrement: Alain Cardon, AlainCardon@aol.com
Sujet 13: Emotions artificielles : approche agent et processus, applications
Encadrement: Alain Cardon, AlainCardon@aol.com
Sujet 14: Amélioration d’images en temps réel par ondelettes à partir d’une séquence d’images
Lieu du stage: PSI Université de ROUEN
Encadrants: Stéphane Mousset, Pierre MICHE
L’amélioration des images une problématique importante en traitement d’images, de nombreux travaux, durant les 5 dernières années y font référence. Par contre, l’amélioration d’images en temps réel n’a pas été étudié.
Dans la cadre de ce stage de master on vous propose de concevoir et de réaliser un prototype du système d’amélioration d’images pour des scènes routières de type brouillard, pluie ou neige. A partir des approches existantes dans les autres domaines applicatifs, il faudra concevoir les nouveaux algorithmes et les valider dans des situations réelles. Ces algorithmes doivent être efficaces, faibles et rapides (temps réel fortement contraint).
L’application finale visée est la l’assistance à la conduite automobile dans des conditions de visibilité fortement dégradé.
Des essais sur routes devront être effectué pour valider les algorithmes.
Ce stage s’inscrit directement dans la suite du projet ARCOS 2004, et a pour but de se positionner dans pour le prochain projet « ARCOS2 ». De plus ce projet s’inscrit dans le cadre d’une collaboration avec l’équipe d’Alberto BROGGI de l’université de PARME.
Collaborations:
Université de PARME, LAAS de Toulouse (Equipe Michel DEVIS), LIVIC INRET
Profil souhaité du candidat:
Bonne culture générale en mathématiques et en EEA, et en particulier les connaissances en traitement d’image, en vision.
Sujet 15: Analyse d'une plate-forme de clustering d'agents
Dominique Fournier – Gaële Simon
Contexte :
Ce stage sera effectué au sein de l'équipe Agents du LIH. Il s'agit d'une équipe qui mène des recherches sur les systèmes multi-agents, tant au niveau théorique qu'applicatif. Au sein de cette équipe, le groupe Clustering s'intéresse à la détection de groupes d'agents (i.e. dont le comportement est similaire) qui peuvent correspondre à des phénomènes émergents. Ceci trouve des applications en particulier dans le cadre d'architectures multi-agents dédiées à la simulation. Par exemple, dans un système modélisant un ensemble d'animaux en interaction, cela pourrait conduire à reconnaître les herbivores des carnivores. À cette fin, nous avons mis au point une plate-forme multi-agents intégrant des fourmis artificielles destinée à la détection de tels groupes émergents ainsi qu'une plate-forme de simulation associée.
Objectifs :
Ce stage consiste à mettre au point des outils permettant de mieux évaluer les résultats de notre système et des stratégies mises en oeuvre pour le clustering d'agents. Le déroulement du stage pourra suivre les étapes suivantes:
- Mise au point d'un protocole d'expérimentation destinée à évaluer les perfomances de la plate-forme de clustering.
- Mise au point d'outils de monitoring mettant en oeuvre ce protocole.
- Analyse des stratégies actuellemnt disponibles pour le clustering : forces, limitations, améliorations possibles.
Bibliographie :
Coma, R.; Simon, G., Coletta, M., A Multi-Agent Architecture for Agents Clustering.
ABS03 International Conference on Agent Based Simulation, 2003
Lerman K., Galstyan A., Automatically Modelling Group Behavior of Simple Agents,
MOO 2004
Monmarché, N., Algorithmes de fourmis artificielles : applications à la classification et à l' optimisation.
Thèse de l'université de Tours, France, 1996.
Simon G., Fournier D., Agents Clustering with Ants,
ABS 2004, 5th International Workshop on Agent-Based Simulation,
SCS Publishing House.pages 147-152, mai 2004
Sujet 16 : Modélisation de robots
Bruno Mermet – Gaële Simon
I. Contexte
Ce stage sera effectué au sein de l'équipe Agents du LIH. Il s'agit d'une équipe qui mène des recherches sur les systèmes multi-agents, tant au niveau théorique qu'applicatif. Au sein de cette équipe, le groupe Agentification développe des méthodes de conception et de validation de SMA. Ces travaux ont mené à la proposition de méthodes d'agentification [AIMSA02], de modèles d'agents [DALT05] et de systèmes de preuve [SASEMAS05]. La validation des ces propositions a été effectuée sur des applications, notamment un problème de coloration de graphe et un système proieprédateurs.
II. Réalisation
Dans le contexte d'une extension de nos travaux pour spécifier et vérifier non plus simplement un agent, mais un
système multi-agents faisant intervenir différents agents, nous nous intéressons à une application particulière qui a déjà servi pour valider d'autres techniques de spécification : la modélisation de robots autonomes envoyés sur mars [AAMAS03]. Le stage consiste à spécifier ce problème en utilisant notre modèle (GDT) et à vérifier le comportement de chacun des agents. Des idées sur la validation du système dans son ensemble devront également être apportées.
III.Bibliographie
[AAMAS03] R. H. Bordini, M. Fisher, C. Pardavila, and M. Wooldridge. Model checking AgentSpeak. In Proc. 2nd Int. Joint Conf. on Autonomous Agents and Multi-Agent Systems
[DALT05] Specifying, Validating and Generating an Agent Behaviour Using a Goal Decomposition Tree , Gaële Simon, Bruno Mermet, Dominique Fournier, and Marianne Flouret.
[SASEMAS05] A compositional proof system for agent behaviour. D. Fournier, B. Mermet, G. Simon.
[AIMSA02] SIMON G., FLOURET M., MERMET B. : "A Methodology to solve optimisation problems with MAS - application to the graph colouring problem"; 10th international conference on Artificial Intelligence :Methodology, Systems, Applications (AIMSA 2002), Varna (Bulgaria), LNAI n°2443; pp 162-172 (2002).
Sujet 17 : Etude et application de la méthode TAEMS pour spécifier et développer des SMA
Gaële Simon – Bruno Mermet
I. Contexte
Ce stage sera effectué au sein de l'équipe Agents du LIH. Il s'agit d'une équipe qui mène des recherches sur les systèmes multi-agents, tant au niveau théorique qu'applicatif. Au sein de cette équipe, le groupe Agentification développe des méthodes de conception et de validation de SMA. Ces travaux ont mené à la proposition de méthodes d'agentification [AIMSA02], de modèles d'agents [DALT05] et de systèmes de preuve [SASEMAS05]. La validation des ces propositions a été effectuée sur des applications, notamment un problème de coloration de graphe et un système proieprédateurs. D'autres travaux dans le même domaine sont menés, et ont donné lieu à différentes méthodes (MaSE, Prometheus, Goal, Tropos, Kaos, etc.). Parmi ces différentes méthodes, TAEMS [JAAMAS02] présente un certain nombre de caractéristiques intéressantes :
– la modélisation a lieu au niveau de l'ensemble du système;
– les besoins sont exprimés en terme de tâches/buts et de dépendance entre ceux-ci
-
des outils sont associés à la méthodes
-
les coordinations entre agents et les contraintes temps réel peuvent être exprimées
II. Réalisation
Le sujet de ce stage va consister en la réalisation d'une étude approfondie de la méthode TAEMS. Dans un premier temps, il sera nécessaire de comprendre la méthode pour analyser ses avantages et inconvénients. Ce travail devra se conclure par un document de synthèse et une présentation à effectuer aux membres du groupe Agentification. Un certain nombre d'outils ont été développés autour de la méthode TAEMS, notamment une API, JAF (Java Agent Framework) et un simulateur (MAS simulator). La deuxième phase du stage consistera donc à étudier les différentes fonctionnalités offertes par ses outils et à faire une synthèse sur leur utilisation. Enfin, deux applications devront être développées avec ces outils : un système proie prédateurs ainsi qu'un exemple de contract-net (une instance de ce système peut être le suivant : un client recherchant un billet d'avion entre deux villes, une agence de voyage jouant le rôle d'intermédiaires, et plusieurs compagnies d'aviation). Si possible, ces deux exemples devront servir à comparer l'approche de TAEMS avec celle développée dans le groupe Agentification.
III Bibliographie
[JAAMAS02] Lesser, V.; Decker, K.; Wagner, T.; Carver, N.; Garvey, A.; Horling, B.; Neiman, D.; Podorozhny, R.;NagendraPrasad, M.; Raja, A.; Vincent, R.; Xuan, P.; Zhang, X.Q.. Evolution of the GPGP/TAEMS Domain-Independent Coordination Framework. Autonomous Agents and Multi-Agent Systems, Volume 9, Number 1, Kluwer Academic Publishers, pp. 87-143. July 2004. This is a revised version of the paper that appeared in Proceedings 1st International Conference on Autonomous Agents and Multi-Agent Systems, 2002.
[DALT05] Specifying, Validating and Generating an Agent Behaviour Using a Goal Decomposition Tree , Gaële Simon, Bruno Mermet, Dominique Fournier, and Marianne Flouret.
[SASEMAS05] A compositional proof system for agent behaviour. D. Fournier, B. Mermet, G. Simon.
[AIMSA02] SIMON G., FLOURET M., MERMET B. : "A Methodology to solve optimisation problems with MAS - application to the graph colouring problem"; 10th international conference on Artificial Intelligence :Methodology, Systems, Applications (AIMSA 2002), Varna (Bulgaria), LNAI n°2443; pp 162-172 (2002)
Dostları ilə paylaş: |