Navigation personnalisée dans des masses de données
Modèle de représentation visuelle
Plateforme de tests VizOD
Cas du jeu de données IMDB
Une visualisation du jeu de données
Personnalisation
Concours InfoVis’07
Présentation
2006-2009 : Allocataire moniteur LIRIS/INSA Lyon
Encadré par Béatrice Rumpler & Jean-Marie Pinon
« Navigation personnalisée
dans de grands ensembles de documents :
Modèle et représentation visuelle »
But : améliorer l’accès visuel à de grands ensembles de données
Idée : réutiliser la connaissance du profil utilisateur dans la présentation et l’interaction avec les résultats
Présentation linéaire par pagerank décroissant
Présentation linéaire par pagerank décroissant
[ VRP07 ]Romain Vuillemot, Béatrice Rumpler, et Jean-Marie Pinon. L’hyper-accès au moyen du profil utilisateur. A paraître dans h2ptm’07 : Collaborer, Échanger, Inventer : Expériences de réseaux, Octobre 2007, Hammamet, Tunisie.
[ VRP07 ] Romain Vuillemot, Béatrice Rumpler, et Jean-Marie Pinon. L’hyper-accès au moyen du profil utilisateur. A paraître dans h2ptm’07 : Collaborer, Échanger, Inventer : Expériences de réseaux, Octobre 2007, Hammamet, Tunisie.
Extraction
Indexation/structuration des données, requêtes d’interrogation, transformation en structure interne, ..
Disposition
Représentation dans un espace 2D/3D/hyperbolique, colorisation, ajout de symboles..
Rendu
Support de rendu (image, vidéo), cadre applicatif, interactions..
Réutilisation du profil/connaissances de l’utilisateur :
Choix de la disposition et de la représentation
Réseau, arbre, position spatiale, couleurs, symboles,..
Choix du rendu
2D/3D, cadre applicatif, ..
Réutilisation du profil/connaissances de l’utilisateur :
Choix de la disposition et de la représentation
Réseau, arbre, position spatiale, couleurs, symboles,..
Choix du rendu
2D/3D, cadre applicatif, ..
« Visualization-On-Demand »
« Visualization-On-Demand »
Serveur de test
Reprend le paradigme du on-demand (choix de librairies graphiques, structures de données, ..) permettant la personnalisation.
Capitalisation
Connaissances (évaluations, design, ..)
Traces d’utilisation
Temps de calculs.
Installation (en cours) de librairies
Proviennent de nombreux domaines : informatique, biologie, chimie, .. qu’il faut homogénéiser.
Identifier les choix de personnalisation (librairies, métaphores visuelles, ..)
Identifier et définir les stratégies d’intégration dans des cadres applicatifs
Augmenter l’exhaustivité en général
Définir des critères de personnalisation
Similarités avec les profils de sélection (construction, structure du profil, ..)?
Définition d’un profil visuel?
Vers un profil commun?
Navigation personnalisée dans des masses de données
Modèle de représentation visuelle
Plateforme de tests VizOD
Cas du jeu de données IMDB
Une visualisation du jeu de données
Personnalisation
Concours InfoVis’07
Visualisation analytique
Visualisation analytique
Spotfire : outil d’analyse permettant de répondre à des scénarios ou en faire émerger
Users who watch all the most popular movies do not like other movies as much
Base de données IMDB (24 tables, 25k à 4,5M de champs). Peut-on avoir une vue quantitative sur les données?
Base de données IMDB (24 tables, 25k à 4,5M de champs). Peut-on avoir une vue quantitative sur les données?
Par exemple sous forme d’arbre : une racine artificielle, chaque fils sera une table et chaque feuille une entrée dans la table
Répond à la question : quelle est la proportion des différentes tables?
Etapes de représentation visuelle
Requêtes d’extraction des données (SELECT ALL ..)
Construction d’un arbre (ajout d’une racine artificielle)
Conversion en GML (Graph Modeling Language)
Disposition avec LGL (Ajout de composantes spatiales au graphe) par auto-organisation.
Rendu avec LGL (Conversion du graphe spatialisé en image)
Affichage
Aspects positifs
Aspects positifs
On a une vue globale et immédiate
Mais uniquement quantitative
Utilisation des capacités de l’être humain :
Clustering, classification, ..
Ne requiert pas de lourd apprentissage
Aspects négatifs
Pas temps réel : attente par l’utilisateur
Anticiper le comportement de l’utilisateur
Navigation difficile
Identifier les ressources disponibles (écrans, espaces, ..)
Il faut coordonner!
BILAN : définir une stratégie (objectif , qualité de résultat, ..) en identifiant le contexte d’usage (ressources d’interaction disponibles, environnement) : utiliser le profil utilisateur.
Disposition:
Disposition:
Couleurs des arêtes : historique en rouge
Icônes sur les sommets : affiche de films
Symboles sur les sommets : chiffres
Utiliser l’espace : rapprocher des films ayant le même casting
Rendu (travaux en cours)
Choix de l’application, choix de l’interaction, ..
Stratégie d’accès aux données (travaux en cours)
Overview, zoom & details [Shn96]
Focus+Context
Approches multi-résolutions
[Shn96] Ben Shneiderman. The eyes have it : A task by data type taxonomy for information visualizations. Proceedings of the 1996 IEEE Symposium on Visual Languages, page 336, Washington, DC, USA, 1996. IEEE Computer Society.
Assister la tâche de l’utilisateur avec une visualisation personnalisée des données.
Assister la tâche de l’utilisateur avec une visualisation personnalisée des données.
The (2007) data set consists of about Hollywood movies including actors, actresses, awards, and similar. This year's focus is on the design aspects of the visualization in addition to its exploratory and analytical aspects, and entrants are encourages to augment the data set with any publicly available data.
The (2007) data set consists of about Hollywood movies including actors, actresses, awards, and similar. This year's focus is on the design aspects of the visualization in addition to its exploratory and analytical aspects, and entrants are encourages to augment the data set with any publicly available data.