L’accès asynchrone et synchrone à des contenus riches dans un monde connecté
Jean-Marc Pierson
LIRIS - INSA de Lyon
Jean-Marc.Pierson@insa-lyon.fr
http://liris.univ-lyon1.fr
Depuis 1er janvier 2003 : LIRIS
L’équipe de recherche…
2 permanents, 5 doctorants, 1 ingénieur
L’accès asynchrone et synchrone à des contenus riches dans un monde connecté
Accès synchrone : les informations sont demandées à un serveur, qui les envoie (pull)
… et asynchrone : le serveur envoie de lui-même les données au client, suivant un abonnement préalable (push)
contenus riches : les données possèdent une information sémantique qui peut être exploitée
…un monde connecté : ou déconnecté (sans fil) ! Disons plutôt connectable !
Plan de la présentation
Le contenu riche
Les utilisateurs
Les communautés
L’indexation
Les mécanismes d'accès
La sécurité des données
L'échelle de déploiement
Le contenu riche
Une donnée brute n'a que peu d'utilité
Contenu riche : un sens est associé à une donnée
Un contenu = des contenus !
Par exemple, un dossier médical est constitué de données patients et de données images
contenu riche ... ou enrichi ?
Le dossier médical peut s'enrichir au fil de la vie du patient et des visites chez des spécialistes..
Les utilisateurs…
… ont des sensibilités différentes
… sont donc multiples !
leurs attentes seront diverses : difficile de fournir une réponse universelle
nécessité de les appréhender dans toute leur diversité : notion de profil utilisateur
ils sont mobiles, et ont "besoin" de l’information à tout moment
Le profil utilisateur
doit contenir
ses centres d'intérêts
son histoire, ses compétences
ses droits d'accès aux informations (clés)
Adaptation du contenu : pourquoi ?
À l'utilisateur
en fonction de sa localisation physique
en fonction de son profil
À l'environnement
au bureau, connecté par réseau très haut débit ?
dans la rue, connecté par un bas débit (téléphone portable + PDA ?)
Adaptation du contenu : comment ?
modification des données originales
dégradation de la qualité des images, de la vidéo, du son
cacher des informations confidentielles si les droits d'accès ne sont pas suffisants (accès à une partie d'un dossier médical)
sélection d'un ensemble de données pertinentes
mise en correspondance d’un profil utilisateur et des profils des informations
Communautés virtuelles d'utilisateurs
Partagent un ensemble de centre d'intérêts
Connaissance de chacun augmentée par la connaissance des autres
Pourquoi ?
Entraide, annotations de documents
Amélioration de la disponibilité des données. Les informations les plus intéressantes pour la communauté sont connues : on peut gérer au mieux les données associées
L’indexation
indexation du texte…
… mais aussi indexation des images suivant leur contenu
donc nécessité d’outils de description de contenu multimédia
exemples :
décrire où se trouve une tumeur cancéreuse sur une image et son évolution
décrire le contenu d’une page Web
Gestion distribuée des données à large échelle
architecture distribuée… et collaborative
notion de proxies hiérarchiques qui interfacent le système d'accès aux données et les sources de données
leur rôle :
assurer un accès transparent, quelque soit la localisation physique réel des données
indexer les données présentes dans le système pour faciliter la recherche d'information
assurer une sécurité des données
cacher les données et les requêtes utilisateurs
La gestion de caches
nécessité d'avoir des mécanismes de caches
cache de données et cache de requêtes
les contenus riches possèdent une sémantique forte : exploitation de cette sémantique
les utilisateurs ne sont en général pas autistes : exploitation des communautés d'utilisateurs pour rapprocher les documents des utilisateurs finaux ou les garder en mémoire
collaboration entre caches !
Mécanismes de sécurité…
… des données échangées ...
… pour préserver le caractère privé de ces données
par la gestion de :
organisation virtuelle : différent des communautés virtuelles, notion de confiance
rôles
tickets d'accès
Applications à grande échelle...
Web Sémantique :
donner une vue pertinente du Web pour les utilisateurs (communautés),
gestion de caches Web par le contenu des pages
Grid Computing : des millions d'ordinateurs reliés qui partagent des ressources (G.R.I.D.)
Pervasive Information Systems : où que l'on soit, on accède à la bonne information, au bon moment !
De la nécessité de nouveaux standards
ancien modèle de l'architecture réseau : la couche 7 est la couche application
dans le Grid : ça ne suffit plus !
cette couche 7 doit faire beaucoup de choses :
accès aux ressources, distribution et ordonnancement de tâches, sécurisation distribuée, monitoring, …
nécessité d'avoir un modèle économique pour le Grid
Web Services et Grid
e-Commerce : accès à des services à travers le web, et génération de revenus (Application Service Providers)
des standards se développent pour étendre les fonctionnalités de la couche 7 !
convergence d'intérêts, convergence de moyens : OGSA !