Les outils d'analyse et de mesure d'audience Web
Optimiser les contenus rédactionnels de son site, faciliter et pérenniser la vente de son espace publicitaire ou encore définir des partenariats d'affiliation performants : autant d'objectifs qui peuvent être atteints grâce à la mesure et à l'analyse de l'audience des sites Web.
Une palette d'outils existe aujourd'hui afin de répondre à ces diverses problématiques de dénombrement et de qualification de l'audience. Selon la terminologie du CESP (Centre d'étude des supports de Publicité), on distingue les mesures "site centric" des mesures "user centric". Les premières comptabilisent le trafic depuis les sites en terme de volumes échangés (demandes qui arrivent au site et les pages qui en partent), soit un rôle essentiellement porté sur la fréquentation du site. Tandis que la seconde catégorie porte sur l'identification des comportements des internautes ; elle se fonde principalement sur les enquêtes qualitatives et les panels (Net Value, MMXI…). Ce dossier ne prend pas en compte ces serveurs de publicité (ad servers) qui gèrent plus particulièrement l'audience publicitaire (gestion des campagnes publicitaires, des expositions publicitaires…) du type DART du prestataire Double Click. Nous ne présenterons ici que les outils de mesure de trafic. Ceux-ci évoluent vers des fonctionnalités plus étendues, en particulier vers la qualification de l'audience grâce à des méthodes analogues à celle des serveurs de publicité (conservation de l'information qualifiante sur des populations ayant accepté de se faire connaître).
Sur un marché hétérogène, on distingue des éditeurs venus d'horizons divers aux techniques différenciées. Parmi les ténors de l'industrie, on trouve ERS (Enterprise Reporting Server) de l'éditeur WebTrends qui travaille à partir des fichiers de connexion Log. Une technique éprouvée qui permet un comptage relativement fiable. Plus exhaustifs, les outils de mesure basés sur le marquage des pages tels que Weborama ou Webandstats. Le webmaster doit positionner une marque (un tag) sur toutes les pages dont il veut mesurer l'audience afin de pallier le manque d'exhaustivité des logs (même si la page provient d'un serveur proxy, le marqueur déclenche une connexion vers un serveur de comptage).
Plus rares, certaines solutions offrent la possibilité d'analyser le trafic directement sur le réseau TCP/IP (voir Aria de Macromedia). Avantage : l'analyse en temps réel. A noter la très récente version Webtrends Live qui comporte désormais une solution temps réel.
Enfin, les outils mis au point par les éditeurs spécialistes du décisionnel tels qu'Hyperion avec Web Analysis Suite (dont le moteur OLAP a récemment été intégré à Webtrends Live) ou encore SAS Institute et son offre e-intelligence. Ces derniers offrent des possibilités d'analyse élaborées : du croisement d'information jusqu'à la prédiction du comportement des internautes…
Enfin signalons que les outils "user centric" constituent des outils complémentaires fort appréciables pour connaître les profils et les comportements de l'audience d'un site. Les premiers permettent de comptabiliser sans intermédiaires toutes les provenances et les lieux de connexion tandis que les seconds affinent la connaissance de la perception et des attentes des visiteurs. Néanmoins enquêtes et panels restent encore l'apanage des sites les plus développés…
Mesure des connexions log : Webtrends
|
Issu de la famille des logiciels de traitement de fichiers à partir des connexions log, l'éditeur WebTrends détient environ 40% de part de marché du marché mondial (source IDC). Son offre se décline autour de plusieurs produits dont le produit le plus complet se nomme ERS (Enterprise Reporting Server). Distribuée en France par le revendeur Alpha Media, cette solution couvre un vaste spectre de fonctionnalités relatives au trafic sur le site et génère des rapports sous forme d'états quotidiens, hebdomadaires, mensuels, trimestriels, ou annuels.
Mode de fonctionnement
Les logiciels de la gamme Web Trends vont rechercher dans les journaux de connexion du serveur (Apache, I-planet : Netscape, IIS, etc.), les fichiers log (ou fichier de trace) qui correspondent à une synthèse des requêtes effectuées auprès du serveur. Ils sont alors capables de les lire, les analyser et les lister dans des états pré-définis par les utilisateurs. Le volume de données ainsi recueillies s'avère considérable et donc difficilement exploitable. Il est nécessaire de déterminer des filtres qui permettent de sélectionner les informations pertinentes parmi l'information brute contenues dans les fichiers log (transfert de fichier, trace de toutes les erreurs survenues, etc.). "Ainsi il semble utile de retirer du comptage les connexions des salariés du site ou extraire les frames qui faussent les résultats émis ", recommande Jean-Philippe Resca, ingénieur technico-commercial chez Alpha Media. "Cette configuration doit être réalisée par un technicien disposant d'un minimum de connaissance dans le maniement des fichiers log", précise-t-il. Les paramétrages ainsi opérés permettent de connaître avec précision les statistiques d'un groupe de pages en particulier (en définissant leurs URL) ou de reconstituer le cheminement d'internautes grâce à un filtrage par adresse IP ou par cookie. Les données filtrées seront compilées pour pouvoir être mises en forme en graphique ou en page HTML (suivi de sessions utilisateurs sous forme de tableaux ou de diagrammes). Les indicateurs pricipaux ainsi analysés portent sur le nombre de pages vues, le nombre de hits, de pages vues, des ressources les plus populaires…
Une percée vers le marketing visiteurs
L'éditeur a récemment complété sa gamme d'un nouvel outil destiné à gérer la relation avec le visiteur: Visitor Relationship Management (VRM). Il s'agit d'une plate-forme capable d'analyser les visites grâce à la copie sur les pages web d'un javascript qui surveille l'audience de pages entières ou d'éléments plus ciblés comme les publicités. Outre les rapports statistiques générés (nombre total de visiteurs, de pages vues, etc.), le logiciel offre la possibilité de croiser ces informations avec des informations commerciales du type fréquence/montant des achats. Ainsi l'éditeur investit désormais 2 nouveaux terrains : les marqueurs et la dimension marketing grâce à l'intégration du moteur OLAP d'Hyperion. Les tarifs indicatifs de ces solutions sont respectivement : 15.000 francs pour ERS et une commercialisation en mode ASP pour WebTrend Live allant de quelques milliers à plus de 35.000 francs par mois. L'entreprise pourra accéder à plus ou moins de données sur le site Webtrendslive par connexion sécurisée SSL.
Quelques limites
Ce type d'outil (hormis la solution Webtrends Live) présente deux limites principales, inhérentes à son fonctionnement même. La première porte sur le manque d'exhaustivité des résultats obtenus car certaines requêtes (en général les plus fréquentes) peuvent être arrêtées en route, soit dans les serveurs proxy des fournisseurs d'accès ou des entreprises. Ces serveurs relais sont utilisés pour fluidifier les connexions mais peuvent conduire à des aberrations dans le comptage : ainsi plus une page est demandée, plus son audience est sous-estimée ! Les mémoires caches des postes clients posent le même type de problème en ne déclenchant aucune requête au niveau du serveur mais en récupérant les pages sur le disque dur de l'internaute. Par ailleurs comme le fait remarquer Françoise Renaud, directeur des études pour l'UDA (Union des Annonceurs), "la difficulté principale réside dans l'estimation du nombre de visiteurs uniques." Le critère de distinction entre visiteurs se fonde principalement sur l'adresse IP émise au serveur lors de la requête censée correspondre à un utilisateur précis. Néanmoins un même poste peut être utilisé par plusieurs utilisateurs. A l'inverse un même utilisateur peut diposer de deux adresses IP différentes (bureau, maison). Enfin, la configuration des systèmes de protection (les firewalls) des entreprises peut fausser les mesures en ne communiquant qu'une seule et unique adresse IP pour l'ensemble des connexions issues de la société. Dans cette approche, c'est seulement la machine connectée qui est reconnue et on a jamais l'assurance qu'il y a bien un utilisateur derrière la machine, ni qu'il est bien celui que l'on croit… [Alexandra Bissé]
Autres outils de cette catégorie
Net Audience de Cartel Informatique
|
Site Server de Microsoft
|
Marquage des pages : Weboscope
La deuxième génération d'outils de mesure des performances d'un site Web repose sur des fichiers log "améliorés". Ceux-ci prennent en compte l'intégralité des pages vues y compris celles interceptées par les proxies ou les caches. Un des outils représentatif de cette catégorie est le Weboscope de Weborama.
Mode de fonctionnement
L'astuce réside dans le positionnement sur les pages de marqueurs encore nommés tag. Il s'agit de javascript ou de marqueur image évidemment invisibles pour l'internaute. Lorsque la page est chargée sur l'ordinateur de l'utilisateur, le marqueur déclenche une connexion vers un serveur de comptage indépendant interne ou déporté chez un spécialiste. Pour que la page soit entièrement téléchargée, elle doit appeler le serveur pour exécuter le tag. Ce type d'outil peut être utile sur des sites très spécialisés et pointus qui génèrent un trafic moyen et où la perte de pages peut se révéler significative au regard du volume de pages totales. De même l'architecture du site est également à prendre en compte dans le choix de ce type d'outils. En effet les pages dynamiques d'un site ne sont pas interceptées par les serveurs proxies donc dans ce cas l'étude des fichiers log peut suffire.
Variations selon l'environnement d'utilisation
Le CESP (Centre d'étude des Supports de Publicité) qui a mené des tests en laboratoire sur cette catégorie de logiciels, a identifié un certain nombre de différences dans les résultats fournis.
"Ces divergences portent en particulier sur la nature du navigateur (Netscape ou Internet Explorer). Selon le type de navigateur utilisé, la façon d'appeler la page et d'afficher les différents éléments (images, textes, etc.), la faculté de reconnaître java ou non différent et occasionnent des variations significatives dans les statistiques", note Hélène Haering, directeur d'études Internet pour le CESP.
A noter également que ce type d'outil requiert un marquage préalable de l'ensemble des pages que l'on souhaite suivre, ce qui peut se révéler très contraignant. "L'objectif est de limiter le nombre de tag à poser", précise Olivier Rossinelli, ingénieur d'affaires chez Webandstats. "Un seul type de tag sur les pages statiques qu'il suffit de dupliquer et un tag pour les pages dynamiques qui sera exécuté automatiquement sur l'ensemble des pages aux templates identiques."
La solution Weboscope de Weborama
Dans cette catégorie, on trouve entre autres la solution Weboscope du prestataire Weborama utilisée par Compaq (voir témoignage), l'agence interactive 404 Found! ou encore L'Oréal Finance. Elle s'apparente à un service distant de mesure et d'analyse de trafic Internet. Aucun logiciel ne doit être installé sur les serveurs du propriétaire du site : l'intégralité des fonctions est gérée via une interface web (ajout et gestion des clients, visualisation des statistiques, etc.)
Le principe est donc l'insertion sur chacune des pages à auditer d'un marqueur invisible qui renvoie les informations vers le serveur Weborama (une image 1x1 pixel transparente). Un programme spécifique peut être délivré par la société pour automatiser le process de marquage.
Les visites sont comptées directement par le serveur Weborama sur lequel les statistiques sont consultables à tout moment,à l'exception des statistiques de la journée en cours, qui sont consultables à partir de minuit. Les rapports fournis par le Weboscope recensent l'ensemble des indicateurs utiles : nombre de pages affichées, de visites ou de visiteurs mais aussi la localisation en terme de fuseaux horaires ou la liste des principaux points d'entrée. Les statistiques sont présentées page par page mais aussi par regroupement de pages permettant de réaliser des analyses thématiques.
L'outil permet en outre d'obtenir un premier niveau de qualification de l'audience : âge, sexe et CSP. Cette analyse est basée sur les votes d'internautes issus d'environ 10.000 sites d'horizons très variés (musique, informatique, art, etc.) et fédérés sur le site weborama.fr. "Nous qualifions environ 1.000 à 1.500 internautes par jour", précise Rodolphe Rodriguesl, directeur général de Weborama.
A l'heure actuelle, une base de 150.000 internautes actifs sont stockés dans la base. Dès que l'un de ces internautes visualise une page, l'information est enregistrée grâce à un cookie et une consolidation est opérée entre les pages vues et le profil. Grâce à cette population qualifiée, le Weboscope permet de distinguer par exemple quels sont les thèmes préférés des femmes, des cadres ou des moins de 25 ans.
"Ces initiatives de qualification me semblent pleines d'avenir, même si ces pratiques doivent faire l'objet d'une grande prudence au regard de la déontologie quant aux données personnelles des internautes", estime Hélène Haering.
Tarifs de Weboscope
A titre indicatif, cette solution est facturée selon le principe d'un forfait annuel dépendant du nombre de pages vues : à partir de 8.000 fancs (HT) par an jusqu'à 1,.2 million de pages vues (60.000 francs (HT) entre 24 à 36 millions de pages vues). [Alexandra Bissé]
Autres outils de cette catégorie tag
e-stat d'Echo
|
Webandstats de Tableau de bord devenu désormais Audientia
(voir article)
|
Audientia : la mesure par les tags Javascript
La société Tableau de bord créée en novembre 97 fait figure de précurseur en matière de solution de mesure d'audience en ligne à partir de tags. D'un développement tous azimuts sur un certain nombre d'activités telles que le référencement ou l'e-mailing, la société souhaite désormais se concentrer sur son créneau d'expertise : la mesure d'audience . "Un créneau beaucoup plus porteur", estime Patrick Mangeol, directeur de l'ingénierie et des services chez Audientia. Ainsi la société après presque 3 ans d'existence vient d'être rachetée par Audientia qui n'existe donc que par cette première croissance externe.
La nouvelle entité est dirigée par Jean-Michel Lunati, ex directeur Apple Enterprise MEA. "La technologie de Tableau de Bord nous a particulièrement intéressée sur deux points principaux", explique Patrick Mangeol. Tout d'abord l'aptitude des marqueurs Javascript installés sur les sites des clients à capturer l'information sur le navigateur de l'internaute pour ensuite l'exporter sur la base de données SQL Server de la société. Les API de cette base autorisent la consultation par Internet en temps réel de ses informations (à la minute près), via un navigateur web. La société peut également héberger chez elle la base de données contenant ces données de navigation.
Par ailleurs le mode de représentation des données "plus synthétique" constitue un autre atout de la solution et a d'ailleurs fait l'objet d'un dépôt d'un brevet. Il est possible de définir une arborescence de pages (sous-sites thématiques) pour obtenir des informations particulières sur ces sous-ensembles. "Cette possibilité correspond tout à fait à l'idée que les utilisateurs des solutions de mesure d'audience sont de plus en plus les gens du business et non plus les webmasters uniquement", note Patrick Mangeol. L'idée est en fait de segmenter les informations selon les besoins de chaque profession.
Ainsi les webmasters pourront avoir besoin de connaître de quels plug-in dispose leur audience afin de développer des applications compatibles avec leurs équipements. Tandis qu'un responsable de rubrique souhaitera mesurer l'impact d'une promotion spéciale sur une page et le taux de transformation en acte de vente. La structuration du site en sous-ensembles peut s'effectuer par l'administrateur à travers une interface web où il indique quelles pages sont rattachées à quels sous-ensembles.
A noter également la possibilité de connaître le mot clé tapé par l'internaute pour aboutir sur le site de l'éditeur.
Les visiteurs uniques sont identifiés sur la base d'un cookie (seulement si le site éditeur l'accepte) couplé à l'adresse IP. Celle-ci est identifiée en prenant en compte des paramètres supplémentaires tels que le type de navigateur ou la taille de la fenêtre. Et ce en vue de pallier les problèmes d'adresses flottantes (attribution dynamique d'adresses par le FAI des particuliers).
Le prestataire ne tarifie pas ses services en fonction du volume de pages auditées ou du trafic mais selon un forfait fixe. Ainsi en vente directe, le logiciel est installé sur le serveur du client et peut auditer jusqu'à 10 sites pour 7000 francs par mois. En vente mutualisée (la solution est hébergée chez un ISP), le loyer est de 2.500 à 3.000 francs par mois pour une seule URL par client (commercialisé par Internext et Imaginet). Parmi la cinquantaine de clients de la société, on note Cegetel (la boutique) ou encore M6.
La nouvelle société prévoit d'apporter de franches améliorations à l'outil Webandstats. Ces dernières (qui seront annoncées en septembre) pourraient bien s'articuler autour du nouveau cheval de bataille de la société qui est "l'analyse de la circulation" donc une approche résolument tournée vers le comportement et le profiling dynamique des internautes.
[Alexandra Bissé, JD Net]
Les outils de mesure des éditeurs décisionnels
Fort de leur connaissance des bases de données et de l'exploitation fine des informations clients de l'entreprise, un grand nombre d'acteurs du décisionnel ont tour à tour pris le virage d'Internet. Ces derniers proposent une déclinaison de leur offre adaptée au Web sous la forme d'applications analytiques destinées à optimiser la compréhension marketing des visiteurs d'un site.
L'offre de SAS Institute
L'américain SAS Institute et sa solution e-intelligence décline en 4 briques son offre destinée à piloter l'activité du site. Parmi les indicateurs de performance évalués on trouve les indicateurs de trafic, de navigation, ou encore de rentabilité. Le dernier type d'indicateur fournit notamment le taux de conversion ou encore la perte d'acheteurs potentiels au cours du processus de commande. "Autour de cette brique de base nommée e-clic stream, une seconde composante e-discovery permet de valoriser les informations collectées (logiques d'achat, anticiper les comportements...)", indique Christine Lebras, responsable de l'offre e-intelligence pour SAS France. "Les données log constituent une première étape et permettent d'identifier des typologies de comportement de navigation. Si le site décide de mettre en place des formulaires en ligne, il enrichira alors sa base de données (e-warehouse) et pourra affiner les modèles comportementaux qu'il aura déterminés. "L'objectif de la démarche est de fournir une vision à 360° des visteurs du site et ce en proposant une intégration totale avec les données off line issues par exemple des bases de données Oracle, Sybase ou Informix. La société propose son propre outil de recherche des fichiers log même si l'offre est compatible avec les principales solutions du marché. Le format de stockage des données peut être multidimensionnel ou relationnel. Quant aux rapports, ils peuvent être délivrés sous une forme HTML (statique), CGI (semi-dynamique) ou java (dynamique). L'environnement technique peut être indifféremment Unix ou NT. "Notre vision de l'audience Web est qu'un comptage simpliste des pages vues ou du nombre de visiteurs est trop réducteur aujourd'hui. Il est nécessaire d'aller plus loin et de réellement valoriser les statistiques", explique Christine Le Bras. Tarif indicatif de la solution : 1,5 million de francs.
L'offre d'Hyperion
La suite modulaire d'Hyperion baptisée Web Site Analysis Suite comprend des composants d'analyse, de reporting (Site Analysis) et un moteur de règles (Sessionizer). Ces composants s'intègrent aux principaux serveurs Web du marché et aux systèmes traditionnels de back et de front office. Elle s'appuie de préférence sur la base de données multidimensionnelle Essbase, mais sans exclusivité. Pour produire des enregistrements précis et fiables des fichiers log, le système propose Sessionizer, un moteur qui se fonde sur des règles pour identifier et caractériser de manière fiable les visites issues des hits et des clics enregistrés sur le site Web. Sessionizer stocke les informations sous un format de base de données ouvert, accessible à des outils analytiques. Suivant la même philosophie que son concurrent SAS, le trafic mesuré n'est pas indépendant du reste de l'activité de l'entreprise : les informations de marketing en ligne ou de transactions e-business sont associées à des sources de données diverses telles que les ERP, les outils CRM et les entrepôts de données. Objectif : apporter une perspective plus pertinente et surtout plus globale. A noter le récent partenariat d'Hypérion avec WebTrends pour WebTrends Live.
L'offre de MicroStrategy
MicroStrategy propose au sein de sa suite d'e-CRM un module d'analyse Web (e-Web Analysis) qui permet d'éditer une trentaine de rapports pré-définis "sous une forme dynamique (activeX et java mais aussi HTML)", précise Thierry Duval en charge de la formation sur ce produit pour MicroStrategy. "Il est possible de naviguer dans le rapport et d'affiner sa requête en visualisant les données sous une autre forme avec d'autres attributs." Par exemple afficher le nombre de visites sur une localité particulière. L'éditeur ne propose pas de système de traçage des fichiers log. "L'outil a pour vocation d'extraire les données et de les représenter sous une forme particulière. Sa force réside dans sa capacité à traiter jusqu'à plusieurs dizaines de tera octets (millions de millions d'octets) de données. L'utilisation de cette brique présuppose l'installation d'une plate-forme modulaire comprenant entre autres "Intelligence Server", le maillon entre les différents outils et la base de données ainsi que Microstrategy Web, le moteur analytique. L'environnement technique doit être sous NT. Le coût de l'investissement est estimé à environ 150 000 dollars pour 50 utilisateurs (tarif bundle comprenant l'ensemble de la plate-forme produits, les modèles de données et l'audit de consulting). La solution française sera disponible cet été.
En conclusion...
De l'avis des spécialistes ces acteurs ont un avantage certain sur ce marché en apportant une plate-forme complète orientée d'abord sur la relation client. Néanmoins, certaines technologies comme l'analyse des fichiers log ne font pas partie de leur cœur de métier. En outre les solutions prêtes à l'emploi ne sont pas toujours de bonnes stratégies en la matière et il est souvent préconisé de se tourner vers des solutions personnalisées. [Alexandra Bissé]
Macromedia investit la mesure d'audience avec Aria
Le spécialiste de la création et du design Web, Macromédia (avec Flash ou Dreamweaver) se lance sur le marché de la mesure d'audience grâce à l'acquisition d'Andromedia en décembre dernier. "Cette nouvelle brique technologique permet à Macromedia d'être présent sur presque l'intégralité du cycle de vie Web à savoir la conception du contenu, l'affichage (Flash Player et Shockwave), l'analyse (Aria) et la personnalisation (Like Minds)", explique José Vasco, directeur France de Macromedia.
Ainsi la solution Aria Enterprise se présente comme un outil d'analyse haut de gamme destiné en priorité aux sites générant un fort trafic (aux Etats-Unis, les sites utilisateurs atteignent le million de connexions par jour).
Par ailleurs, les sites disposant d'une architecture complexe (de type distribuée et sites dynamiques) sont aussi des cibles privilégiées pour ce type de logiciel.
"En fait, Aria ne travaille pas sur les fichiers logs comme la plupart des outils concurrents mais s'intéresse aux informations issues des requêtes HTML en se greffant directement sur le réseau. Le module de sniffing de la solution lui permet de s'installer en toute transparence sur des architectures variées sans remise en cause de l'existant", explique Yann Sonnier, ingénieur avant-vente chez Matranet, (le revendeur exclusif de la solution jusqu'à présent). Un plug-in peut également être intégré au serveur Web afin d'exploiter les flux SSL. Le logiciel fournit alors des informations en temps réel via des rapports émis toutes les heures (les données sont issues de sa base de données objet propriétaire "ObjectStore").
La nouvelle version de la solution (version 5.0) est compatible avec la base de données Oracle. Dans ce cas, les rapports pourront être obtenus à la demande (via un composant fourni par Business Objects). La solution est bâtie selon une architecture modulaire. Le moniteur (le sniffer) se charge de l'écoute du réseau avec des fonctionnalités de filtrage pour optimiser les temps de traitement : sur les sites dynamiques il peut réunir par exemple en un seul objet les URL d'une fiche produit visionnée par plusieurs internautes (URL mapping). Les données collectées par le moniteur sont ensuite transmises au Recorder qui traite les informations afin de générer des rapports HTML, en synergie avec le troisième module nommé le Reporter.
L'autre point fort de la solution est sa capacité à créer des catégories. "Celles-ci peuvent être des catégories de visiteurs (selon une origine géographique) ou bien une catégorie de contenu telle qu'une offre spéciale ou une promotion. Ces catégories permettent de regrouper des sessions de visites selon un thème donné et obtenir ainsi des statistiques très fines en terme de navigation.
La solution qui travaille sur des plate-formes à forte puissance de calcul telle que Solaris (Enterprise 250) a un coût d'entrée de l'ordre de 500.000 francs. "Nous pensons trouver un marché en France pour ce type de solution haute gamme", estime José Vasco. "En particulier depuis le développement d'un module de dialogue spécifique entre Aria et la solution Broadvision qui ouvre ainsi un large spectre de sites potentiellement clients." A noter qu'Aria s'interface également nativement avec le logiciel de publication Dreamweaver (les objets Aria peuvent être intégrés automatiquement dans les pages Dreamweaver). En France, le cyber-marché Houra utilise Aria.
Audientia : la mesure par les tags Javascript
La société Tableau de bord créée en novembre 97 fait figure de précurseur en matière de solution de mesure d'audience en ligne à partir de tags. D'un développement tous azimuts sur un certain nombre d'activités telles que le référencement ou l'e-mailing, la société souhaite désormais se concentrer sur son créneau d'expertise : la mesure d'audience . "Un créneau beaucoup plus porteur", estime Patrick Mangeol, directeur de l'ingénierie et des services chez Audientia. Ainsi la société après presque 3 ans d'existence vient d'être rachetée par Audientia qui n'existe donc que par cette première croissance externe.
La nouvelle entité est dirigée par Jean-Michel Lunati, ex directeur Apple Enterprise MEA. "La technologie de Tableau de Bord nous a particulièrement intéressée sur deux points principaux", explique Patrick Mangeol. Tout d'abord l'aptitude des marqueurs Javascript installés sur les sites des clients à capturer l'information sur le navigateur de l'internaute pour ensuite l'exporter sur la base de données SQL Server de la société. Les API de cette base autorisent la consultation par Internet en temps réel de ses informations (à la minute près), via un navigateur web. La société peut également héberger chez elle la base de données contenant ces données de navigation.
Par ailleurs le mode de représentation des données "plus synthétique" constitue un autre atout de la solution et a d'ailleurs fait l'objet d'un dépôt d'un brevet. Il est possible de définir une arborescence de pages (sous-sites thématiques) pour obtenir des informations particulières sur ces sous-ensembles. "Cette possibilité correspond tout à fait à l'idée que les utilisateurs des solutions de mesure d'audience sont de plus en plus les gens du business et non plus les webmasters uniquement", note Patrick Mangeol. L'idée est en fait de segmenter les informations selon les besoins de chaque profession.
Ainsi les webmasters pourront avoir besoin de connaître de quels plug-in dispose leur audience afin de développer des applications compatibles avec leurs équipements. Tandis qu'un responsable de rubrique souhaitera mesurer l'impact d'une promotion spéciale sur une page et le taux de transformation en acte de vente. La structuration du site en sous-ensembles peut s'effectuer par l'administrateur à travers une interface web où il indique quelles pages sont rattachées à quels sous-ensembles.
A noter également la possibilité de connaître le mot clé tapé par l'internaute pour aboutir sur le site de l'éditeur.
Les visiteurs uniques sont identifiés sur la base d'un cookie (seulement si le site éditeur l'accepte) couplé à l'adresse IP. Celle-ci est identifiée en prenant en compte des paramètres supplémentaires tels que le type de navigateur ou la taille de la fenêtre. Et ce en vue de pallier les problèmes d'adresses flottantes (attribution dynamique d'adresses par le FAI des particuliers).
Le prestataire ne tarifie pas ses services en fonction du volume de pages auditées ou du trafic mais selon un forfait fixe. Ainsi en vente directe, le logiciel est installé sur le serveur du client et peut auditer jusqu'à 10 sites pour 7000 francs par mois. En vente mutualisée (la solution est hébergée chez un ISP), le loyer est de 2.500 à 3.000 francs par mois pour une seule URL par client (commercialisé par Internext et Imaginet). Parmi la cinquantaine de clients de la société, on note Cegetel (la boutique) ou encore M6.
La nouvelle société prévoit d'apporter de franches améliorations à l'outil Webandstats. Ces dernières (qui seront annoncées en septembre) pourraient bien s'articuler autour du nouveau cheval de bataille de la société qui est "l'analyse de la circulation" donc une approche résolument tournée vers le comportement et le profiling dynamique des internautes.
[Alexandra Bissé, JD Net]
Profile For You évalue gratuitement le profil de vos visiteurs
La start-up franco-britannique Profile for You, lancée en juillet 99, innove en matière de mesure et d'analyse d'audience sur le Web. Ses outils "All Stats For You" permettent aux webmasters des sites personnels (pages perso) de suivre gratuitemement la navigation des internautes en fonction de paramètres quantitatifs, qualitatifs et de navigation. En échange de quoi, la société sera à même de constituer une base d'internautes qualifiés de façon très fine qui pourra être commercialisée auprès de sites d'e-commerce soucieux d'affiner leur marketing. Le principe de cet "échange de bons procédés" repose sur l'aspiration des sites personnels qui se seront inscrits à ce programme et qui seront analysés selon deux méthodes : l'analyse des mots-clé suivie d'une analyse sémantique et conceptuelle. Cette dernière permettra, grâce à des bases de connaissance constituées par la société, de fournir une vision globale du profil du site ainsi aspiré.
A partir de là les bases de connaissance seront à même de générer un profil type (scoring comportemental) associé aux visiteurs susceptibles de se rendre sur un tel site. Trois critères d'identification seront déterminés sur ce site : l'âge (selon des tranches d'âge identiques à celles utilisées par Médiamétrie ), le genre (si pertinent) , et les thématiques d'intérêt associées (24 thèmes préférentiels listés). Par exemple pour le site d'un club de foot local, on peut imaginer que les visiteurs sont constitués d'adhérents donc de jeunes garçons aimant le sport. Un cookie crypté est alors émis une fois le profil du visiteur calculé au moment où il passe sur le site personnel. Au fur et à mesure de son passage sur différents sites, le cookie du visiteur sera affiné en croisant les différentes informations issues des différents profils de sites visités. "Les sites personnels sont un terrain idéal de qualification d'audience, souligne Jean-Claude Jamet, directeur de l'antenne française de la société, conçus par des passionnés pour des passionnés : ils bénéficient d'une audience très ciblée." Même si les informations ainsi collectées ne sont pas nominatives, la société a travaillé en étroite collaboration avec la CNIL pour la mise en place d'un dispositif informant de la collecte d'informations et la validation des profils adéquats par l'internaute audité.
"Les webmasters qui acceptent notre mesure sur leur site se voient non seulement gratifier d'un bilan gratuit complet de leur site et de leur cible mais bénéficient également d'un programme de points bonus (Allstats-Tower) ouvrant droit à des cadeaux", précise-t-il . La société prévoit de recruter environ 50.000 sites perso pour débuter même si leur plate-forme technique (Apache, Linux et mySQL) est prévue pour aspirer des centaines de milliers de sites.
"A terme, l'idée est de proposer aux sociétés un scoring prédictif qui leur permettra de connaître, lorsqu'un internaute se connectera à leur site, sa propension à s'inscrire, à acheter, ou bien à s'inscrire à une mailing list. Et ce grâce à l'identification des variables déterminantes dans son profil. Une personnalisation pourrait donc ainsi être opérée de façon simple (pop-up ou bandeau personnalisable qui apparaît selon la prédiction opérée). La prestation serait facturée selon le niveau de service rendu pour environ 10 francs pour 1000 internautes décodés."Nous prévoyons de pouvoir identifier entre 20 et 30% du trafic d'un site, ce qui est amplement suffisant pour un panorama représentatif", assure Jean-Claude Jamet. Le service sera commercialisé à partir de septembre. [Alexandra Bissé]
Compaq combine WebTrends et Weborama
La filiale française du constructeur informatique Compaq a opté pour une combinaison de deux outils de mesure et d'analyse d'audience : WebTrends et Weborama, pour suivre le site institutionnel Compaq.fr et ses extranets (revendeurs et grands comptes).
"Les deux outils sont complémentaires et nous permettent de répondre à des besoins différenciés", explique Olivier de Lavalette, directeur du Commerce électronique chez Compaq France. Weborama nous donne une vision macro de l'audience globale des différents sites en fédérant un certain nombre de pages du site.
En effet, Weborama à travers son outil Weboscope permet de grouper un certain nombre de pages du site. On peut ensuite en déduire par exemple qui vient voir les portables grand public ou la gamme PME. En un clin d'oeil, il est possible de visualiser pour l'ensemble des sites, toutes les visites et leurs origines. L'intérêt majeur réside dans la possibilité de fusionner les mesures sur plusieurs sites à la fois indépendants et distants : Houston, Paris, Munich.
"Weborama nous fournit une vision d'ensemble conviviale tandis que WebTrends affine les analyses sur les détails de la navigation."
Olivier de Lavalette
Compaq France
|
| Quant à WebTrends, il fournit une vision de détail, très élaborée, utile pour la finesse de ses analyses. Il permet à Compaq de piloter par exemple son agence de création dans le développement ou la reconfiguration de certaines pages et de mesurer la rentabilité de certains investissements.
Weborama fournit des rapports plus simples et plus conviviaux pour le personnel non informaticien. Il est également appréciable de pouvoir éditer des rapports historisés du trafic et suivre ainsi l'évolution sur plusieurs mois.
"Nous sommes satisfaits de l'équipe Weborama qui est à l'écoute de nos besoins. Ainsi l'outil évolue en permanence : on peut obtenir les statistiques d'une date de son choix à une autre ou recevoir le reporting en push. Les données qualifiées grâce aux cookies, sur certaines zones, peuvent être intéressantes mais non significatives en terme de volumes. La population qualifiée représente moins de 10% du trafic global", conclut Olivier de Lavalette. [Alexandra Bissé]
Chiffres clé du site Compaq.fr
Visiteurs
|
environ 40.000/semaine
|
Pages vues
|
1 million de pages/mois
|
Temps moyen
|
Entre 7 à 8 minutes
|
Cetelem : WebTrends pour la navigation mais pas pour le transactionnel
L'agence de crédit en ligne de Cetelem, gère depuis 1998 les demandes de crédit (prêt personnel, crédit auto, travaux...) d'une clientèle de particuliers via notamment des formulaires formatés et sécurisés. Depuis un an et demi, elle utilise WebTrends comme logiciel de suivi statistique. Il a notamment été retenu pour ses qualités de fiabilité et la finesse de ses statistiques. "WebTrends est un explorateur de données, il contient des milliers et des milliers de chiffres", estime Eric Le Berre, responsable front office du site Cetelem.fr. "Pour nous, il est essentiellement utile pour repérer les habitudes de navigation de nos clients. Par exemple d'où viennent les clients : quel mot clé ont-ils tapé ? Dans notre cas, les clients ont à 60% tapé directement le nom de notre enseigne, Cetelem, et non pas crédit comme on aurait pu le penser... Nous sommes également intéressés par les heures de connexion de notre cible qui sont essentiellement les heures ouvrables avec un pic le mercredi (les gens se connectent au bureau). Donc pas de demandes la nuit comme le laissaient entendre certains spécialistes du Web qui prédisaient la fin des horaires traditionnels en la matière.
"Les outils de mesure d'audience devraient évoler vers la mesure de la performance commerciale."
Eric Le Berre
Cetelem
|
| C'est ainsi que nous avons adapté nos heures d'ouverture à ces pratiques (une équipe d'une dizaine de commer-ciaux se relaient pour traiter les demandes des clients). Cette information nous permet de dimensionner efficacement nos effectifs pour plus de réactivité. Enfin le type de navigateur constitue également une information pertinente. On se rend compte que la plupart ne dispose pas d'un matériel de pointe ce qui nous limite dans les plug-in, java ou autre flash sur notre site qui ne seraient pas forcément lisibles par tous. En revanche nous ne prêtons aucun intérêt au nombre de pages vues. L'essentiel pour nous c'est le nombre de demandes de crédit effectivement réalisées puis concrétisées. Selon moi, les outils de mesure doivent évoluer vers la mesure d'audience de production, c'est-à-dire l'évaluation des transactions, le taux de transformation dans une approche commerciale pragmatique. Chez Cetelem, nous avons développé en interne avec nos équipes de programmeurs des applications spécifiques pour mesurer l'efficacité des demandes de crédit, le nombre de demandes de crédit classé par type de crédit, le CA réalisé chaque jour, l'analyse du taux de clic. Autant d'indicateurs fondamentaux au suivi de notre activité. Par ailleurs, nous souhaitions des applications intégrées à notre système d'information central IBM pour un système d'information multicanal et unifié ce qui n'est pas possible avec WebTrends."
Chiffres Clé du site Cetelem
Visiteurs uniques/jour
|
2000
|
Nombre de demandes de crédit/jour
|
350
|
Temps passé
|
environ 10 minutes
|
Après Hit-parade, @t Internet lance sa solution de mesure d'audience gratuite
Fort de son expérience en matière de mesure d'audience et de classement au travers du site hit-parade.com (qui audite désormais un peu plus de 50.000 sites francophones), la société @t Internet, créée il y a 4 ans lance sa nouvelle solution de mesure d'audience en ligne : Xiti. "Nous avons travaillé pendant près de 4 ans sur le développement de ce nouvel outil qui nous permettra de proposer à nos clients des fonctionnalités plus pointues que nous ne pouvions le faire avec hit-parade en matière de gestion d'audience", explique Alain Llorens, pdg de @t Internet.
Et ce dernier pèse bien chaque mot : "La gestion, car il s'agit réellement de proposer une solution qui va au delà de la mesure statistique et qui propose des données pertinentes pour l'administrateur du site" et "l'audience, à distinguer du trafic qui ne constitue pas une poupulation significative sur le site (seulement des passages puis zapping à la suite par exemple d'un clic sur un bandeau publicitaire)". Xiti veut donc aller au delà de la mesure quantitiative en fournissant des indicateurs permettant de comprendre le comportement des internautes.
Sur le même principe que Hit-Parade (qui regroupe notamment des sites comme Spray ou Wanadoo), les sites souhaitant bénéficier du service de Xiti devront mettre au préalable des tags sur leurs pages (intégration d'un logo javascript sur chaque page à copier-coller). De façon classique dans cette technique, la page appelée par un internaute déclenchera sur le serveur distant hébergé chez Xiti un log. A partir de ce stock de logs, la solution Xiti sera à même d'extraire et de calculer en croisant l'ensemble des données ainsi obtenues (heure de connexion, nom de la page, le référeur...), un ensemble d'indicateurs présentés sous forme de rapports en ligne au gestionnaire du site. Ce dernier viendra se connecter au site de Xiti muni de ses mots de passe.
"Nous avons déterminé un ensemble de critères d'intérêt en recensant en fait nos propres besoins (ndlr : @Internet est gestionnaire de plusieurs site dont un site de rencontre et un site de vente de vins) et ceux de nos clients", explique Gérald Bignonneau, directeur technique pour Xiti. Ainsi, le webmaster pourra distinguer le taux de visite à 1 page, c'est-à-dire en fait les visiteurs correspondant à du "simple trafic", comme défini plus haut. Mais aussi le nombre de pages vues par visite et ce en fonction du navigateur utilisé, des systèmes d'exploitation ou encore de leurs versions. "En effet, ces détails sont importants, nous avons ainsi pu détecter des différences importantes dans le nombres de pages vues selon le navigateur utilisé (9 pages vues avec Netscape contre 18 pages vues avec Internet Explorer).
Une remontée d'alerte de ce type nous a permis d'identifier que des techniques de développement telles que le dynamique HTML n'était pas exploité de la même façon par les navigateurs utilisés, de même la mise en page peut être affichée différemment sous Windows ou sous Mac et engendrer des déperditions d'audience", explique-t-il.
Parmi les critères d'intérêt, les rapports présentent également la durée moyenne de consultation par visiteur ou encore le nombre de pages vues par visite significative (soustrait des données relatives au trafic). En option, il est possible de repérer les erreurs 404 ou de déterminer pour les sites à vocation internationale, la part de chaque pays dans l'audience globale. "Nous sommes capables de déterminer précisément l'origine géographique d'une connexion et pas seulement à partir du nom de domaine qui peut conduire à des interprétations erronées. Nous nous basons sur un croisement de données (croisement de l'adresse IP avec l'appartenance de l'adresse IP au pays)." Plus tard (d'ici septembre), il sera possible pour le gestionnaire de plusieurs sites de disposer d'un bilan succint unique de l'ensemble des caractéristiques de ses audiences.
L'ensemble du service sera proposé gratuitement aux sociétés acceptant de placer sur chaque page un tag apparent représentant le logo de la société. Et par ailleurs, ils devront être des sites à petite audience (jusqu'à 2 millions de pages vues par mois). Pour, les sites ne souhaitant pas faire apparaître ce logo, le service sera payant à raison de 300 francs HT par mois pour les petits sites.Tandis que pour les sites générant plus de 2 millions de pages vues par mois, le service sera facturé 1.250 francs HT par mois.
La société table sur environ 10.000 inscrits d'ici la fin de l'année incluant 3.000 à 4.000 payants. Les hébergeurs de sites et les web agencies constituent des cibles prioritaires. "Depuis le lancement du service (le 22/05), nous enregistrons 1.000 nouveaux inscrits chaque jour !", s'étonne presque Alain Llorens.
La société s'intéresse de très près aux solutions de datamining et prépare en association avec l'éditeur SPSS deux nouvelles solutions d'analyse comportemantale (sortie prévue avant la fin de l'année). Une levée prochaine de l'ordre de 30 millions de francs financerait ces projets. [Alexandra Bissé
Principaux outils de mesure d'audience Web
Les atouts
|
Les outils log
|
Les outils tag
|
Les outils
décisionnels
|
Types de logiciels
|
ERS de Webtrends, Net Audience de Cartel Informatique
Site Server de Microsoft
|
Weboscope de Weborama,
e-stat d'Echo, Webandstats de Tableau de bord
|
e-intelligence de SAS Institute, Web Site Analysis Suite de Hyperion et e-Web Analysis de MicroStrategy
|
Tarifs indicatifs
|
Environ 15.000F
|
Abonnement annuel à partir de 8.000F/an
en fonction du nombre de pages à auditer
|
De 300.000F au million de F
|
Atout 1
|
Mise en oeuvre rapide, "indolore"
|
Mesure exhaustive (pas d'effet cache)
|
Vision à 360° de la relation client
|
Atout 2
|
Prise en compte de tous les accès (bureau, domicile...)
|
Serveur distant chez un tiers évite la maintenance et les mises à jour
|
Expertise marketing forte, puissance analytique sur de fortes volumétries de données
|
Atout 3
|
Comptage relativement fiable et robuste (sans biais)
|
Meilleure crédibilité des statistiques auprès d'annonceurs et indépendance si on change de serveur ou d'hébergeur
|
Possibilité d'intégration avec les systèmes back-office et front office pré-existants
|
Atout 4
|
De nombreux outils de reporting sont disponibles.
|
Emergence des données qualifiantes sur l'audience croisée aux statistiques de trafic
|
|
Les limites
|
Les outils log
|
Les outils tag
|
Les outils
décisionnels
|
Limite 1
|
Problème d'exhaustivité (requêtes les plus fréquentes interceptées par les proxies ou les caches des navigateurs
|
Contrainte technique relative à la mise en place des tags
|
Offre pré-packagée parfois inadaptée aux besoins d'un site et de son activité
|
Limite 2
|
Difficulté à estimer le nombre de visiteurs uniques
|
Attention aux données non pertinentes (connexion robots de recherche ou salariés du site)
|
Un coût parfois prohibitif
|
Limite 3
|
Pas d'indication sur le profil du visiteur
|
Différence de mesure selon les navigateurs utilisés par les internautes
|
Manque de performance en ce qui concerne les traitements des fichiers log
|
Limite 4
|
Difficulté à mesurer la pages réellement vue (en entier) ni même affichée
|
Propriété des données et des statistiques hébergées chez le tiers.Rester vigilant
|
|
Dostları ilə paylaş: |