B.Premiers jalons
L’une des principales difficultés liées à l’usage d’Internet tient à un certain nombre de termes dont l’usage est devenu banal, mais dont la signification exacte est diversement maîtrisée.
Annuaires, moteurs de recherche et encyclopédies
La recherche sur Internet se fait par le biais de 2 outils à la fois distincts et complémentaires : les annuaires et moteurs de recherche.
Les annuaires
Un annuaire (ou index, ou guide, ou répertoire,) est un site qui classe de façon thématique les sites qu’il sélectionne. Des éditeurs analysent le contenu des sites et créent des résumés de ce contenu pour orienter leurs visiteurs. On peut comparer ces outils à une base de données de liens classés de façon hiérarchique (Institutions/Ministères/…). Ces annuaires sont souvent utilisés pour trouver un site spécifique traitant d'un thème donné.
Yahoo, Nomade ou Dmoz/Netscape Open directory sont des annuaires.
-
Comment les annuaires classent-ils leurs résultats ?
Il existe deux façons d’utiliser un annuaire :
-
en explorant l’arborescence,
-
en saisissant des mots clés.
En règle générale, selon les outils, les deux types de recherche sont souvent assez équitablement répartis entre les internautes adeptes de l’une ou l’autre des façons, avec une tendance actuelle plus forte cependant pour la recherche par mots clés.
-
Quels sont les principaux annuaires francophones ?
Yahoo.fr, Msn.fr,
-
Qu'est-ce qu’un annuaire collaboratif ?
Un annuaire collaboratif est un annuaire dont la sélection des sites est assurée par un ensemble d'éditeurs indépendants. Au contraire, dans le cas de Yahoo!, un annuaire classique, les éditeurs sont tous employés directement par la société Yahoo Inc. Dmoz / Netscape Open Directory est un annuaire de recherche collaboratif.
-
Quelle est la différence entre un annuaire et un moteur de recherche ?
Un annuaire référence des sites web alors qu'un moteur référence des pages web. Un annuaire classe des sites par catégories, est géré par des hommes et permet de réaliser des recherches généralistes. Un moteur utilise un robot qui visite l'ensemble du contenu réel du web et permet de réaliser une recherche très fine grâce à des mots-clés. Exemple : j'utilise un annuaire pour rechercher des sites sur l'automobile. J'utilise un moteur pour trouver rapidement une fiche technique sur une voiture de collection. Il est à noter que la plupart des annuaires sont couplés avec des moteurs de recherche
-
Le principe en est simple : le service indexe au préalable, c'est-à-dire stocke et traite sur ses propres disques durs, un certain nombre de pages web. Cette indexation s'effectue en texte intégral, tous les mots contenus dans toutes les pages référencées devenant alors des index potentiels de recherche. L'utilisateur saisit ensuite un ou plusieurs mots clés, reliés entre eux par des opérateurs ET ou OU. Le moteur va rechercher les occurrences de ces mots dans les pages sources et affiche ensuite celles qui lui semblent les plus pertinentes (selon un algorithme de classement qui lui est propre).
-
Comment les moteurs classent-ils leurs résultats ?
Mieux utiliser les outils de recherche, c'est également mieux comprendre comment ils fonctionnent. Et, notamment, comment ils classent les informations fournies lorsque vous recherchez une information en leur sein. Les moteurs de recherche, qui effectuent leurs investigations dans plusieurs centaines de millions de pages Web, prennent en compte de nombreux paramètres pour effectuer le calcul de pertinence.
Citons :
-
la présence du mot demandé dans le titre du document ;
-
sa présence dans le texte de la page, mais cela ne suffit pas : une page contenant le mot demandé en haut du document sera mieux "notée" qu'une autre le présentant en bas de page. De nombreux critères sur la façon dont le texte est affiché sont ainsi pris en compte, comme la proximité, la mise en exergue (gras, taille des caractères, etc.) ;
-
la présence du mot demandé dans certains champs qui n'apparaissent pas sur la page mais qui sont fournis aux outils de recherche. On appelle ces champs les "balises Meta" ;
-
sa présence dans l'adresse de la page (exemple : www.bidule.fr/dossier/france2.html ) ;
-
l'indice de popularité du document (le nombre de liens " pointant " vers cette page sur le Web).
Les critères de pertinence sont très nombreux pour les moteurs de recherche. Historiquement, ils se sont basés, pour classer leurs documents, sur des critères dits "in the page", c'est-à-dire contenus dans le document à classer : titre, texte visible, balises Meta, etc.
-
Quels sont les principaux moteurs de recherche francophones ?
Exalead (plus de 4 milliards de pages référencées en avril 2006) : http://www.exalead.fr/. Fonctions d'analyse des résultats étendues.
Google France : http://www.google.fr/
Voila (moteur de recherche développé par France Telecom) : http://www.voila.fr/
Lycos France (annuaire et moteur de recherche couplés) http://www.lycos.fr/
Hotbot France : http://www.hotbot.fr/ (réseau Lycos)
Altavista France : http://www.altavista.fr/
-
Quels sont les principaux moteurs de recherche anglophones ?
Google (plus de 8 milliards de pages référencées en avril 2006) : http://www.google.com/
Yahoo : http://www.yahoo.com/
Lycos : http://www.lycos.com/
HotBot : http://www.hotbot.com/ (réseau Lycos)
Altavista : http://www.altavista.com
Les encyclopédies en ligne
Plusieurs sources prestigieuses sont disponibles en ligne, et représentent des milliers de pages de connaissances. Point important : toutes les informations émanent d'un organisme reconnu et portent, le plus souvent, le sceau de la qualité, de la vérification et de la véracité. Pas si négligeable que cela sur l'Internet...
-
Encyclopédie Larousse en ligne
Là aussi, les chiffres sont vertigineux : 150 000 articles, 500 présentations, chronologie de 7000 événements, 900 extraits sonores, des possibilités de personnalisation, etc.
http://www.larousse.fr/
-
Encyclopaedia Universalis
On ne présente plus l'Encyclopaedia Universalis. L'outil est consultable sur un CD-rom, mais également sur le Web. La base de données n'est consultable que pour les abonnés. Le service contient l'ensemble du fond documentaire de l'encyclopédie, soit 50 millions de mots, 28 000 articles couvrant l'ensemble des domaines de la connaissance, signés par 4 000 auteurs prestigieux. Les articles sont illustrés par 8 000 dessins scientifiques et techniques et 5 000 images et photos, ainsi que 64 expériences scientifiques interactives. Signalons que pour certains mots, leur définition a été élaborée par des professeurs d’université : la bibliographie étant donc plus orientée pour un public universitaire ; elle constitue une bonne piste à explorer.
http://www.universalis-edu.com/
Encore quelques conseils :
On trouve sur le net une quantité immense d’informations : tout le monde peut créer son site et publier des informations sur tout. Aucun filtrage n’est effectué a priori… Le réseau Internet ne possède pas de système de contrôle de la qualité de l'information. Si vous ne voulez pas diminuer la valeur de vos travaux en utilisant des informations de mauvaise qualité ou en citant des informations douteuses, vous devez évaluer les sites Web que vous rencontrez. Attention donc : il faut IMPERATIVEMENT se poser un certain nombre de questions à chaque fois que vous pénétrez sur un site :
-
« Qui a créé le site ? Qui en est le rédacteur ? Quel est le « degré » d’autorité de la source ? » Encore une fois, tout le monde peut publier sur l'Internet. Il est donc important d'établir qui est « derrière » le site visité. L'information sera plus fiable si l’on découvre que l'auteur a une bonne réputation, s'il est crédible. Ou encore, s'il s'agit du site officiel d'un organisme bien connu dans le domaine. » Lisez donc avec attention les pages du type « Qui sommes-nous ? » et souvenez-vous qu’il vaut mieux, en cas de doute, renoncer à utiliser une information plutôt que de s’appuyer sur des sources non vérifiées.
-
« Quelle est la nature des informations que je peux trouver sur tel ou tel site ? » Il convient de se demander si l’on a à faire par exemple à des rapports officiels édités par des sites institutionnels, à des articles de presse, à des documents émanant d’organisations divers dont on devra alors connaître l’organigramme, les statuts et les modes de fonctionnement, ou encore à des débats alimentés par des réseaux qu’il s’agira alors d’identifier…
-
« Quel est le contenu exact du document ? » Le contenu est le principal critère car c'est tout de même parce qu'on est à la recherche d'informations qu'on visite une page Web. Il convient donc de se poser là encore de nombreuses questions : Est-ce que tous les aspects du sujet sont couverts et à quel niveau de détails ? Le site contient-il des travaux originaux en texte intégral ? Est-ce que l'information est vérifiable, est-ce que les sources sont citées, le document est-il disponible sous un autre format ? Est-ce que les informations sont corroborées par d'autres sources (électroniques ou imprimés) ? Le public visé est-il précisé ? Est-ce qu'on peut déceler un biais, un point de vue particulier? Pour quelles raisons le site a-t-il été créé (promouvoir une cause, vendre des produits, diffuser le savoir...) ? Si le sujet est controversé, mentionne-t-on un éventail d'opinions ? Les liens pointent-ils vers des sites extérieurs pertinents ? Est-ce que la qualité d'écriture est bonne (et la traduction correcte) ? Cette liste n’est pas exhaustive !
-
« A quelle fréquence le site est-il mis à jour ? » L'Internet est toujours en mouvement, des sites apparaissent et disparaissent. On le consulte souvent pour avoir de l'information récente. Ce sont des raisons pour lesquelles une date récente de mise à jour et un bon système de maintien du site sont à rechercher. Dans cette perspective, une fois encore, quelques questions préalables sont importantes : Est-ce que la date de création est présente sur la page? La date de la dernière mise à jour et la fréquence des mises à jour sont-elles indiquées? Est-ce que la date est précisée pour les différentes parties du site? Les liens proposés sont-ils toujours actifs?
Dostları ilə paylaş: |