1.2.1.3Des outils pour trouver l'information pertinente 1.2.1.3.1Internet représente aujourd'hui la nouvelle encyclopédie universelle
"notre civilisation a produit plus d'informations en 30 ans que pendant les 5000 années précédentes. Et le phénomène va se reproduire dans les 3 années à venir" Jacques Péping, les Echos Janvier 2001
Selon une étude de l'université de Berkeley les documents imprimés ne représenteraient plus que 0,003% du total des informations produites dans le monde
Les disques durs des ordinateurs comme les clés USB voient leur capacité doubler tous les ans, des entreprises comme EMC ou Network Appliance offrent un hébergement dans des "fermes de données" (data farms) pour les entreprises et la mise en réseau de milliers d'ordinateurs (data grids) permet d'offrir à bon compte des capacités de stockage considérables
Le simple stockage représente aujourd'hui près de 40% des budgets informatiques
Après le Kilooctet (Ko=mille octets), le Mégaoctet (Mo=million d'octets) et le Gigaoctet (Go=milliard d'octets) le Téraoctet (To=mille milliard d'octets), qui sont quasiment rentrés dans le vocabulaire courrant, il va falloir apprendre à utiliser le Pétaoctet (Po=million de milliard) d'octets, l'Exaoctet (Eo=milliard de milliard d'octets), le Zettaoctet (Zo=mille milliard de milliard d'octets) et le Yottaoctet (Yo=million de milliard de milliard d'octets). Ensuite il faudra inventer de nouveaux préfixes…. D'après l'université de Berkeley, tous les mots prononcés depuis le début de l'humanité représenteraient 5Eo www.sims.berkeley.edu/how-much-info
Devant un tel volume se pose tout de suite la question "comment trouver l'information pertinente?" sinon cette abondance ne serait qu'une nuisance
1.2.1.3.2Annuaires et moteurs de recherche : trouver une information parmi des milliards de documents. Le phénomène Google, l'émergence d'exalead
On estimait déjà en 2001 le nombre de documents publiées par les entreprises, les chercheurs, les institutions ou les particuliers à 1.300 milliards (ceci comprend en particulier toutes les bases de données) dont 2,5 Milliards accessibles par une recherche sur le Web et s'accroissent de 7 millions par jour
En 2005 c’est près de 10 milliards de pages qui sont référencées par le moteur de recherche le plus populaire : Google www.google.com
S'il est aisé de trouver un document dont vous connaissez l'adresse et, en suivant les "liens", de naviguer d'un document à l'autre à la recherche d'information, ce type de "navigation" au hasard sur le Web trouve rapidement ses limites:
Une des innovations majeures qui ont concouru au développement du Web sont les "Moteur de Recherche" et les annuaires
Ces outils puissants et conviviaux, permettent d'exploiter cette masse d'information considérable et il n'est pas exclu de trouver une aiguille dans une botte de foin parmi les millards de documents qu'ils analysent et indexent (par exemple des informations juridiques, technologiques, commerciales,…)
Les recherches se font
-
soit à partir de mots présents dans les pages (visibles ou non) ou de mots clefs signalés lors du référencement: ce sont les moteurs de recherche travaillant avec de gigantesques bases d'index (certains développent une forme d'intelligence artificielle, les moteurs sémantiques par exemple, et font des recherches sur des "concepts" en les recherchant dans de nombreuses langues). D'autres permettent également des recherches par "approximations successives" en vous guidant pour affiner votre quête comme Exalead
-
soit à partir de classements thématiques (ce sont des annuaires qui font appel à un classement manuel et donc à un jugement qualitatif) Annu@ire-bis www.annuaire-bis.com essaie d'en tenir une liste à jour
" The Internet Archive Wayback Machine "Il est possible grace http://web.archive.org/web de "remonter le temps" et de retrouver des pages qui ont été effacées, modifiées ou qui ont disparu
Des "métamoteurs" font travailler en parallèle plusieurs moteurs et font une synthèse des résultats
Des "portails" (comme Yahoo!) associent annuaire, moteur de recherche (ils sous-traitent souvent le moteur à des entreprises comme Inktomi, Overture, Exalead ou Google) et offrent de nombreux services
Dostları ilə paylaş: |