Ministère de lEconomie, des Finances et de lIndustrie


Des outils pour trouver l'information pertinente



Yüklə 4,72 Mb.
səhifə55/1176
tarix02.01.2022
ölçüsü4,72 Mb.
#19817
1   ...   51   52   53   54   55   56   57   58   ...   1176

1.2.1.3Des outils pour trouver l'information pertinente

1.2.1.3.1Internet représente aujourd'hui la nouvelle encyclopédie universelle

"notre civilisation a produit plus d'informations en 30 ans que pendant les 5000 années précédentes. Et le phénomène va se reproduire dans les 3 années à venir" Jacques Péping, les Echos Janvier 2001

Selon une étude de l'université de Berkeley les documents imprimés ne représenteraient plus que 0,003% du total des informations produites dans le monde

Les disques durs des ordinateurs comme les clés USB voient leur capacité doubler tous les ans, des entreprises comme EMC ou Network Appliance offrent un hébergement dans des "fermes de données" (data farms) pour les entreprises et la mise en réseau de milliers d'ordinateurs (data grids) permet d'offrir à bon compte des capacités de stockage considérables

Le simple stockage représente aujourd'hui près de 40% des budgets informatiques



Après le Kilooctet (Ko=mille octets), le Mégaoctet (Mo=million d'octets) et le Gigaoctet (Go=milliard d'octets) le Téraoctet (To=mille milliard d'octets), qui sont quasiment rentrés dans le vocabulaire courrant, il va falloir apprendre à utiliser le Pétaoctet (Po=million de milliard) d'octets, l'Exaoctet (Eo=milliard de milliard d'octets), le Zettaoctet (Zo=mille milliard de milliard d'octets) et le Yottaoctet (Yo=million de milliard de milliard d'octets). Ensuite il faudra inventer de nouveaux préfixes…. D'après l'université de Berkeley, tous les mots prononcés depuis le début de l'humanité représenteraient 5Eo www.sims.berkeley.edu/how-much-info

Devant un tel volume se pose tout de suite la question "comment trouver l'information pertinente?" sinon cette abondance ne serait qu'une nuisance


1.2.1.3.2Annuaires et moteurs de recherche : trouver une information parmi des milliards de documents. Le phénomène Google, l'émergence d'exalead

On estimait déjà en 2001 le nombre de documents publiées par les entreprises, les chercheurs, les institutions ou les particuliers à 1.300 milliards (ceci comprend en particulier toutes les bases de données) dont 2,5 Milliards accessibles par une recherche sur le Web et s'accroissent de 7 millions par jour

En 2005 c’est près de 10 milliards de pages qui sont référencées par le moteur de recherche le plus populaire : Google www.google.com

S'il est aisé de trouver un document dont vous connaissez l'adresse et, en suivant les "liens", de naviguer d'un document à l'autre à la recherche d'information, ce type de "navigation" au hasard sur le Web trouve rapidement ses limites:

Une des innovations majeures qui ont concouru au développement du Web sont les "Moteur de Recherche" et les annuaires

Ces outils puissants et conviviaux, permettent d'exploiter cette masse d'information considérable et il n'est pas exclu de trouver une aiguille dans une botte de foin parmi les millards de documents qu'ils analysent et indexent (par exemple des informations juridiques, technologiques, commerciales,…)

Les recherches se font



  • soit à partir de mots présents dans les pages (visibles ou non) ou de mots clefs signalés lors du référencement: ce sont les moteurs de recherche travaillant avec de gigantesques bases d'index (certains développent une forme d'intelligence artificielle, les moteurs sémantiques par exemple, et font des recherches sur des "concepts" en les recherchant dans de nombreuses langues). D'autres permettent également des recherches par "approximations successives" en vous guidant pour affiner votre quête comme Exalead

  • soit à partir de classements thématiques (ce sont des annuaires qui font appel à un classement manuel et donc à un jugement qualitatif) Annu@ire-bis www.annuaire-bis.com essaie d'en tenir une liste à jour

" The Internet Archive Wayback Machine "Il est possible grace http://web.archive.org/web de "remonter le temps" et de retrouver des pages qui ont été effacées, modifiées ou qui ont disparu

Des "métamoteurs" font travailler en parallèle plusieurs moteurs et font une synthèse des résultats

Des "portails" (comme Yahoo!) associent annuaire, moteur de recherche (ils sous-traitent souvent le moteur à des entreprises comme Inktomi, Overture, Exalead ou Google) et offrent de nombreux services


Yüklə 4,72 Mb.

Dostları ilə paylaş:
1   ...   51   52   53   54   55   56   57   58   ...   1176




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin