Pour aller plus loin... Histoire des moteurs de recherche

Historique des moteurs de recherche

A l'aide de ces paragraphes empruntés à ces 3 articles Wikipédia, répondre aux questions ci-dessous sur votre document LibreOffice joint.

À l'origine, Yahoo! est un annuaire Web, le Jerry and David's Guide to the World Wide Web to Yahoo! (« Guide de David et de Jerry pour le World Wide Web ») créé en janvier 1994 par Yang et Filo, deux étudiants en ingénierie informatique à l'université Stanford qui passent leur temps à surfer sur le Web naissant, possédant ainsi une collection de sites intéressants qu'ils ont de plus en plus de mal à répertorier. Dans le cadre de leurs études, ils décident alors d'utiliser les infrastructures de l'université pour répertorier et catégoriser les autres sites web à travers un annuaire organisé par thèmes dans une logique d'index comme dans les encyclopédies. Ils facilitent également la recherche des utilisateurs en créant un moteur de recherche qui permet de rechercher des sites par mots-clés.

Le rétroacronyme « Yet Another Hierarchical Officious Oracle » créé en avril 1994 est souvent cité comme signification, mais ses créateurs Jerry Yang et David Filo, qui devaient choisir un nom de projet commençant par un « Y » pour s'inscrire dans la nomenclature des projets informatiques de l'université Stanford, affirment avoir choisi le nom à cause des « Yahoos », nom donné aux humains dans le dernier des Voyages de Gulliver de Jonathan Swift. En moins d'un an, le trafic sur Yahoo est tel qu'il sature le réseau de l'université et les autorités universitaires leur demandent de quitter le campus. Yang et Filo fondent alors leur propre entreprise le 2 mars 1995 et acceptent la proposition de Marc Andreessen (co-fondateur de Netscape Communications à Mountain View, en Californie) d'héberger leur site sur les serveurs de Netscape.

AltaVista ou Alta Vista (littéralement « vue haute » en espagnol) était un moteur de recherche du World Wide Web. Il fut mis en ligne à l'adresse web altavista.digital.com en décembre 1995 et développé par des chercheurs de Digital Equipment Corporation. Il fut le plus important moteur de recherche textuelle utilisé avant son rachat.

Bien qu'il y ait une polémique concernant l'auteur de l'idée originale, on s'accorde à dire que les deux principaux contributeurs ont été Louis Monier, qui a écrit le Robot d'indexation, et Michael Burrows, qui a écrit l'indexeur.

AltaVista a été le premier moteur de recherche capable d'indexer rapidement une bonne partie des pages web existantes et devint immédiatement très populaire. Il fut également le premier moteur de recherche multilingue (la version française fut ouverte le 15 février 2000), ainsi qu'à lancer la recherche d'images, de fichiers audio et de vidéos. Le site offrait aussi un service internet gratuit au public.

AltaVista fonctionnait, en 1998, sur 20 serveurs multiprocesseurs 64 bits Digital Alpha. Au total ces machines étaient dotées de 130 gigaoctets de mémoire vive, de 500 gigaoctets d'espace de disque, et répondaient à 13 millions de requêtes par jour.

Les fondements de l'histoire de l'entreprise Google commencent par la rencontre de deux étudiants de l'université Stanford en 1995. Sergey Brin alors âgé de vingt-trois ans et Larry Page de vingt-quatre ans sont « pratiquement en désaccord sur tout ». Cela ne les empêche pourtant pas, en janvier 1996, de commencer à travailler sur un nouveau moteur de recherche.

Les fondateurs de Google, alors doctorants, observent la façon dont sont classés les résultats lorsqu'ils effectuent des recherches dans les bases de données scientifiques. Ils constatent que l'exploitation des informations contenues dans la structure hypertextuelle dépend de la nature des liens entre ces documents. Ainsi l'idée d'analyser les liens inter-documents reposait sur l'observation d'une caractéristique de la littérature scientifique et aux modes d'organisation du Sciences Citation Index (SCI), qui consiste à attribuer une valeur à une publication scientifique proportionnellement au nombre de publications qui la cite. Ce principe revient aux travaux de Jon Kleinberg qui avait mis au point pour IBM l'algorithme HITS (Hyperlink –Induced Topic Search) qui prenait en considération l'autorité d'une page en fonction du nombre de liens pointant vers elle. C'est donc en s'inspirant des travaux de Jon Kleinberg que les deux étudiants mettent au point l'algorithme de classement des pages web appelé Pagerank. Cet algorithme prend en considération les liens pointant vers une page comme un vote pour cette page. Plus une page recevrait de vote, plus elle serait considérée comme étant pertinente et plus le vote de cette page, lorsqu'elle pointerait elle-même vers d'autres pages, aurait de la valeur.

Ils nomment leur projet BackRub. Ils imaginent un logiciel qui analyserait les relations entre les sites web afin d'offrir des meilleurs résultats que ceux donnés par leurs concurrents de l'époque, AltaVista notamment.

Une fois leurs travaux terminés, les deux étudiants commencent à concrétiser leur projet de moteur de recherche et achètent à cet effet un téraoctet de disques durs d'occasion, afin de créer une base de données. Cette installation sommaire a pris place dans la chambre de Larry Page. Sergueï loue un bureau et se met en quête de financements. David Filo, fondateur de Yahoo!, convient de l'intérêt de leurs recherches, mais les encourage à créer leur propre moteur de recherche plutôt que vendre leurs travaux.

  • Question : Quels sont les 2 modèles de recherche d'information dans le Web qui sont apparus à la fin des années 90 ?

  • Question : Comment AltaVista puis Google ont-ils pu imposer leur moteur de recherche ?