Wikipedia & Linterweb

15 décembre 2010

Wikiwix indexe les pages twittées

Filed under: twitter — Matthieu @ 11:21

Bonjour !

Wikiwix, le moteur de recherche sémantique développé par Linterweb qui restreignait jusqu’ici ses résultats aux articles des divers projets de la Fondation Wikimédia, complète désormais ses résultats avec l’indexation des pages web twittées.
L’idée est simple : quand un tweet contient un lien vers une page web, le contenu de cette page est indexé par Wikiwix, en temps réel, et la page apparaît immédiatement parmi les résultats de recherche. Wikiwix indexe ainsi en temps réel 150 nouvelles pages par seconde, qui correspondent aux 150 « Tweets avec liens » postés en moyenne chaque seconde sur Twitter.

Supposons par exemple que vous effectuiez une recherche sur le terme « Wikileaks ». Les deux résultats les plus récents (ou, pour être plus précis, les deux dernières pages auxquelles un tweet fait référence, et pertinentes par rapport au terme « Wikileaks ») sont listés antichronologiquement (les plus récents d’abord) en haut de la page de résultats, juste au-dessus des résultats de recherche classiques, sous la mention « Résultats dans le web récent ». Chaque résultat fournit les informations suivantes :

  • Titre : La première ligne de chaque résultat de recherche présente le titre de la page twittée, que vous pouvez ainsi ouvrir d’un clic.
  • Aperçu : Sous le titre se trouve une courte description de la page web, parfois un extrait de cette page web, qui vous permet de jauger facilement la pertinence de la page par rapport à votre recherche.
  • URL : En vert est affichée l’adresse Internet de la page.
  • Le temps écoulé, depuis que cette page a été twittée (écrit entre parenthèses). Contrairement à Google Actualités, qui indique le temps écoulé depuis l’indexation de la page (alors que la page en question peut en réalité avoir été indexée par Google seulement plusieurs heures après la publication de la page ! Ce qui, parfois, résulte en une indexation beaucoup moins rapide par Google que par Wikiwix 🙂 ).

Recherche Wikiwix pour le mot Wikileaks, vue classique

Recherche Wikiwix pour le mot Wikileaks, vue classique

Il suffit de cliquer sur le symbole Plus, en haut à droite de cette zone de résultats, pour afficher la liste complète (non plus seulement les deux derniers résultats) des pages twittées correspondant à la recherche effectuée, avec, fournies pour chaque résultat, les mêmes informations que celles listées juste ci-dessus (Titre, Aperçu, URL, Temps écoulé depuis le tweet) et, de surcroît, le tweet et un lien vers le tweet dans lequel la page a été twittée.

Recherche Wikiwix pour le mot Wikileaks, vue Résultats dans le web récent

Recherche Wikiwix pour le mot Wikileaks, vue Résultats dans le web récent

Wikiwix, depuis son lancement, indexait, pour un sujet donné, les articles de fonds issus de la Fondation Wikimédia. Wikiwix leur adjoint désormais les pages web issues de l’actualité la plus récente. Une belle complémentarité !
Cette nouvelle fonctionnalité est disponible en allemand, anglais, espagnol, français et néerlandais.

Cordialement 🙂 Matthieu.

Linterweb est une société d’informatique qui, depuis maintenant plusieurs années, développe un certain nombre de produits, dont la plupart sont liés de plus ou moins près à Wikipédia. Entre autres :

  • Wikiwix, un moteur de recherche sémantique qui restreint ses résultats aux articles des divers projets de la Fondation Wikimédia ; My Wikiwix, qui permet de disposer de son propre moteur de recherche personnalisable sur son propre site web ; wikiwix.mobi, une version mobile de Wikiwix ;
  • Okawix, le navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web ;
  • un DVD comprenant environ 2 000 articles de la Wikipédia anglophone ; une clef USB contenant la version 0.7 de la Wikipédia anglophone ;
  • un programme d’archivage des pages web externes à la Wikipédia (c’est-à-dire, les pages web qui ne font pas partie de Wikipédia, mais auxquelles mènent des liens placés dans les articles de la Wikipédia, dits liens externes), afin que ces pages web externes restent consultables, et que les liens externes ne donnent pas des liens brisés ; ce programme est automatiquement utilisé, en particulier, pour tous les liens externes de la Wikipédia francophone.

Cette note est également disponible en: Anglais, Allemand, Espagnol

Pas de commentaire »

No comments yet.

RSS feed for comments on this post. TrackBack URL

Leave a comment

Powered by WordPress