Wikipedia & Linterweb

21 avril 2015

Les archives Wikiwix des liens externes reviennent !

Filed under: liens externes de wikipedia — Matthieu @ 15:08

Interrompu depuis quelque temps déjà, le service d’archivage automatique des liens externes de Wikipedia placés dans les notes de bas de page, à la semblance du beau phœnix, renaît de ses cendres !

 

Comme vous le savez, depuis plusieurs années, suite à cette prise de décision : Wikipédia:Prise_de_décision/Système_de_cache, nous (enfin, Linterweb, quoi ! ) archivons  les liens externes apparaissant dans les notes de bas de page des articles de Wikipédia. Ceci afin que ces pages extérieures à Wikipédia restent accessibles telles qu’elles étaient lors de leur insertion dans l’article, même en cas de modification ultérieure ou de suppression de la page externe.

 

Mit roten Kreisen eingekreist, von Linterweb archivierte externe Weblinks

Mit roten Kreisen eingekreist, von Linterweb archivierte externe Weblinks

 

Par exemple, prenons l’article sur la commune de Faux, en Dordogne. Dans la section Liens externes, vous voyez un lien vers la page de Faux sur le site de l’Institut géographique national. Malheureusement, cette page n’est plus accessible : le lien http://www.ign.fr/affiche_rubrique.asp?rbr_id=1087%26CommuneId=25179 mène vers une belle Erreur 404 : la page n’a pu être trouvée… 🙁

IGN Faux page manquante

 

 

Pour remédier à ce problème, Linterweb sauvegarde sur ses serveurs ce genre de liens externes. Pour notre exemple, la page manquante de l’IGN peut ainsi être retrouvée sur nos serveurs : http://archive.wikiwix.com/cache/?url=http://www.ign.fr/affiche_rubrique.asp?rbr_id=1087%26CommuneId=25179.

 

IGN Faux Cache Wikiwix

 

La page est telle qu’elle était lorsqu’elle a été archivée. La page est manquante sur les serveurs de l’IGN mais toujours consultable sur les nôtres.

 

Depuis quelques semaines, les disques durs dédiés à l’archivage des pages étaient arrivés à saturation, et nous avions été obligés d’interrompre le service. De 2,7 teraoctets, leur capacité a été augmentée à 11 teraoctets, ce qui devrait nous permettre d’être désormais tranquilles pour plusieurs années.

 

Nous remettons donc en route le service d’archivage automatique. Mais armez-vous de patience : il faudra au minimum plusieurs semaines avant que le service soit à nouveau pleinement opérationnel.

 

Les liens externes non archivés pendant l’interruption de service seront récupérés à partir des fichiers de sauvegarde de Wikipédia, afin qu’aucune page ne soit perdue.

 

Ce projet est intégralement financé par Linterweb, une société néo bretonne de trois salariés, et intégralement hébergé en Haute-Normandie, au Crihan.

 

Ce service nous paraît vraiment extrêmement utile : dans les articles, beaucoup de références comportent un ou plusieurs liens externes, qui permettent de sourcer, de vérifier, les affirmations énoncées dans l’article. Cette exigence de sourçage est un point clé de la crédibilité des articles. Maintenant, il suffit que la page externe servant de source soit modifiée ou supprimée, et la vérification est rendue de fait beaucoup moins évidente, voire impossible, pouvant alors remettre en cause toute la crédibilité de l’article, surtout si surviennent des conflits entre utilisateurs à propos de la véracité d’une affirmation donnée. Pour éviter la perte de cette information que constituent les liens externes, pour s’assurer que la crédibilité de l’article demeurera dans le temps, pour éviter nombre de conflits, le système d’archivage proposé par Linterweb est une nécessité.

 

Cette année nous avons prévu de passer quelques semaines à l’amélioration de ce service. Merci de nous faire part de vos suggestions d’améliorations ici : Utilisateur:Pmartin/Cache_v2.

 

En espérant que vous apprécierez l’utilité de ce service, cordialement 🙂 Matthieu.

 

Et je chantais cette romance

En 1903 sans savoir

Que mon amour à la semblance

Du beau Phénix s’il meurt un soir

Le matin voit sa renaissance.

Linterweb est une société d’informatique qui, depuis maintenant plusieurs années, développe un certain nombre de produits, dont la plupart sont liés de plus ou moins près à Wikipédia. Entre autres :

  • Wikiwix, un moteur de recherche sémantique qui restreint ses résultats aux articles des divers projets de la Fondation Wikimédia ;
  • Okawix, le navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web ;
  • un programme d’archivage des pages web externes à la Wikipédia (c’est-à-dire, les pages web qui ne font pas partie de Wikipédia, mais auxquelles mènent des liens placés dans les articles de la Wikipédia, dits liens externes), afin que ces pages web externes restent consultables, et que les liens externes ne donnent pas des liens brisés ; ce programme est utilisé, en particulier, pour tous les liens externes des projets Wikimédia francophones, ou encore sur les Wikipédias roumanophone et magyarophone ;
  • allingroups autoposteur Facebook, un service permettant de publier automatiquement des messages sur tout ou partie des groupes Facebook auxquels vous êtes abonné (auto-posteur Facebook) ;

Powered by WordPress