Bonsoir à tous,
Nous fouillons dans les entrailles de Wikipédia. En effet, un moteur de recherche est dors et déjà accessible sur les liens que la communauté Wikipédia à insérer afin de sourcer les articles.
C’est un peu une première pour nous en effet, nous sortons des sentiers battus de Wikipedia afin de proposer un moteur de recherche externe au contenu rédigé par la communauté.
Ce moteur de recherche permet de fiabiliser l’information que vous recherchez. En effet , en s’appuyant sur les sources de Wikipédia celà permet d’avoir des résultats qui permettent aux auteurs de rédiger les articles.
Celui - ci est accessible par l’intermediaire de l’affichage d’une page archivé en haut à gauche ou bien en cliquant là : moteur de recherche sur les sources Wikipedia Francophone.
Ce n’est qu’un premier jet nous améliorons dans les prochaines semaines celui-ci afin de le rendre beaucoup plus agréable qu’il ne l’est actuellement.
Cordialement
Martin Pascal
Bonjour,
Suite à la prise de décision de la communauté Wikipédia, un cache a été mis en place sur les sources qui sont listés dans Wikipédia.
Ce cache a pour objectif de sauvegarder une partie du travail de la communauté qui consiste à sourcer les articles de Wikipédia.
Cette sauvegarde permet de consulter les liens qui ont disparus ou les liens qui ont été modifiés.
Dorénavant toutes sources de Wikipedia est donc stocké, et son accessible grâce à un lien sur Wikipedia.

Cordialement
Martin Pascal
Bonjour,
Après un mois de vote la communauté c’est prononcé pour l’utilisation la plus visible d’un cache.
C’est à dire qu’à partir de maintenant plus aucun lien servant de source seront perdus, l’idée consiste à stocker une version au moment de la création du lien sur nos serveurs.
C’est une fonctionnalité qui je trouve va dans le bon sens lorsqu’on s’inscrit dans un travail de qualité. Il faut savoir que près de 78000 liens soit 6% sont dit en erreur 404 grosso modo que le contenu de la source a disparu.
A celà il faut ajouter les liens des sites qui ont été mis en “parking” que l’on peut assimiler à un système de jachère en attendant d’être revendu.
La prochaine étape consiste donc à récupérer le contenu qui a actuellement disparu sur des sites spécialisés comme archive.org afin de diminuer le taux de perte, mais certains documents seront de toute façon irrécupérables.
Après ces quelques correctifs ce système pourra passer en production.
Cordialement
Martin Pascal
Nous allons dans les prochains jours lancé un robot d’indexation sur les liens externes de Wikipedia, à ce titre là nous pourrions fournir à la communauté des retours automatiques concernant l’état du lien , la pertinence du lien , la langue du lien.
L’état du lien correspond en fait au code renvoyé par Apache , en fonction de ce code, soit le lien est valide soit il ne l’est pas. Ainsi, nous pourrons faire remonter à la communauté Wikipedienne les liens dits morts ou en redirections.
La pertinence du lien peut être assimilée à une recherche sélective dont nous faisons allusion dans le précédent post, c’est à dire que si le lien ne renvoie pas l’article de WP dont il est issue c’est qu’il y a un doute.
La langue peut être détecté au moment du crawl ainsi le fait d’étiqueter la langue d’un lien peut être un plus dans Wikipedia.
Si vous avez des améliorations concernant le travail à fournir, faites nous part.
Nous remontons actuellement les liens externes de wikipedia.
Cette version expérimentale nous permet de juger de la qualité des liens que sélectionne la communauté wikipedienne.
Pour l’heure nous ne faisons aucun traitement sur ces liens , il suffit qu’il soit présent pour être affiché. Comme c’est une évolution cette dernière sera totalement prise en compte une fois que notre base de données sera mise à jour. C’est à dire une fois que les articles ont été modifiés.
Nous ferons les traitements afin de remédier au problème de langues dès demain.
De là nous pourrons certainement produire quelque chose d’original du moins nous l’espèrons.