Wikipedia & Linterweb

26 septembre 2017

Wikipedia et les sources

Filed under: liens externes de wikipedia — Pascal Martin @ 0:51

Bonsoir,

Imaginez un monde où les plus pauvres parmi les plus pauvres utilisent Wikipedia pour pouvoir apprendre.

Et si pour les plus pauvres parmis les plus pauvres, on avait la faculté de pouvoir réécrire l’histoire parce que la seule et dernière encyclopédie pouvait réinviter l’histoire fautes de sources.

J’espère que ma fille ne finira parmi pas les plus pauvres, ou que les générations futures ne connaîtront pas ce fait.

Pourtant actuellement c’est bel et bien ce qu’il est entrain de se passer :
https://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Le_Bistro/13_septembre_2017#Suppression_par_bot_d.27un_lien_non_bris.C3.A9_sur_articles_-_Help_en_anglais_SVP

Et j’avais déjà remonté certains bugs du robots d’IA concernant des sources qui existaient encore et le robot d’IA remplace par des liens vers son site internet.

Remplacer des liens sources de wikipedia doit absolument s’accompagner d’un certain nombre de réserve à minima que j’ai remonté , il s’agit d’une sauvegarde des sources qui permettent de vérifier les sources.

Faire tourner un robot qui changent les liens sources pour dire qu’ils sont en 404 alors qu’ils ne le sont pas, cela ne permet pas aux plus pauvres parmis les plus pauvres de vérifier les sources, qu’es ce qui va permettre de prouver que les sources ont existé au moment de l’écriture de l’article que les données étaient fiables.

Actuellement toutes les langues de wikipedia ont perdu des sources sauf le francophone où on réfléchi à une solution qui permet de sauvegarder l’ensemble des liens.

Est ce que c’est cela Wikipedia la dernière Encyclopédie, ou une Encyclopédie de façon Diderot qui va permettre une manipulation des sources ….
Cordialement,
Pascal Martin

22 février 2016

Wikiwix attend Facebook pour déployer ses technologies de moteur de recherches et d’archivages

Filed under: liens externes de wikipedia,wikiwix — Pascal Martin @ 18:17

Bonjour à tous,

Comme vous vous êtes aperçus ces deux dernières années de Recherche et Développement nous ont amené à travailler sur les contenus de Facebook.
Nous sommes donc en mesure de proposer un moteur de recherche spécifique sur les contenus de Facebook.

Il va de soi que le but n’étant pas de faire un moteur de recherche sur l’intégralité des contenus de Facebook, mais un moteur de recherche à l’échelle des moyens que possèdent Linterweb.

Après une dizaine de jours, nous attendons toujours l’autorisation de Facebook pour l’entrée nécessaire à nos robots dans le fichier robots.txt de Facebook.

En effet, il faut savoir que Facebook fait référence au moteur de recherche comme Google, Bing , en stipulant que : « le contenu public peut apparaître quand quelqu’un procède à une recherche sur Facebook ou un autre moteur de recherche », mais il est bien entendu nécessaire d’avoir l’aval de Facebook.

Normalement, il s’agit d’une simple formalité car Wikiwix est moteur de recherche, au même titre que ceux autoriser par Facebook dans le robots.txt, sur les contenus :
Wikipedia :
et sur toutes les catégories du Dmoz

La technologie que nous avons revisité est celle qui nous a primé au 1 Carrefour des possibles à savoir un moteur de recherche communautaire

et que nous avons expérimenté très tôt sur twitter.

Je ne préfère pas argumenter sur le rôle d’archiveur de datas que nous opérons sur les contenus sources de Wikipedia, car à l’heure actuelle Internet Archive est le seul à avoir le droit de pouvoir se déployer au regard du fichier robots.txt.

Sans cette autorisation officielle, nous ne pouvons pas valoriser notre recherche à venir dans le cadre du Crédit Impôt Innovation, car nous sommes propriétaires d’une solution qui commercialement ne peut pas être exploitée sans autorisation.

J’ai donc contacté Facebook France et ils m’ont renvoyé vers le centre d’aide communautaire afin d’avoir le soutien de la communauté Facebook pour avoir une réponse à mes questions :

Linterweb travaille sur ces deux technologies de puis une bonne dizaine d’années, la demande est donc légitime, car c’est indéniable Linterweb a une technologie de moteur de recherche, et d’archivage de datas au même titre que les grands noms du domaine.

« Lorsque vous publiez sur un forum ouvert sur Facebook (par exemple, sur des Pages, dans des groupes publics ou dans la section Forum communautaire des pages d’aide), les publications peuvent apparaître dans les résultats de moteurs de recherche tels que Yahoo et Google. »
extrait du centre d’aide de Facebook : https://www.facebook.com/help/186212491428940
« Lorsque vous publiez sur un forum ouvert sur Facebook (par exemple, sur des Pages, dans des groupes publics ou dans la section Forum communautaire des pages d’aide), les publications peuvent apparaître dans les résultats de moteurs de recherche tels que Yahoo et Google. »
extrait du centre d’aide de Facebook : https://www.facebook.com/help/186212491428940

Pascal Martin
Pour Linterweb
http://wikiwix.com

21 avril 2015

Les archives Wikiwix des liens externes reviennent !

Filed under: liens externes de wikipedia — Matthieu @ 15:08

Interrompu depuis quelque temps déjà, le service d’archivage automatique des liens externes de Wikipedia placés dans les notes de bas de page, à la semblance du beau phœnix, renaît de ses cendres !

 

Comme vous le savez, depuis plusieurs années, suite à cette prise de décision : Wikipédia:Prise_de_décision/Système_de_cache, nous (enfin, Linterweb, quoi ! ) archivons  les liens externes apparaissant dans les notes de bas de page des articles de Wikipédia. Ceci afin que ces pages extérieures à Wikipédia restent accessibles telles qu’elles étaient lors de leur insertion dans l’article, même en cas de modification ultérieure ou de suppression de la page externe.

 

Mit roten Kreisen eingekreist, von Linterweb archivierte externe Weblinks

Mit roten Kreisen eingekreist, von Linterweb archivierte externe Weblinks

 

Par exemple, prenons l’article sur la commune de Faux, en Dordogne. Dans la section Liens externes, vous voyez un lien vers la page de Faux sur le site de l’Institut géographique national. Malheureusement, cette page n’est plus accessible : le lien http://www.ign.fr/affiche_rubrique.asp?rbr_id=1087%26CommuneId=25179 mène vers une belle Erreur 404 : la page n’a pu être trouvée… 🙁

IGN Faux page manquante

 

 

Pour remédier à ce problème, Linterweb sauvegarde sur ses serveurs ce genre de liens externes. Pour notre exemple, la page manquante de l’IGN peut ainsi être retrouvée sur nos serveurs : http://archive.wikiwix.com/cache/?url=http://www.ign.fr/affiche_rubrique.asp?rbr_id=1087%26CommuneId=25179.

 

IGN Faux Cache Wikiwix

 

La page est telle qu’elle était lorsqu’elle a été archivée. La page est manquante sur les serveurs de l’IGN mais toujours consultable sur les nôtres.

 

Depuis quelques semaines, les disques durs dédiés à l’archivage des pages étaient arrivés à saturation, et nous avions été obligés d’interrompre le service. De 2,7 teraoctets, leur capacité a été augmentée à 11 teraoctets, ce qui devrait nous permettre d’être désormais tranquilles pour plusieurs années.

 

Nous remettons donc en route le service d’archivage automatique. Mais armez-vous de patience : il faudra au minimum plusieurs semaines avant que le service soit à nouveau pleinement opérationnel.

 

Les liens externes non archivés pendant l’interruption de service seront récupérés à partir des fichiers de sauvegarde de Wikipédia, afin qu’aucune page ne soit perdue.

 

Ce projet est intégralement financé par Linterweb, une société néo bretonne de trois salariés, et intégralement hébergé en Haute-Normandie, au Crihan.

 

Ce service nous paraît vraiment extrêmement utile : dans les articles, beaucoup de références comportent un ou plusieurs liens externes, qui permettent de sourcer, de vérifier, les affirmations énoncées dans l’article. Cette exigence de sourçage est un point clé de la crédibilité des articles. Maintenant, il suffit que la page externe servant de source soit modifiée ou supprimée, et la vérification est rendue de fait beaucoup moins évidente, voire impossible, pouvant alors remettre en cause toute la crédibilité de l’article, surtout si surviennent des conflits entre utilisateurs à propos de la véracité d’une affirmation donnée. Pour éviter la perte de cette information que constituent les liens externes, pour s’assurer que la crédibilité de l’article demeurera dans le temps, pour éviter nombre de conflits, le système d’archivage proposé par Linterweb est une nécessité.

 

Cette année nous avons prévu de passer quelques semaines à l’amélioration de ce service. Merci de nous faire part de vos suggestions d’améliorations ici : Utilisateur:Pmartin/Cache_v2.

 

En espérant que vous apprécierez l’utilité de ce service, cordialement 🙂 Matthieu.

 

Et je chantais cette romance

En 1903 sans savoir

Que mon amour à la semblance

Du beau Phénix s’il meurt un soir

Le matin voit sa renaissance.

Linterweb est une société d’informatique qui, depuis maintenant plusieurs années, développe un certain nombre de produits, dont la plupart sont liés de plus ou moins près à Wikipédia. Entre autres :

  • Wikiwix, un moteur de recherche sémantique qui restreint ses résultats aux articles des divers projets de la Fondation Wikimédia ;
  • Okawix, le navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web ;
  • un programme d’archivage des pages web externes à la Wikipédia (c’est-à-dire, les pages web qui ne font pas partie de Wikipédia, mais auxquelles mènent des liens placés dans les articles de la Wikipédia, dits liens externes), afin que ces pages web externes restent consultables, et que les liens externes ne donnent pas des liens brisés ; ce programme est utilisé, en particulier, pour tous les liens externes des projets Wikimédia francophones, ou encore sur les Wikipédias roumanophone et magyarophone ;
  • allingroups autoposteur Facebook, un service permettant de publier automatiquement des messages sur tout ou partie des groupes Facebook auxquels vous êtes abonné (auto-posteur Facebook) ;

8 juillet 2011

Linterweb chargé par la Wikipédia roumanophone de l’archivage des liens externes

Filed under: liens externes de wikipedia — Matthieu @ 16:26

Linterweb s »est vu confier l »archivage des liens externes apparaissant dans les articles de la Wikipédia roumanophone, afin que ces pages extérieures à la Wikipédia restent accessibles telles qu »elles étaient lors de leur insertion dans l »article, même en cas de modification ultérieure ou de suppression de la page externe. Ce service d »archivage des liens externes s »étend toujours plus largement : aujourd »hui, de plus en plus de projets utilisent ce service offert par Linterweb, que ce soient des projets frères de la Wikipédia (les versions francophones de Wikisource, du Wiktionnaire, de Wikiquote, de Wikilivres…) ou des Wikipédias en d »autres langues (comme la Wikipédia magyarophone (c »est-à-dire, en langue hongroise ;-)).
Nous espérons que l »utilisation de notre système d »archivage Wikiwix continuera de se répandre, car ce service nous paraît vraiment extrêmement utile : dans les articles, beaucoup de références comportent un ou plusieurs liens externes, qui permettent de sourcer, de vérifier, les affirmations énoncées dans l »article. Cette exigence de sourçage est un point clé de la crédibilité des articles. Maintenant, il suffit que la page externe servant de source soit modifiée ou supprimée, et la vérification est rendue de fait beaucoup moins évidente, voire impossible, pouvant alors remettre en cause toute la crédibilité de l »article, surtout si Biloxi fournit egalement craps. surviennent des conflits entre utilisateurs à propos de la véracité d »une affirmation donnée. Pour éviter cette perte d »information que constituent les liens externes, pour s »assurer que la crédibilité de l »article demeurera dans le temps, pour éviter nombre de conflits, le système d »archivage proposé par Linterweb est une nécessité.

Cordialement 🙂 Matthieu.

Linterweb est une société d’informatique qui, depuis maintenant plusieurs années, développe un certain nombre de produits, dont la plupart sont liés de plus ou moins près à Wikipédia. Entre autres :

  • Wikiwix, un moteur de recherche sémantique qui restreint ses résultats aux articles des divers projets de la Fondation Wikimédia ; My Wikiwix, qui permet de disposer de son propre moteur de recherche personnalisable sur son propre site web ; wikiwix.mobi, une version mobile de Wikiwix ;
  • Okawix, le navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web ;
  • un DVD comprenant environ 2 000 articles de la Wikipédia anglophone ; une clef USB contenant la version 0.7 de la Wikipédia anglophone ;
  • un programme d’archivage des pages web externes à la Wikipédia (c’est-à-dire, les pages web qui ne font pas partie de Wikipédia, mais auxquelles mènent des liens placés dans les articles de la Wikipédia, dits liens externes), afin que ces pages web externes restent consultables, et que les liens externes ne donnent pas des liens brisés ; ce programme est automatiquement utilisé, en particulier, pour tous les liens externes de la Wikipédia francophone.

Entourés en rouge, les liens externes archivés par Linterweb

3 février 2011

Archivage des liens externes : le problème a été traité

Filed under: liens externes de wikipedia — Matthieu @ 19:12

La semaine dernière, il y a eu un petit problème avec le système d’archivage des liens externes, service offert par Linterweb, et qui permet de sauvegarder des archives des liens externes utilisés comme sources dans les articles.
Ce qui s’est passé, c’est qu’une lectrice consultant l’article Wikipédia La_Quatrième Prophétie a cliqué sur l’archive du lien de la première note, obtenant donc la page telle que sauvegardée dans le système de cache de notre moteur de recherche Wikiwix. Jusqu’ici, rien d’extraordinaire, donc.

Au-dessus de l’affichage de la page archivée, nous affichons quelques propriétés de l’archive, comme l’URL de la page archivée, la date d’archivage, comment nous contacter, comment les webmasters peuvent empêcher notre bot d’indexer leur site… en outre, depuis quelque temps, nous affichions aussi les trois liens apparaissant en tête des Résultats dans le web récent, une fonctionnalité récemment ajoutée à notre moteur de recherche. Ces liens ne sont pas des liens publicitaires. Ce sont des liens récemment twittés sur Twitter, et que notre moteur de recherche estime liés d’une manière ou une autre à la page archivée.

http://www.cprw.com/wp-content/themes/gazette/best-writing-paper.html

En aucune manière un clic sur l’un de ces liens ne rapporte de revenus à Linterweb. Les liens sont simplement générés par l’algorithme de recherche spécial Twitter que nous avons mis en place. Ces liens, en général extrêmement récents, complètent et enrichissent les résultats de recherche retournés normalement par Wikiwix ou, dans le cas présent, la page archivée. Vous pouvez voir un exemple de cette fonctionnalité de recherche spécial Twitter en cliquant sur le lien http://wikiwix.com/index.php?disp=!twitter/fr/&action=Wikipedia. L’idée est de renvoyer à des contenus récents liés aux termes de recherches ou à la page archivée. Quoi qu’il en soit, qu’il soit bien clair que nous ne gagnons absolument rien avec ces liens. La fonctionnalité est juste destinée à enrichir le service de cache que nous fournissons à Wikipédia.

Or donc, pour en revenir à nos moutons, voici que le premier de ces Résultats dans le web récent a amené notre Wikipédienne sur un site dédié au football, site que notre algorithme a jugé, pour une raison ou pour une autre, lié à la page archivée, et sur lequel étaient affichées quelques publicités sexy.

Donc, jouant de malchance (Wikipédia -> archive Wikiwix -> lien twitté sémantiquement lié à l’archive -> site de football -> pubs sexy), notre Wikipédienne est arrivée sur une page au contenu peu en rapport avec Wikipédia, et sans aucun doute inapproprié.

Nous sommes bien sûr désolés. Nous nous sentons en outre d’autant plus concernés qu’en plus de notre collaboration avec la Wikipédia francophone sur le système d’archivage et le moteur de recherche, nous fournissons aussi des services de moteur de recherche à Vikidia, un projet inspiré de Wikipédia, destiné aux enfants de 8 à 13 ans !! :-S C’est dire l’attention que nous portons à ce genre de problème (rappelons cependant qu’il existe aussi des logiciels de contrôle parental permettant aux parents de filtrer, au moins dans une certaine mesure, les contenus auxquels peut accéder leur enfant ; voir le site internetsanscrainte.fr, site officiel du programme national français de sensibilisation aux enjeux et risques de l’Internet, en particulier cette page : http://www.internetsanscrainte.fr/s-informer/boite-outils-controle-parental ; voir aussi l’article de Wikipédia Contrôle parental).

Par conséquent, nous travaillons maintenant sur des améliorations de nos algorithmes, afin de pouvoir éviter que de telles pages puissent s’immiscer parmi les Résultats récents présentés par Wikiwix. Et en attendant, nous avons bien sûr désactivé la fonctionnalité en question.

Si vous avez des commentaires, ne manquez pas de nous les laisser sur notre blog.

Bien cordialement 🙂 Matthieu.

Linterweb est une société d’informatique qui, depuis maintenant plusieurs années, développe un certain nombre de produits, dont la plupart sont liés de plus ou moins près à Wikipédia. Entre autres :

  • Wikiwix, un moteur de recherche sémantique qui restreint ses résultats aux articles des divers projets de la Fondation Wikimédia ; My Wikiwix, qui permet de disposer de son propre moteur de recherche personnalisable sur son propre site web ; wikiwix.mobi, une version mobile de Wikiwix ;
  • Okawix, le navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web ;
  • un DVD comprenant environ 2 000 articles de la Wikipédia anglophone ; une clef USB contenant la version 0.7 de la Wikipédia anglophone ;
  • un programme d’archivage des pages web externes à la Wikipédia (c’est-à-dire, les pages web qui ne font pas partie de Wikipédia, mais auxquelles mènent des liens placés dans les articles de la Wikipédia, dits liens externes), afin que ces pages web externes restent consultables, et que les liens externes ne donnent pas des liens brisés ; ce programme est automatiquement utilisé, en particulier, pour tous les liens externes de la Wikipédia francophone.

6 janvier 2011

Quelle année !

Filed under: liens externes de wikipedia — Matthieu @ 18:21

Tonnerre de Brest ! Comme le temps a passé vite ! Pas eu le temps de voir filer cette année 2010 !

En même temps, si on y regarde bien, nous avons quand même eu, à Linterweb, le temps d »avancer sur pas mal de sujets, finalement.

cheapest viagra prices

Par exemple, en jetant un rapide coup d »œil en arrière, en 2009, Linterweb s »occupait déjà de l »archivage des liens externes apparaissant dans les articles de Wikipédia, afin que ces pages extérieures à la Wikipédia restent accessibles telles qu »elles étaient lors de leur insertion dans l »article, même en cas de modification ultérieure ou de suppression de la page externe. Mais alors, en 2009, cet archivage n »était pas réalisé pour tous les projets de la Fondation Wikimédia, ni pour toutes les langues.
Ce n »est d »ailleurs toujours pas le cas. L »archivage Wikiwix des pages externes ne s »est certes pas étendu à tous les projets Wikipédia ni à toutes les langues, mais il s »est quand même largement élargi : aujourd »hui, de plus en plus de projets utilisent ce service offert par Linterweb, que ce soient des projets frères de la Wikipédia (les versions francophones de Wikisource, du Wiktionnaire, de Wikiquote, de Wikilivres…) ou des Wikipédias en d »autres langues (comme la Wikipédia magyarophone (c »est-à-dire, en langue hongroise ;-)).
Nous espérons que l »utilisation de notre système d »archivage continuera de se répandre, car ce service nous paraît vraiment extrêmement utile : dans les articles, beaucoup de références comportent un ou plusieurs liens externes, qui permettent de sourcer, de vérifier, les affirmations énoncées dans l »article. Cette exigence de sourçage est un point clé de la crédibilité des articles. Maintenant, il suffit que la page externe servant de source soit modifiée ou supprimée, et la vérification est rendue de fait beaucoup moins évidente, voire impossible, pouvant alors remettre en cause toute la crédibilité de l »article, surtout si surviennent des conflits entre utilisateurs à propos de la véracité d »une affirmation donnée. Pour éviter cette perte d »information que constituent les liens externes, pour s »assurer que la crédibilité de l »article demeurera dans le temps, pour éviter nombre de conflits, le système d »archivage proposé par Linterweb est une nécessité.

D »autre part, nous aurons bientôt terminé le portage d »Okawix sur Android. Okawix, c »est notre navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web. Ainsi, il vous sera sous peu possible d »emporter avec vous Wikipédia ou n »importe quel projet partenaire, dans la poche de votre veste, sur votre mobile, pour pouvoir la consulter où vous voulez, quand vous voulez, même si vous ne disposez d »aucune connexion Internet dans les parages (en train, en avion, au milieu du Sahara, en Antarctique…). Par la suite, théoriquement au cours du premier trimestre 2011, nous devrions aussi sortir une version d »Okawix pour l »iPad.
À ce propos, nous avons récemment reçu un courrier électronique de Mister Jimmy « Jimbo » Wales par lequel il tient à saluer le travail effectué sur développement de logiciels permettant, comme Okawix, la consultation de Wikipédia en mode hors-ligne ou sur les appareils mobiles. Merci pour ce mail d »encouragement 🙂

En espérant que vous nous laisserez de nombreux commentaires sur notre blog, nous n »oublions pas de vous souhaiter une Bonne et Heureuse Année 2011 !

Cordialement 🙂 Matthieu.

Linterweb est une société d’informatique qui, depuis maintenant plusieurs années, développe un certain nombre de produits, dont la plupart sont liés de plus ou moins près à Wikipédia. Entre autres :

  • Wikiwix, un moteur de recherche sémantique qui restreint ses résultats aux articles des divers projets de la Fondation Wikimédia ; My Wikiwix, qui permet de disposer de son propre moteur de recherche personnalisable sur son propre site web ; wikiwix.mobi, une version mobile de Wikiwix ;
  • Okawix, le navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web ;
  • un DVD comprenant environ 2 000 articles de la Wikipédia anglophone ; une clef USB contenant la version 0.7 de la Wikipédia anglophone ;
  • un programme d »archivage des pages web externes à la Wikipédia (c »est-à-dire, les pages web qui ne font pas partie de Wikipédia, mais auxquelles mènent des liens placés dans les articles de la Wikipédia, dits liens externes), afin que ces pages web externes restent consultables, et que les liens externes ne donnent pas des liens brisés ; ce programme est automatiquement utilisé, en particulier, pour tous les liens externes de la Wikipédia francophone.

18 novembre 2008

Moteur de recherche sur Wikipedia Francophone

Filed under: liens externes de wikipedia — Pascal Martin @ 21:12

Bonsoir à tous,

Nous fouillons dans les entrailles de Wikipédia. En effet, un moteur de recherche est dors et déjà accessible sur les liens que la communauté Wikipédia à insérer afin de sourcer les articles.

Highly recommended product and very convenient as it’s stabilised. Cheap viagra canada?

Our ultimate goal is to provide safe generic drugs at the most competitive price.

C’est un peu une première pour nous en effet, nous sortons des sentiers battus de Wikipedia afin de proposer un moteur de recherche externe au contenu rédigé par la communauté.

Ce moteur de recherche permet de fiabiliser l’information que vous recherchez. En effet , en s’appuyant sur les sources de Wikipédia celà permet d’avoir des résultats qui permettent aux auteurs de rédiger les articles.

Celui – ci est accessible par l’intermediaire de l’affichage d’une page archivé en haut à gauche ou bien en cliquant là : moteur de recherche sur les sources Wikipedia Francophone.

Ce n’est qu’un premier jet nous améliorons dans les prochaines semaines celui-ci afin de le rendre beaucoup plus agréable qu’il ne l’est actuellement.

Cordialement
Martin Pascal

17 novembre 2008

cache sur les sources de wikipedia

Filed under: liens externes de wikipedia — Pascal Martin @ 17:54

Bonjour,

I’m using them for about a year, 3-4 times daily. I’ve used some other brands before but they didn’t work as well as those do. Order viagra 25mg online canada. You are guaranteed to find our products safe and best for your purposes.

Suite à la prise de décision de la communauté Wikipédia, un cache a été mis en place sur les sources qui sont listés dans Wikipédia.

Ce cache a pour objectif de sauvegarder une partie du travail de la communauté qui consiste à sourcer les articles de Wikipédia.

Cette sauvegarde permet de consulter les liens qui ont disparus ou les liens qui ont été modifiés.

Dorénavant toutes sources de Wikipedia est donc stocké, et son accessible grâce à un lien sur Wikipedia.

cache sur les liens externes de Wikipedia

Cordialement

Martin Pascal

23 octobre 2008

PDD : Liens Externes

Filed under: liens externes de wikipedia — Pascal Martin @ 23:34

Bonjour,

Après un mois de vote la communauté c’est prononcé pour l’utilisation la plus visible d’un cache.
C’est à dire qu’à partir de maintenant plus aucun lien servant de source seront perdus, l’idée consiste à stocker une version au moment de la création du lien sur nos serveurs.

Good for health! Online pharmacy cialis. Every discount drug order from Canada Drugs is backed by our No-Risk Guarantee that guarantees you 100% free shipping on every order.

C’est une fonctionnalité qui je trouve va dans le bon sens lorsqu’on s’inscrit dans un travail de qualité. Il faut savoir que près de 78000 liens soit 6% sont dit en erreur 404 grosso modo que le contenu de la source a disparu.

A celà il faut ajouter les liens des sites qui ont été mis en « parking » que l’on peut assimiler à un système de jachère en attendant d’être revendu.

La prochaine étape consiste donc à récupérer le contenu qui a actuellement disparu sur des sites spécialisés comme archive.org afin de diminuer le taux de perte, mais certains documents seront de toute façon irrécupérables.

Après ces quelques correctifs ce système pourra passer en production.

Cordialement

Martin Pascal

24 juin 2008

Liens externes de Wikipedia

Filed under: liens externes de wikipedia — Pascal Martin @ 14:30

Nous allons dans les prochains jours lancé un robot d’indexation sur les liens externes de Wikipedia, à ce titre là nous pourrions fournir à la communauté des retours automatiques concernant l’état du lien , la pertinence du lien , la langue du lien.
L’état du lien correspond en fait au code renvoyé par Apache , en fonction de ce code, soit le lien est valide soit il ne l’est pas. Ainsi, nous pourrons faire remonter à la communauté Wikipedienne les liens dits morts ou en redirections.
La pertinence du lien peut être assimilée à une recherche sélective dont C2040-918nous faisons allusion dans le précédent post, c’est à dire que si le lien ne renvoie pas l’article de WP dont il est issue c’est qu’il y a un doute.
La langue peut être détecté au moment du crawl ainsi le fait d’étiqueter la langue d’un lien peut être un plus dans Wikipedia.

herbal prednisone

Si vous avez des améliorations concernant le
00M-638 travail à fournir, faites nous part.

Older Posts »

Powered by WordPress