Wikipedia & Linterweb

30 juillet 2016

Un délit de démocratie sur Wikipedia

Filed under: wikiwix — Pascal Martin @ 4:30

Lorsque la Fondation Wikimedia qui fait confiance à Internet Archive et consulte qu’une partie de la communauté aux risques de devenir editrice du contenu de Wikipedia avec un service énergivore.

Pour ceux qui ne connaissent pas, Internet Archive est une Fondation à but non lucratif de 200 salariés consacrée à l’archivage du Web créé en 1996, qui fait partie des 500 sites les plus vus sur la toile.
Pour ceux qui connaissent, il paraît évident que le cadre légal de l’archivage du web mondial est respecté par Internet Archive, car c’est le référent en la matière.
Pour ceux qui ne connaissent pas, le cadre légal repose sur un bout de code html placé sur les pages ou dans le fichier robots.txt. Ce bout de code est assez significatif puisqu’il s’agit du noarchive.
Pour ceux qui connaissent, les éditeurs des sites ont donc un moyen technique simple et efficace afin de protéger leurs droits d’auteurs même d’une copie temporaire.

Maintenant par trois exemples je vais vous démontrer qu’Internet Archive ne respecte pas la directive noarchive.
Le premier l’archivage du site de Sudouest, mais d’autres quotidiens nationaux sont impactés leFigaro, Nouvel Observateur ( … ) :
Article Donald Trump du nouvel observateur dont le source de l’article contient la balise noarchive ( CTRL U et CTRL F « noarchive » )
Il y a 311932 urls d’archivés pour SudOuest.
Le second est l’archivage du site de Lemonde :
– soit en faisant un framesur un site extérieur qui renvoie vers un article du monde,
– soit en utilisant un raccourcisseur d’url,
A ce moment-là vous obtiendrez une copie de la une du Monde, qui vous permettra de surfer sur l’ensemble du site du Monde qui sera enregistré temporairement, les robots d’Internet Archive viennent chercher l’information du site et les efface a posteriori.
J’invite donc toute la presse qui utilise la balise noarchive à contrôler les archives présentes sur archive.org et à estimer le manque à gagner car leurs archives sont en libre disposition dans toutes les universités américaines.
Le troixième est l’archivage de Facebook, par exclusion dans le fichier robots.txt du robots de Internet Archive, un exemple de sauvegarde du contenu au sujet de Denis Robert :
Je vous invite à titre particulier à vérifier si vos données publiques ne sont pas sauvegardées également.
Et pourtant depuis 2005 Internet Archive prétend qu’il respecte la meta donnée noarchive

Maintenant revenons à nos moutons, en effet le projet de remplacement des liens morts par un lien vers le système d’archive.org va changer irrémédiablement le contenu de l’encyclopédie :

Le souhait numéro 1 de la « communauté Wikipedia », alors qu’historiquement chaque communauté locale devrait être consulté avant une prise de décision, qui a acté à partir de 111 votants pour l’ensemble de toutes les langues est devenu un projet de la Fondation Wikimedia puisque Danny Horn est salarié de la Fondation Wikimedia et agit en tant que chef de projet de cette migration :
Danny Horn salarié de la Wikimedia Fondation
projet gérer par la Wikimedia Fondation

A ce titre-là, la Fondation n’est plus hébergeur du site de Wikipedia puisque remplacer des liens par d’autres liens est un acte d’édition. La Fondation Wikimedia devient donc éditrice par le biais du déploiement Cyberbot II sur l’ensemble des projets de la Fondation Wikimedia à hauteur de plusieurs centaines millions de liens.

Je me suis entretenu avec Danny qui en aucun cas n’a tenu compte de mes remarques, et je lui ai expliqué également de la difficulté de détecter un lien mort.
Le remplacement par la note 12 en est un parfait exemple, le Cybert_Bot_II a remplacé un lien par une archive alors que le site de BloomBerg donne toujours la même information :

Pour éviter de cataloguer les liens trops vite comme liens morts, il faut aller voir plusieurs fois les urls avant leur remplacement.

En outre cette solution, qui n’est pas la panacée, va donc devenir de plus en plus énergivore : en effet pour savoir si un lien est mort il est nécessaire d’y accéder de façon automatique mais au vu de la quantité de liens à surveiller je suis surpris qu’un tel service voit le jours car il sera payé par les dons.

Cela fait que c’est un projet excessivement polluant pour un rendu qui apporte moins que la solution que nous maintenons depuis 2009 pour la communauté Wikipedia Francophone hébergé en France à Saint Etienne du Rouvray.
En effet, les articles de Wikipedia Francophone restent inchangés tout en permettant un accès à toutes sources qui peuvent être modifié à postériori sans générer de liens morts. Un lien archive doit être positionné sur chacune des sources pour vérifier l’information en cas de changement de contenu de cette dernière.
Quant aux détracteurs de notre solution, sachez qu’en aucun cas nous n’avons perdu de la donnée depuis que nous nous sommes lancés dans ce projet. En effet, notre système repose sur un archivage du contenu de liens en temps réel dès qu’ils apparaissent sur Wikipedia ( pour justement pérenniser le travail de sourcing de la communauté ). La perte de la synchronisation est due généralement à un manque de communication entre la Fondation et Linterweb lors de correctif qui impact ce processus.

J’ai expliqué aux membres du projet que Linterweb était prête à partager sa technologie avec Internet Archive afin d’une part de ne pas augmenter le coût énergétique et d’autre part sur la captation des urls en temps réel.
Je n’ai pour l’instant eu aucun retour de leurs parts au sujet de ma proposition.
Evidement que notre solution est beaucoup moins laxiste concernant les normes d’archivages en vigueur et que notre solution est prête à être déployée pour d’autres langues avec l’aval des différentes communautés comme cela a été le cas pour le francophone et le hongrois.
L’expertise dans le domaine de l’archivage acquise par Linterweb, nous permet également d’affirmer qu’Internet Archive n’est pas le seul à outrepasser la bienséance nécessaire à ce type de projets.
Est-ce que la Fondation Wikimedia a pour rôle de détecter l’ensemble des sites qui ne fonctionnent plus, et qui résout partiellement le problème du sourcing des articles, je ne pense pas, c’est plus le rôle d’un moteur de recherche :

Pour contrer ce déploiement vous pouvez manifester votre mécontentement :
sur la page du projet
sur la demande du déploiement sur Wikipedia francophone
Mais dans ce monde-là, on accorde bien plus de crédits à une fondation de droit américains qui viole les droits du producteur de données ( cf : http://www.lemonde.fr/robots.txt ) et qui gagne de l’argent en revendant les archives qu’à une petite société française qui ne gagne pas d’argent sur les archives.

Pascal Martin

22 février 2016

Wikiwix attend Facebook pour déployer ses technologies de moteur de recherches et d’archivages

Filed under: liens externes de wikipedia,wikiwix — Pascal Martin @ 18:17

Bonjour à tous,

Comme vous vous êtes aperçus ces deux dernières années de Recherche et Développement nous ont amené à travailler sur les contenus de Facebook.
Nous sommes donc en mesure de proposer un moteur de recherche spécifique sur les contenus de Facebook.

Il va de soi que le but n’étant pas de faire un moteur de recherche sur l’intégralité des contenus de Facebook, mais un moteur de recherche à l’échelle des moyens que possèdent Linterweb.

Après une dizaine de jours, nous attendons toujours l’autorisation de Facebook pour l’entrée nécessaire à nos robots dans le fichier robots.txt de Facebook.

En effet, il faut savoir que Facebook fait référence au moteur de recherche comme Google, Bing , en stipulant que : « le contenu public peut apparaître quand quelqu’un procède à une recherche sur Facebook ou un autre moteur de recherche », mais il est bien entendu nécessaire d’avoir l’aval de Facebook.

Normalement, il s’agit d’une simple formalité car Wikiwix est moteur de recherche, au même titre que ceux autoriser par Facebook dans le robots.txt, sur les contenus :
Wikipedia :
et sur toutes les catégories du Dmoz

La technologie que nous avons revisité est celle qui nous a primé au 1 Carrefour des possibles à savoir un moteur de recherche communautaire

et que nous avons expérimenté très tôt sur twitter.

Je ne préfère pas argumenter sur le rôle d’archiveur de datas que nous opérons sur les contenus sources de Wikipedia, car à l’heure actuelle Internet Archive est le seul à avoir le droit de pouvoir se déployer au regard du fichier robots.txt.

Sans cette autorisation officielle, nous ne pouvons pas valoriser notre recherche à venir dans le cadre du Crédit Impôt Innovation, car nous sommes propriétaires d’une solution qui commercialement ne peut pas être exploitée sans autorisation.

J’ai donc contacté Facebook France et ils m’ont renvoyé vers le centre d’aide communautaire afin d’avoir le soutien de la communauté Facebook pour avoir une réponse à mes questions :

Linterweb travaille sur ces deux technologies de puis une bonne dizaine d’années, la demande est donc légitime, car c’est indéniable Linterweb a une technologie de moteur de recherche, et d’archivage de datas au même titre que les grands noms du domaine.

« Lorsque vous publiez sur un forum ouvert sur Facebook (par exemple, sur des Pages, dans des groupes publics ou dans la section Forum communautaire des pages d’aide), les publications peuvent apparaître dans les résultats de moteurs de recherche tels que Yahoo et Google. »
extrait du centre d’aide de Facebook : https://www.facebook.com/help/186212491428940
« Lorsque vous publiez sur un forum ouvert sur Facebook (par exemple, sur des Pages, dans des groupes publics ou dans la section Forum communautaire des pages d’aide), les publications peuvent apparaître dans les résultats de moteurs de recherche tels que Yahoo et Google. »
extrait du centre d’aide de Facebook : https://www.facebook.com/help/186212491428940

Pascal Martin
Pour Linterweb
http://wikiwix.com

21 avril 2015

Les archives Wikiwix des liens externes reviennent !

Filed under: liens externes de wikipedia — Matthieu @ 15:08

Interrompu depuis quelque temps déjà, le service d’archivage automatique des liens externes de Wikipedia placés dans les notes de bas de page, à la semblance du beau phœnix, renaît de ses cendres !

 

Comme vous le savez, depuis plusieurs années, suite à cette prise de décision : Wikipédia:Prise_de_décision/Système_de_cache, nous (enfin, Linterweb, quoi ! ) archivons  les liens externes apparaissant dans les notes de bas de page des articles de Wikipédia. Ceci afin que ces pages extérieures à Wikipédia restent accessibles telles qu’elles étaient lors de leur insertion dans l’article, même en cas de modification ultérieure ou de suppression de la page externe.

 

Mit roten Kreisen eingekreist, von Linterweb archivierte externe Weblinks

Mit roten Kreisen eingekreist, von Linterweb archivierte externe Weblinks

 

Par exemple, prenons l’article sur la commune de Faux, en Dordogne. Dans la section Liens externes, vous voyez un lien vers la page de Faux sur le site de l’Institut géographique national. Malheureusement, cette page n’est plus accessible : le lien http://www.ign.fr/affiche_rubrique.asp?rbr_id=1087%26CommuneId=25179 mène vers une belle Erreur 404 : la page n’a pu être trouvée… :-(

IGN Faux page manquante

 

 

Pour remédier à ce problème, Linterweb sauvegarde sur ses serveurs ce genre de liens externes. Pour notre exemple, la page manquante de l’IGN peut ainsi être retrouvée sur nos serveurs : http://archive.wikiwix.com/cache/?url=http://www.ign.fr/affiche_rubrique.asp?rbr_id=1087%26CommuneId=25179.

 

IGN Faux Cache Wikiwix

 

La page est telle qu’elle était lorsqu’elle a été archivée. La page est manquante sur les serveurs de l’IGN mais toujours consultable sur les nôtres.

 

Depuis quelques semaines, les disques durs dédiés à l’archivage des pages étaient arrivés à saturation, et nous avions été obligés d’interrompre le service. De 2,7 teraoctets, leur capacité a été augmentée à 11 teraoctets, ce qui devrait nous permettre d’être désormais tranquilles pour plusieurs années.

 

Nous remettons donc en route le service d’archivage automatique. Mais armez-vous de patience : il faudra au minimum plusieurs semaines avant que le service soit à nouveau pleinement opérationnel.

 

Les liens externes non archivés pendant l’interruption de service seront récupérés à partir des fichiers de sauvegarde de Wikipédia, afin qu’aucune page ne soit perdue.

 

Ce projet est intégralement financé par Linterweb, une société néo bretonne de trois salariés, et intégralement hébergé en Haute-Normandie, au Crihan.

 

Ce service nous paraît vraiment extrêmement utile : dans les articles, beaucoup de références comportent un ou plusieurs liens externes, qui permettent de sourcer, de vérifier, les affirmations énoncées dans l’article. Cette exigence de sourçage est un point clé de la crédibilité des articles. Maintenant, il suffit que la page externe servant de source soit modifiée ou supprimée, et la vérification est rendue de fait beaucoup moins évidente, voire impossible, pouvant alors remettre en cause toute la crédibilité de l’article, surtout si surviennent des conflits entre utilisateurs à propos de la véracité d’une affirmation donnée. Pour éviter la perte de cette information que constituent les liens externes, pour s’assurer que la crédibilité de l’article demeurera dans le temps, pour éviter nombre de conflits, le système d’archivage proposé par Linterweb est une nécessité.

 

Cette année nous avons prévu de passer quelques semaines à l’amélioration de ce service. Merci de nous faire part de vos suggestions d’améliorations ici : Utilisateur:Pmartin/Cache_v2.

 

En espérant que vous apprécierez l’utilité de ce service, cordialement :-) Matthieu.

 

Et je chantais cette romance

En 1903 sans savoir

Que mon amour à la semblance

Du beau Phénix s’il meurt un soir

Le matin voit sa renaissance.

Linterweb est une société d’informatique qui, depuis maintenant plusieurs années, développe un certain nombre de produits, dont la plupart sont liés de plus ou moins près à Wikipédia. Entre autres :

  • Wikiwix, un moteur de recherche sémantique qui restreint ses résultats aux articles des divers projets de la Fondation Wikimédia ;
  • Okawix, le navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web ;
  • un programme d’archivage des pages web externes à la Wikipédia (c’est-à-dire, les pages web qui ne font pas partie de Wikipédia, mais auxquelles mènent des liens placés dans les articles de la Wikipédia, dits liens externes), afin que ces pages web externes restent consultables, et que les liens externes ne donnent pas des liens brisés ; ce programme est utilisé, en particulier, pour tous les liens externes des projets Wikimédia francophones, ou encore sur les Wikipédias roumanophone et magyarophone ;
  • allingroups autoposteur Facebook, un service permettant de publier automatiquement des messages sur tout ou partie des groupes Facebook auxquels vous êtes abonné (auto-posteur Facebook) ;

2 février 2012

Xulrunner (firefox) plus dans les dépots d’ubuntu

Filed under: wikiwix — Pascal Martin @ 19:45

Bonjour,

Nous réalisons actuellement une check list afin de porter tout ou partie de notre développement en opensource, et quelle surprise Xulrunner ne fait plus partie du dépot d’ubuntu.
C’est à dire que dès qu’une mise à jours du système d’exploitation s’effectue, elle désinstalle le xulrunner ne permettant plus d’exécuter Okawix.

Il semblerait que ce soit le fait de mise à jour de Firefox trop fréquentes qui ne permettent pas de maintenir le paquet XulRunner à jours.

http://ubuntu.5.n6.nabble.com/Removing-XULRunner-from-oneiric-call-for-help-td708630.html

http://www.ubuntuupdates.org/packages/show/353326

Je me demande bien comment vont faire les applications pour pouvoir continuer à fonctionner sur Xulrunner, on va comme même pas interdire aux gens de mettre à jour leurs OS ou leur dire qu’il faut réinstaller manuellement le paquet après une mise à jour.

D’un autre côté je suis surpris également de ne pas trouver de communiqué de la Fondation Firefox à ce sujet.

Cordialement
Pascal Martin

13 septembre 2011

Fork d’un projet wikimedia

Filed under: wikiwix — Pascal Martin @ 0:57

Bonsoir,

La Wikinews anglophone, projet dédié à la gestion des articles d »actualités vient de forker. Un terme connu en terminologie de l »open source pour signifier qu »il y a une scission entre un projet initiateur et un projet qui part sur cette même base.

Grosso modo, dorénavant deux organes s »offrent aux personnes qui souhaitent rédiger des articles sur l »actualité : soit Wikinews soit OpenGlobe.

L »arrivé de ce nouveau projet a été salué par Eric Moeller qui est le directeur adjoint de la Fondation Wikimedia.

Ce fork est soutenu par une partie de la communauté Wkinews anglophone les raisons évoquées sont un manque de soutien technique de la Wikimedia Fondation pour le projet initiateur.

Pour ceux que cela intéresse le thread de la discussion au est là.

Cordialement
Pascal Martin

8 juillet 2011

Linterweb chargé par la Wikipédia roumanophone de l’archivage des liens externes

Filed under: liens externes de wikipedia — Matthieu @ 16:26

Linterweb s »est vu confier l »archivage des liens externes apparaissant dans les articles de la Wikipédia roumanophone, afin que ces pages extérieures à la Wikipédia restent accessibles telles qu »elles étaient lors de leur insertion dans l »article, même en cas de modification ultérieure ou de suppression de la page externe. Ce service d »archivage des liens externes s »étend toujours plus largement : aujourd »hui, de plus en plus de projets utilisent ce service offert par Linterweb, que ce soient des projets frères de la Wikipédia (les versions francophones de Wikisource, du Wiktionnaire, de Wikiquote, de Wikilivres…) ou des Wikipédias en d »autres langues (comme la Wikipédia magyarophone (c »est-à-dire, en langue hongroise ;-)).
Nous espérons que l »utilisation de notre système d »archivage Wikiwix continuera de se répandre, car ce service nous paraît vraiment extrêmement utile : dans les articles, beaucoup de références comportent un ou plusieurs liens externes, qui permettent de sourcer, de vérifier, les affirmations énoncées dans l »article. Cette exigence de sourçage est un point clé de la crédibilité des articles. Maintenant, il suffit que la page externe servant de source soit modifiée ou supprimée, et la vérification est rendue de fait beaucoup moins évidente, voire impossible, pouvant alors remettre en cause toute la crédibilité de l »article, surtout si Biloxi fournit egalement craps. surviennent des conflits entre utilisateurs à propos de la véracité d »une affirmation donnée. Pour éviter cette perte d »information que constituent les liens externes, pour s »assurer que la crédibilité de l »article demeurera dans le temps, pour éviter nombre de conflits, le système d »archivage proposé par Linterweb est une nécessité.

Cordialement :-) Matthieu.

Linterweb est une société d’informatique qui, depuis maintenant plusieurs années, développe un certain nombre de produits, dont la plupart sont liés de plus ou moins près à Wikipédia. Entre autres :

  • Wikiwix, un moteur de recherche sémantique qui restreint ses résultats aux articles des divers projets de la Fondation Wikimédia ; My Wikiwix, qui permet de disposer de son propre moteur de recherche personnalisable sur son propre site web ; wikiwix.mobi, une version mobile de Wikiwix ;
  • Okawix, le navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web ;
  • un DVD comprenant environ 2 000 articles de la Wikipédia anglophone ; une clef USB contenant la version 0.7 de la Wikipédia anglophone ;
  • un programme d’archivage des pages web externes à la Wikipédia (c’est-à-dire, les pages web qui ne font pas partie de Wikipédia, mais auxquelles mènent des liens placés dans les articles de la Wikipédia, dits liens externes), afin que ces pages web externes restent consultables, et que les liens externes ne donnent pas des liens brisés ; ce programme est automatiquement utilisé, en particulier, pour tous les liens externes de la Wikipédia francophone.

Entourés en rouge, les liens externes archivés par Linterweb

6 mai 2011

Un exemple d'utilisation de Wikimarks

Filed under: wikiwix — Matthieu @ 16:45

Je vous ai déjà parlé de Wikimarks à deux reprises. La première fois je vous avais expliqué que c’est un nouveau service, offert par Linterweb, et qu’il vous permet de créer votre propre moteur de recherche personnalisé, et d’effectuer des recherches sur des comptes de réseaux sociaux ou de marque-pages sur Internet (Delicious, Netvibes, Twitter, Google Reader, Identi.ca, Digg, etc.). Je vous avais alors décrit comment Wikimarks fonctionne, comment le configurer et comment l’utiliser ensuite. Dans un second article j’avais évoqué quelques-unes des nombreuses possibilités d’applications de ce nouveau produit.
Aujourd’hui, je vais vous fournir un exemple d’application plus détaillé : un moteur de recherche Wikimarks sur (en) les comptes Twitter officiels de Google (il y en a un certain nombre…).
J’ai tout d’abord dû créer le moteur de recherche Wikimarks.

computer science homework help

Ce qui est très facile : je n’ai eu qu’à me créer un compte, me connecter à ce compte, puis développer mon moteur de recherche en ajoutant les comptes Twitter de Google à la liste des comptes que mon moteur de recherche indexe.
Vous pouvez tester le résultat ici : http://wikiwix.com/index.php?lang=fr&disp=!bookmarks%2FUser%2F200.
Essayons-le sur un exemple : supposons que vous désiriez obtenir la liste des pages traitant de Wikipédia qui ont été twittées par Google. C’est très facile : tapez Wikipédia dans le champ de recherche et lancez la recherche. La page de résultats s’affiche immédiatement : http://wikiwix.com/index.php?lang=fr&disp=!bookmarks%2FUser%2F200&action=Wikipédia.
Vous pouvez ainsi voir très facilement ce que Google raconte sur Wikipédia.
La version courante est encore en bêta, mais nous espérons que vous aurez déjà envie de l’essayer et que vous laisserez vos remarques sur notre blog.
Cordialement :-) Matthieu.

Linterweb est une société d’informatique qui, depuis maintenant plusieurs années, développe un certain nombre de produits, dont la plupart sont liés de plus ou moins près à Wikipédia. Entre autres :

  • Wikiwix, un moteur de recherche sémantique qui restreint ses résultats aux articles des divers projets de la Fondation Wikimédia ; My Wikiwix, qui permet de disposer de son propre moteur de recherche personnalisable sur son propre site web ; wikiwix.mobi, une version mobile de Wikiwix ;
  • Okawix, le navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web ;
  • un DVD comprenant environ 2 000 articles de la Wikipédia anglophone ; une clef USB contenant la version 0.7 de la Wikipédia anglophone ;
  • un programme d’archivage des pages web externes à la Wikipédia (c’est-à-dire, les pages web qui ne font pas partie de Wikipédia, mais auxquelles mènent des liens placés dans les articles de la Wikipédia, dits liens externes), afin que ces pages web externes restent consultables, et que les liens externes ne donnent pas des liens brisés ; ce programme est automatiquement utilisé, en particulier, pour tous les liens externes de la Wikipédia francophone.
Page de résultats de Wikimarks

Page des résultats d'une recherche sur le terme Wikipédia, avec le moteur de recherche Wikimarks sur les comptes Twitter officiels de Google

28 mars 2011

Ce qu'on peut faire avec Wikimarks

Filed under: wikiwix — Matthieu @ 16:01

Je vous ai déjà parlé de Wikimarks dans mon billet de la dernière fois. Je vous avais expliqué que c’est un nouveau service, offert par Linterweb, et qu’il vous permet de créer votre propre moteur de recherche personnalisé, et d’effectuer des recherches sur des comptes de réseaux sociaux ou de marque-pages sur Internet (Delicious, Netvibes, Twitter, Google Reader, Identi.ca, Digg, etc.). Je vous avais alors décrit comment Wikimarks fonctionne, comment le configurer et comment l’utiliser ensuite.

Maintenant que vous savez comment il fonctionne, j’aimerais vous parler de quelques-unes des nombreuses possibilités d’applications de ce nouveau produit.
Mais tout d’abord, je dois vous expliquer qu’il est très facile de partager son moteur de recherches Wikimarks avec vos proches. Il suffit de leur envoyer l’URL de votre moteur de recherche Wikimarks (chaque moteur de recherche Wikimarks possède en effet une URL qui lui est propre, et tous les moteurs de recherches sont publics).

C’est une possibilité très utile, car elle vous permet par exemple de collaborer à l’élaboration de votre moteur de recherche avec d’autres personnes, qui pourront ainsi vous aider à l’améliorer.

Par exemple, supposons que vous soyez professeur d’histoire. Vous pouvez remplir votre moteur de recherche avec une liste de liens se rapportant à votre cours. Ainsi, vos élèves pourront effectuer des recherches sur des sites et des documents qui correspondent réellement à votre cours, puisque c’est vous-même qui les aurez sélectionnés ! D’autres collègues professeurs d’histoires peuvent également se joindre à vous et vous aider à élaborer la liste de sites du moteur de recherche. On peut même imaginer, pourquoi pas, que tous les profs d’histoire de votre pays collaborent à ce projet, dans un effort commun, au niveau national (ce que j’imagine là n’est pas si irréaliste que ça ! De tels projets sont déjà en cours dans plusieurs pays !). Ou, pas seulement les professeurs d’histoire, mais tous les professeurs de votre école, de toutes les matières (maths, physique, français…).

Cela vous permet de créer des moteurs de recherche spécialisés : un pour le cours de physique, un pour celui de maths, un pour le club de tennis, un pour le ciné-club, etc.

L’intérêt, c’est qu’ainsi vos résultats de recherches ne se trouvent pas noyés au beau milieu d’une multitude de liens qui n’ont rien à voir avec ce que vous cherchez. Tous les liens sont pertinents, car c’est vous-même qui avez choisis les sites à indexer. Contrairement à un moteur de recherche classique, qui retournera souvent une foultitude de liens non pertinents (par exemple, si vous exécutez avec un moteur de recherche classique une recherche sur le terme « ordinateur », la plupart des résultats concerne, comme vous pouvez le constater, des sites web de vente d’ordinateurs ; ce qui, vous en conviendrez, n’a pas forcément à voir avec ce que vous recherchez :-( Pour d’autres recherches, vous l’avez certainement déjà remarqué, vous n’obtiendrez bien trop souvent que des pages qui ne seront que pure copie d’articles de Wikipédia !! :-( ).

Maintenant, si vous pensez avoir réussi à créer un moteur de recherche parfaitement adapté à un sujet donné, vous pouvez partager son URL avec vos proches, afin que ceux-ci puissent également jouir des possibilités de votre moteur. Et ils pourront aussi vous aider à l’améliorer encore un peu !

Enfin, si vous gérez un ou des sites web, Wikimarks vous permet d’avoir votre moteur de recherche personnalisé, adapté à vos sites, qui ne recherche ses résultats que sur votre ensemble de sites, comme taillé sur mesure.

La version courante est encore en bêta, mais nous espérons que vous aurez déjà envie de l’essayer et que vous laisserez vos remarques sur notre blog.

Cordialement :-) Matthieu.

Linterweb est une société d’informatique qui, depuis maintenant plusieurs années, développe un certain nombre de produits, dont la plupart sont liés de plus ou moins près à Wikipédia. Entre autres :

  • Wikiwix, un moteur de recherche sémantique qui restreint ses résultats aux articles des divers projets de la Fondation Wikimédia ; My Wikiwix, qui permet de disposer de son propre moteur de recherche personnalisable sur son propre site web ; wikiwix.mobi, une version mobile de Wikiwix ;
  • Okawix, le navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web ;
  • un DVD comprenant environ 2 000 articles de la Wikipédia anglophone ; une clef USB contenant la version 0.7 de la Wikipédia anglophone ;
  • un programme d’archivage des pages web externes à la Wikipédia (c’est-à-dire, les pages web qui ne font pas partie de Wikipédia, mais auxquelles mènent des liens placés dans les articles de la Wikipédia, dits liens externes), afin que ces pages web externes restent consultables, et que les liens externes ne donnent pas des liens brisés ; ce programme est automatiquement utilisé, en particulier, pour tous les liens externes de la Wikipédia francophone.

25 mars 2011

Linterweb au Premier Carrefour des Possibles en Haute-Normandie organisé par la CREA

Filed under: wikiwix — Matthieu @ 10:37

Linterweb est fière de vous annoncer que son moteur de recherche sémantique Wikiwix et son navigateur Wikipédia hors-ligne Okawix font partie des dix projets retenus par le comité de sélection du Premier Carrefour des Possibles en Haute-Normandie. Le Carrefour des Possibles est une opération se proposant de mettre en valeur des projets innovants dans le domaine des technologies de l’information et de la communication. À cette fin, une soirée publique de présentation des projets, se déroulera le mardi 12 avril 2011 à l’ESIGELEC, au Technopôle du Madrillet – Avenue Isaac Newton, à Saint-Étienne-du-Rouvray, à 18 h. Cette réunion, qui réunira grand public, entrepreneurs, responsables publics, artistes… sera l’occasion pour Linterweb de mieux se faire connaître, et de faire des rencontres, toujours intéressantes. Elle est ouverte à tous sur inscription. Vous êtes tous chaleureusement invités à venir nous rencontrer. Ce sera l’occasion de parler de Linterweb, et de ses projets autour de Wikipédia. Et pour nous de mieux vous connaître ! Voici le programme prévisionnel de la soirée :

  • 18 h 00 : accueil des participants et présentation du Carrefour des Possibles ;
  • 18 h 30 : Présentation des dix projets en six minutes chacun (chronométré !) ;
  • 19 h 30 : Rencontres avec le public, cocktail, échanges, démonstrations.

Les inscriptions se font en ligne sur le site Internet de l’événement. Vous avez jusqu’au 12 avril pour vous inscrire. Vous pouvez également télécharger l’affiche de l’événement. Nous espérons vous voir nombreux :-) N’hésitez pas à nous laisser un mot, sous n’importe quel article de notre blog, Matthieu. Linterweb est une société d’informatique qui, depuis maintenant plusieurs années, développe un certain nombre de produits, dont la plupart sont liés de plus ou moins près à Wikipédia. Entre autres :

  • Wikiwix, un moteur de recherche sémantique qui restreint ses résultats aux articles des divers projets de la Fondation Wikimédia ; My Wikiwix, qui permet de disposer de son propre moteur de recherche personnalisable sur son propre site web ; wikiwix.mobi, une version mobile de Wikiwix ;
  • Okawix, le navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web ;
  • un DVD comprenant environ 2 000 articles de la Wikipédia anglophone ; une clef USB contenant la version 0.7 de la Wikipédia anglophone ;
  • un programme d’archivage des pages web externes à la Wikipédia (c’est-à-dire, les pages web qui ne font pas partie de Wikipédia, mais auxquelles mènent des liens placés dans les articles de la Wikipédia, dits liens externes), afin que ces pages web externes restent consultables, et que les liens externes ne donnent pas des liens brisés ; ce programme est automatiquement utilisé, en particulier, pour tous les liens externes de la Wikipédia francophone.

2 mars 2011

Wikimarks, pour effectuer des recherches sur vos comptes de réseaux sociaux et de marque-pages (Delicious, Netvibes, Twitter, Google Reader, Identi.ca, Digg, etc.)

Filed under: wikiwix — Matthieu @ 11:27

Jusqu’à récemment, Wikiwix, le moteur de recherche proposé par Linterweb, restreignait ses recherches aux projets Wikimédia. Mais maintenant, nous vous offrons également la possibilité d’effectuer des recherches sur des comptes de réseaux sociaux ou de marque-pages sur internet (Delicious, Netvibes, Twitter, Google Reader, Identi.ca, Digg, etc.). Ce nouveau service s’appelle Wikimarks.

Supposons que vous veuillez effectuer une recherche sur, par exemple, un ou plusieurs comptes Twitter ou Delicious. Rendez-vous alors sur la page de connexion de Wikimarks : http://wikiwix.com/wikimarks/index.php.

Ensuite, il vous faudra tout d’abord vous créer un compte Wikimarks (mais rassurez-vous, rien de plus facile, vous n’avez à fournir qu’une adresse de courrier électronique et un mot de passe pour ce nouveau compte).

Vous pourrez dès lors vous connecter et accéder ainsi à l’espace de configuration de Wikimarks. Cliquez alors sur le lien Gérez vos marque-pages externes.

La page obtenue vous permet de gérer les comptes de réseaux sociaux que vous voulez inclure dans vos recherches : par exemple, si vous désirez effectuer des recherches sur le compte Twitter Wikipedia (eh oui ! Wikipédia aussi a son compte Twitter !), écrivez Wikipedia dans le champ correspondant à Twitter puis cliquez le bouton Ajouter (en fait, vous n’avez donc même pas besoin de posséder votre propre compte Twitter ; vous pouvez ajouter n’importe quel compte Twitter, c’est-à-dire les noms d’utilisateurs sur les comptes de qui vous voulez réaliser des recherches). Wikimarks indexe alors toutes les pages twittées sur ce compte Wikipedia, et vous pouvez dès lors effectuer des recherches limitées à ces pages. Il est naturellement possible d’ajouter d’autres comptes d’autres sites : Delicious, Twitter, Identica, Digg. Vous pouvez même tout aussi bien ajouter de simples flux RSS, ou encore des listes OPML de liens (OPML est un format de fichier utilisé entre autres par des sites tels que Google Reader ou Netvibes ; ainsi pourrez-vous donc également effectuer des recherches sur vos flux Google Reader ou Netvibes).

Pour lancer des recherches sur les comptes et listes de liens que vous avez sélectionnés, vous n’avez plus qu’à taper les termes de recherche dans le champ approprié (en bas à droite de la page), et valider.

Votre moteur de recherche Wikimarks étant maintenant configuré, vous pouvez exécuter des recherches restreintes à vos flux préférés (ou pas).

La version courante est encore en bêta, mais nous espérons que vous aurez déjà envie de l’essayer et que vous laisserez vos remarques sur notre blog.

La prochaine fois, je vous parlerai des nombreuses applications possibles de ce nouveau service.

Cordialement :-) Matthieu.

Linterweb est une société d’informatique qui, depuis maintenant plusieurs années, développe un certain nombre de produits, dont la plupart sont liés de plus ou moins près à Wikipédia. Entre autres :

  • Wikiwix, un moteur de recherche sémantique qui restreint ses résultats aux articles des divers projets de la Fondation Wikimédia ; My Wikiwix, qui permet de disposer de son propre moteur de recherche personnalisable sur son propre site web ; wikiwix.mobi, une version mobile de Wikiwix ;
  • Okawix, le navigateur Wikipédia hors-ligne libre et gratuit qui permet de lire en mode déconnecté les articles des projets de la Fondation Wikimédia, aussi bien que des archives de votre propre site web ;
  • un DVD comprenant environ 2 000 articles de la Wikipédia anglophone ; une clef USB contenant la version 0.7 de la Wikipédia anglophone ;
  • un programme d’archivage des pages web externes à la Wikipédia (c’est-à-dire, les pages web qui ne font pas partie de Wikipédia, mais auxquelles mènent des liens placés dans les articles de la Wikipédia, dits liens externes), afin que ces pages web externes restent consultables, et que les liens externes ne donnent pas des liens brisés ; ce programme est automatiquement utilisé, en particulier, pour tous les liens externes de la Wikipédia francophone.
Older Posts »

Powered by WordPress