public marks

PUBLIC MARKS from decembre with tags information & donnée

March 2010

Extraction de données html sur un site distant avec Php, MySQL et XML (2004) - Allociné - Club des décideurs et professionnels en Informatique

Résumé : Cet article présente une méthode pour récupérer des informations sur un site internet et les intégrer dans une base de données ou dans un flux XML.

November 2009

Piggy Bank - web-scrapin -Firefox extension SIMILE

by 2 others
Turns your browser into a mashup platform, by allowing you to extract data from different web sites and mix them together. Also allows you to store this extracted information locally for you to search later and to exchange at need the collected information with others.

Web-scraping (parfois appelé Harvesting) - Recherche Google

Web-scraping : le Web vu comme un service Les techniques de Web-scraping permettent de récupérer, de "piocher", de traiter et d'archiver le contenu ou une partie d'une page web. Le plus souvent pour se tenir au courant des modifications survenues en son sein, mais de nombreuses autres utilisations sont possibles. Ces différents outils sont indispensables à une veille au quotidien. Il en existe beaucoup sur le Web et nous avons décidé de vous en présenter trois, au travers d'exemples détaillés. Lorsqu'elles sont bien utilisées, ces différentes applications s'avèrent redoutables, et constitueront vite une aide précieuse, pour vous tenir au courant du moindre changement sur les sites web que vous surveillez...

December 2008

" The File Room " (la salle d'archives) d'Antoni Muntadas___Oeuvre-Programme ___Rassemble à l'échelle mondiale des cas de censure à l'encontre de l'art

Pour réaliser ce projet Muntadas a fait appel dans un premier temps à des étudiants et à des chercheurs dans plusieurs villes américaines pour réunir une documentation sur environ 400 instances de censure. Cette oeuvre-archive a été présentée dans de nombreuses manifestations artistiques sous la forme d'une installation kafkaesque comportant des murs de casiers empilés dans lesquels s'intercalaient des moniteurs vidéo reliés à Internet, mais elle se passe tout à fait d'une telle mise en scène. Depuis son inauguration en 1994, simultanément au Chicago Cultural Center et sur le Web, " The File Room " offre aux internautes la possibilité d'y ajouter leurs propres exemples de censure artistique. Le site Web est mis à jour régulièrement. Au fur et à mesure on créé des liens vers d'autres banques de données et des sites Web susceptibles d'apporter des informations complémentaires.

November 2008

Spock traque votre profil sur le Web - Abondance : Référencement et moteurs de recherche

Spock, un moteur de recherche spécialisé sur les personnes .Dans la foulée de sites comme ZoomInfo ou Wink, il s'intéresse aux stars de la télévision comme à votre voisin de palier. Evidemment, il connaîtra plus de choses sur les uns que sur les autres, même si certaines surprises peuvent forcément arriver... L'outil propose des "tags" en rapport avec la personne recherchée, les noms de connaissances proches, ou qui ont des liens avec elle, ainsi que des pages web qui en parlent. Il est également possible de taper des mots clés comme "actor" ou "politicians"... Spock prend sa source sur le Web et les réseaux sociaux, et attend notamment beaucoup des inetrnautes eux-même qui peuvent télécharger une photo ou ajouter des renseignements à leur fiche descriptive. Son objectif est de proposer plus de 100 millions de profils d'ici à la fin de l'année et de tous les internautes à long terme.

123 People____Trouver des informations sur des personnes qui ont "laissé des traces" sur Internet

Le moteur 123People.com (Autriche) qui permet de Trouver des informations sur des personnes qui ont "laissé des traces" sur Internet : adresse e-mail, photos, vidéos, numéro de téléphone, informations issues de réseaux sociaux (MySpace, Twitter, Facebook, Wikipedia et autres), etc. Le moteur "renifle" toutes les données portant sur une personne, le contenu ou les articles qui lui ont été éventuellement consacrés, et les rassemble sous une même interface. Bref, un profil complet de l'internaute ainsi que de son "e-réputation"... D'autres outils, comme Spock, avaient également tracé la voie dans ce sens par le passé. 123People a beau dire que toutes les données ainsi collectées sont publiques et disponibles librement sur la Toile, les protecteurs des données privées, déjà mises à mal au quotidien sur les réseaux, vont adorer... D'autant plus qu'il ne semble pas exister de possibilité d'exclure de l'affichage telle ou telle information proposée par le site...