
Data scraping with YQL and jQuery | kelvinluck.com For a project that I’m currently working on I need a list of all the US National Parks in XML format. Google didn’t come up with anything so I decided that I would need to somehow grab the data from this list on Wikipedia. The problem is that the list is in messy HTML but I want some nice clean XML ready for parsing with E4X in Flash. There are a number of ways I could parse the data. That’s when I thought of using jQuery to parse the data – it is the perfect tool for navigating a HTML DOM and extracting information from it. At this point I had at least a couple of ways to proceed with my jQuery approach: Copy the HTML file from Wikipedia to my server thus avoiding the cross domain issues. The YQL platform provides a single endpoint service that enables developers to query, filter and combine data across Yahoo! SELECT * FROM html WHERE url=" AND xpath="//table[@class='wikitable sortable']"
Search for Craft Beers on Tap - San Diego - Tap Hunter Gist Your Watchlist: Songs From MP3 & Music Blogs and Artist Searches / The Hype Machine Xpath Content scrap avec YQL | Actualités | Tour du Web | NGCTW | Nothing's Gonna Change The World Nous parlions hier du projet de webharvest que nous mettions sur les rails. Nous nous étions tourné vers le Xpath des éléments d'une page pour le scraper. Alors j'ai commencé à me documenter sur les outils existant pour basculer un fichier html vers de l'xml valide pour utiliser les commandes xpath. Puis je suis tombé sur un tuto YQL ! kesako YQL? Il s'agit tout simplement d'un web service proposé par Yahoo (une fois de plus) qui signifie Yahoo! Comment scraper du contenu avec YQL ? Simple comme bonjour ! Si vous utilisez firefox installer (si ce n'est pas déjà le cas) l'extension Firebug.Choisissez l'élément de la page qui vous intéresse. Un exemple de webharvest via Xpath et YQL Je souhaite voler consulter le contenu de manière originale de la page suivante : Ce qui m'intéresse est contenu dans la div qui a pour id "post-3021".Son Xpath est : html/bodydiv[@id=\'mainColumn\']/div[@id=\'post-3021\'] J'explique.
Wherevent.com Reader - Hammerhead's shared items Listorious: Twitter people search and lists directory Yahoo Pipes : cela sera probablement un must Figurez-vous que Jeudi dernier, une petite moité des "Web 2.0 guys français" qui ont participé à notre voyage d'étude en juin dernier aux USA, se sont retrouvés pour un dîner sympa dans un restaurant du 17ème à Paris... (à noter que le 10 juillet dernier nous avons fait une réunion de debriefing au siège de l'Union des Annonceurs pour ceux qui ne sont pas venu : un monde fou...) Avant le dîner donc, Bertrand Jonquois de Yahoo, nous avait invité à un apéro sur la terrasse de son immeuble (il avait commandé le soleil...). Trés agréable... Et en plus, je l'avais tanné pour qu'il nous fasse une petite démo de Yahoo Pipes... Ce qu'il a fait...La chose m'a paru des plus intéressantes... Remarquable... Pipes se base sur le RSS... Et cela peut s'appliquer à beaucoup de choses... de la recherche d'un logement dans une zone donnée, au suivi des nouveaux bouquins parus sur le Web 2.0, ou encore récolter au jour le jour toutes les news intéressantes sur le livre électronique...
Dizigot - An Open web Read Top Rated Blog Posts at Regator.com Dashboard Everything
Hm, on retrouve toujours les memes au meme endroit :-)) 1 croissant que'on voit arriver le wallen ici dès qu'il revient de vacances ! by PED Oct 22