lrvick · March 1, 2012 03:54
diff --git a/hnscrape.py b/hnscrape.py
 from scrapy.http import Request
 from scrapy.spider import BaseSpider
 from scrapy.selector import HtmlXPathSelector

 class HackernewsSpider(BaseSpider):
  name = 'hackernews'
  allowed_domains = []
  start_urls = ['http://news.ycombinator.com']
  def parse(self, response):
    if 'news.ycombinator.com' in response.url:
        hxs = HtmlXPathSelector(response)
        titles = sites = hxs.select('//td[@class="title"]//a/text()')
        for title in titles:
            print title.extract()
	from scrapy.http import Request
	from scrapy.spider import BaseSpider
	from scrapy.selector import HtmlXPathSelector

	class HackernewsSpider(BaseSpider):
	name = 'hackernews'
	allowed_domains = []
	start_urls = ['http://news.ycombinator.com']
	def parse(self, response):
	if 'news.ycombinator.com' in response.url:
	hxs = HtmlXPathSelector(response)
	titles = sites = hxs.select('//td[@class="title"]//a/text()')
	for title in titles:
	print title.extract()
No results found