james-prickett · March 6, 2011 18:12
diff --git a/imdb_scrapper.py b/imdb_scrapper.py
 from lxml.html import parse

 class ImdbService(object):

    def get_ids_from_page(self, url):
        
        ids = []
        links = parse(url).xpath('//a/@href[contains(.,"/title/")]')
        for link in links:
            ids.append(link[len('/title/'):len(link) - 1])
                
        return ids
	from lxml.html import parse

	class ImdbService(object):

	def get_ids_from_page(self, url):

	ids = []
	links = parse(url).xpath('//a/@href[contains(.,"/title/")]')
	for link in links:
	ids.append(link[len('/title/'):len(link) - 1])

	return ids
No results found