rafikahmed · September 29, 2018 11:31
diff --git a/jokes.py b/jokes.py
 import scrapy
 from demo_project.items import JokeItem
 from scrapy.loader import ItemLoader

 class JokesSpider(scrapy.Spider):
    name= 'jokes'

    allowed_domais = ['www.laughfactory.com']

    start_urls = [
        'https://www.laughfactory.com/jokes/family-jokes'
    ]

    def parse(self, response):
        for joke in response.xpath("//div[@class='jokes']"):
            l= ItemLoader(item=JokeItem(), selector=joke)
            l.add_xpath('joke_text', ".//div[@class='joke-text']/p")
            yield l.load_item()
        
        next_page= response.xpath("//li[@class='next']/a/@href").extract_first()
        if next_page is not None:
            next_page_link= response.urljoin(next_page)
            yield scrapy.Request(url=next_page_link, callback=self.parse)
	import scrapy
	from demo_project.items import JokeItem
	from scrapy.loader import ItemLoader

	class JokesSpider(scrapy.Spider):
	name= 'jokes'

	allowed_domais = ['www.laughfactory.com']

	start_urls = [
	'https://www.laughfactory.com/jokes/family-jokes'
	]

	def parse(self, response):
	for joke in response.xpath("//div[@class='jokes']"):
	l= ItemLoader(item=JokeItem(), selector=joke)
	l.add_xpath('joke_text', ".//div[@class='joke-text']/p")
	yield l.load_item()

	next_page= response.xpath("//li[@class='next']/a/@href").extract_first()
	if next_page is not None:
	next_page_link= response.urljoin(next_page)
	yield scrapy.Request(url=next_page_link, callback=self.parse)
No results found