nenodias · October 10, 2017 14:16
diff --git a/crowler_vimeo.py b/crowler_vimeo.py
 """ CrowlerVimeo."""
 import json
 import mechanicalsoup

 BROWSER = mechanicalsoup.StatefulBrowser(
    soup_config={'features': 'lxml'},
    raise_on_404=True,
    user_agent='MyBot/0.1: mysite.example.com/bot_info',
 )

 PREFIXO = 'https://vimeo.com'

 lista = []

 for page in range(5, 0, -1):
    BROWSER.open('https://vimeo.com/album/3493175/page:{0}/sort:date/format:thumbnail'.format(page))
    page = BROWSER.get_current_page()
    messages = page.find('ol', class_='browse_videos')
    lista_pagina = []
    if messages != None:
        items = messages.findAll('li')
        for item in items:
            link = item.find('a')
            if link:
                title = link.attrs['title']
                href = link.attrs['href']
                print(title)
                print(href)
                lista_pagina.append({"title":title, "href": PREFIXO+href})
    lista_pagina.reverse()
    lista.extend(lista_pagina)

 with open('saida.json', 'w') as f:
    f.write(json.dumps(lista))
	""" CrowlerVimeo."""
	import json
	import mechanicalsoup

	BROWSER = mechanicalsoup.StatefulBrowser(
	soup_config={'features': 'lxml'},
	raise_on_404=True,
	user_agent='MyBot/0.1: mysite.example.com/bot_info',
	)

	PREFIXO = 'https://vimeo.com'

	lista = []

	for page in range(5, 0, -1):
	BROWSER.open('https://vimeo.com/album/3493175/page:{0}/sort:date/format:thumbnail'.format(page))
	page = BROWSER.get_current_page()
	messages = page.find('ol', class_='browse_videos')
	lista_pagina = []
	if messages != None:
	items = messages.findAll('li')
	for item in items:
	link = item.find('a')
	if link:
	title = link.attrs['title']
	href = link.attrs['href']
	print(title)
	print(href)
	lista_pagina.append({"title":title, "href": PREFIXO+href})
	lista_pagina.reverse()
	lista.extend(lista_pagina)

	with open('saida.json', 'w') as f:
	f.write(json.dumps(lista))