philshem · September 23, 2022 17:38
diff --git a/get_amazon_page.py b/get_amazon_page.py
 # Add links to urllist for more pages. 
 # Code can be expanded to scrape more.

 import requests
 from bs4 import BeautifulSoup

 urllist = [
 	'http://www.amazon.com/Flash-Boys-Wall-Street-Revolt/dp/0393244660',
 	'http://www.amazon.com/The-Big-Short-Doomsday-Machine/dp/0393338827'
 	]

 for url in urllist:
 	r = requests.get(url)

 	soup = BeautifulSoup(r.text)
 	tmp = ''
 	for line in soup.get_text().split():
 		if line.lower() == 'pages' and tmp.isdigit():
 			print tmp,line, ' - ',soup.html.head.title.text
 		else:
 			tmp = line
	# Add links to urllist for more pages.
	# Code can be expanded to scrape more.

	import requests
	from bs4 import BeautifulSoup

	urllist = [
	'http://www.amazon.com/Flash-Boys-Wall-Street-Revolt/dp/0393244660',
	'http://www.amazon.com/The-Big-Short-Doomsday-Machine/dp/0393338827'
	]

	for url in urllist:
	r = requests.get(url)

	soup = BeautifulSoup(r.text)
	tmp = ''
	for line in soup.get_text().split():
	if line.lower() == 'pages' and tmp.isdigit():
	print tmp,line, ' - ',soup.html.head.title.text
	else:
	tmp = line
No results found