markuskreitzer · June 3, 2016 16:35
diff --git a/main.py b/main.py
 # coding=utf-8
 import urllib2
 from bs4 import BeautifulSoup

 fortune_500 = 'http://fortune.com/fortune500/2015'
 page = urllib2.urlopen(fortune_500)

 #page = open('boo.html')
 soup = BeautifulSoup(page, 'lxml')

 # This is how I found it and a better way to drill down to it to avoid generic class names.
 #print soup.prettify()
 #results = soup.find_all("div", {"class": "company-franchise-result-content current"})[0]
 #for list_item in results.find_all("li",{"class": "company-list-item icon-new-right-arrow"}):
 #    print list_item.find("span", {"class": "company-name"}).text

 # This is a quick and dirty way.
 companies = [list_item.text for list_item in soup.find_all("span",{"class":"company-name"})]

 print companies

 # Or pretty
 #for company in companies:
 #    print company
	# coding=utf-8
	import urllib2
	from bs4 import BeautifulSoup

	fortune_500 = 'http://fortune.com/fortune500/2015'
	page = urllib2.urlopen(fortune_500)

	#page = open('boo.html')
	soup = BeautifulSoup(page, 'lxml')

	# This is how I found it and a better way to drill down to it to avoid generic class names.
	#print soup.prettify()
	#results = soup.find_all("div", {"class": "company-franchise-result-content current"})[0]
	#for list_item in results.find_all("li",{"class": "company-list-item icon-new-right-arrow"}):
	# print list_item.find("span", {"class": "company-name"}).text

	# This is a quick and dirty way.
	companies = [list_item.text for list_item in soup.find_all("span",{"class":"company-name"})]

	print companies

	# Or pretty
	#for company in companies:
	# print company