macloo · April 1, 2019 13:23 · macloo · Apr 1, 2019
diff --git a/get_all_agency_urls.py b/get_all_agency_urls.py
 from urllib.request import urlopen
 from bs4 import BeautifulSoup
 from selenium import webdriver
 import time
 import csv

 driver = webdriver.Chrome('/Users/mcadams/Documents/python/scraping2019/chromedriver')
 driver.get('https://www.usa.gov/federal-agencies')

 # pause because page is slow to load
 time.sleep(5)

 html = driver.page_source
 bs = BeautifulSoup(html, "html5lib")

 # close automated chrome
 driver.quit()

 # get all a elements and test by printing
 letter_list = bs.find('ul', {'class':'az-list group'})
 letter_urls = letter_list.find_all('a')

 print(len(letter_urls))
 print(letter_urls[0])
 print(letter_urls[12])
	from urllib.request import urlopen
	from bs4 import BeautifulSoup
	from selenium import webdriver
	import time
	import csv

	driver = webdriver.Chrome('/Users/mcadams/Documents/python/scraping2019/chromedriver')
	driver.get('https://www.usa.gov/federal-agencies')

	# pause because page is slow to load
	time.sleep(5)

	html = driver.page_source
	bs = BeautifulSoup(html, "html5lib")

	# close automated chrome
	driver.quit()

	# get all a elements and test by printing
	letter_list = bs.find('ul', {'class':'az-list group'})
	letter_urls = letter_list.find_all('a')

	print(len(letter_urls))
	print(letter_urls[0])
	print(letter_urls[12])
No results found