Peterragheb · September 16, 2021 14:25
diff --git a/broken_link_checker.py b/broken_link_checker.py
 import requests
 import time
 from bs4 import BeautifulSoup
 import validators

 def extract_all_links(site):
 	html = requests.get(site).text
 	soup = BeautifulSoup(html, 'html.parser').find_all('a')
 	links = [link.get('href') for link in soup]
 	unique_links = set(links)
 	return unique_links

 site_link = input('Enter URL of the site : ').rstrip("/")
 links = extract_all_links(site_link)

 for link in links:
 	if link.startswith("https://") and site_link not in link:
 		continue
 	if not link.startswith("https://"):
 		link = site_link + link
 	if not validators.url(link):
 		continue
 	r = requests.get(url = link)
 	time.sleep(1)
 	if r.status_code != 200:
 		print(str(r.status_code) + " " + link)
 	else:
  		print("Success "+ link)
	import requests
	import time
	from bs4 import BeautifulSoup
	import validators

	def extract_all_links(site):
	html = requests.get(site).text
	soup = BeautifulSoup(html, 'html.parser').find_all('a')
	links = [link.get('href') for link in soup]
	unique_links = set(links)
	return unique_links

	site_link = input('Enter URL of the site : ').rstrip("/")
	links = extract_all_links(site_link)

	for link in links:
	if link.startswith("https://") and site_link not in link:
	continue
	if not link.startswith("https://"):
	link = site_link + link
	if not validators.url(link):
	continue
	r = requests.get(url = link)
	time.sleep(1)
	if r.status_code != 200:
	print(str(r.status_code) + " " + link)
	else:
	print("Success "+ link)
No results found