NateWeiler · February 9, 2021 08:25
diff --git a/find-hyperlinks.1.sh b/find-hyperlinks.1.sh
 #!/usr/bin/python
 from HTMLParser import HTMLParser
 class MyHTMLParser(HTMLParser):
    def handle_starttag(self, tag, attrs):
        if tag == "a":
           for name, value in attrs:
              if name == "href":
                   print name, "=", value
 parser = MyHTMLParser()
 parser.feed(your_html_string)
diff --git a/find-hyperlinks.py b/find-hyperlinks.py
 #!/usr/bin/python
 from HTMLParser import HTMLParser
 class MyHTMLParser(HTMLParser):
    def handle_starttag(self, tag, attrs):
        if tag == "a":
           for name, value in attrs:
              if name == "href":
                   print name, "=", value
 parser = MyHTMLParser()
 parser.feed(your_html_string)
diff --git a/find-hyperlinks1.py b/find-hyperlinks1.py
 #!/usr/bin/python
 from BeautifulSoup import BeautifulSoup
 import urllib2
 import re

 html_page = urllib2.urlopen("http://example.com/example.html")
 soup = BeautifulSoup(html_page)
 for link in soup.findAll('a'):
    print link.get('href')
diff --git a/find-hyperlinks2.py b/find-hyperlinks2.py
 #!/usr/bin/python
 #-*- coding: utf-8 -*-
 # usage ./find_hyperlinks.py "https://example.com/example.txt"
 import os
 import sys
 import wget
 from BeautifulSoup import BeautifulSoup
 sys.setdefaultencoding('UTF8')
 url = sys.argv[1]
 filename = os.path.basename(url)
 soup = BeautifulSoup(filename)
 for tag in soup.findAll('a', href=True):
  print(str(tag['href']))
	#!/usr/bin/python
	from HTMLParser import HTMLParser
	class MyHTMLParser(HTMLParser):
	def handle_starttag(self, tag, attrs):
	if tag == "a":
	for name, value in attrs:
	if name == "href":
	print name, "=", value
	parser = MyHTMLParser()
	parser.feed(your_html_string)
	#!/usr/bin/python
	from BeautifulSoup import BeautifulSoup
	import urllib2
	import re

	html_page = urllib2.urlopen("http://example.com/example.html")
	soup = BeautifulSoup(html_page)
	for link in soup.findAll('a'):
	print link.get('href')
	#!/usr/bin/python
	#-- coding: utf-8 --
	# usage ./find_hyperlinks.py "https://example.com/example.txt"
	import os
	import sys
	import wget
	from BeautifulSoup import BeautifulSoup
	sys.setdefaultencoding('UTF8')
	url = sys.argv[1]
	filename = os.path.basename(url)
	soup = BeautifulSoup(filename)
	for tag in soup.findAll('a', href=True):
	print(str(tag['href']))