farooqkz · November 6, 2020 19:22 · farooqkz · Oct 31, 2020
diff --git a/clean_html.py b/clean_html.py
 # Code by Farooq Karimi Zadeh <[email protected]>
 # Under CC0 1.0

 from html.parser import HTMLParser

 class MyParser(HTMLParser):
    def handle_starttag(self, tag, attrs):
        attrs = dict(attrs)
        if tag == "img":
            src = attrs["src"] if "src" in attrs else ""
            print(f"<img src='{src}'>")
        if tag == "a":
            href = attrs["href"] if "href" in attrs else ""
            print(f"<a href='{href}'>")
        if tag != "div":
            print(f"<{tag}>")
    
    def handle_data(self, data):
        print(data)

    def handle_endtag(self, tag):
        if tag != "div":
            print(f"</{tag}>")

 parser = MyParser()
 parser.feed(input())
	# Code by Farooq Karimi Zadeh <[email protected]>
	# Under CC0 1.0

	from html.parser import HTMLParser

	class MyParser(HTMLParser):
	def handle_starttag(self, tag, attrs):
	attrs = dict(attrs)
	if tag == "img":
	src = attrs["src"] if "src" in attrs else ""
	print(f"<img src='{src}'>")
	if tag == "a":
	href = attrs["href"] if "href" in attrs else ""
	print(f"<a href='{href}'>")
	if tag != "div":
	print(f"<{tag}>")

	def handle_data(self, data):
	print(data)

	def handle_endtag(self, tag):
	if tag != "div":
	print(f"</{tag}>")

	parser = MyParser()
	parser.feed(input())