p3t3r67x0 · January 26, 2017 21:31
diff --git a/extract_links.py b/extract_links.py
 #!/usr/bin/env python

 import sys
 from lxml import html

 def main():
 	filename = sys.argv[1]

 	with open(filename, 'rb') as f:
 		lines = f.readlines()

 	line = ','.join(lines)
 	str = html.document_fromstring(line)
 	x = str.xpath('//a/@href')

 	with open('urls.txt', 'wb') as f:
 		for i in x:
 			f.write('{}\n'.format(i))

 if __name__ == '__main__':
 	main()
	#!/usr/bin/env python

	import sys
	from lxml import html

	def main():
	filename = sys.argv[1]

	with open(filename, 'rb') as f:
	lines = f.readlines()

	line = ','.join(lines)
	str = html.document_fromstring(line)
	x = str.xpath('//a/@href')

	with open('urls.txt', 'wb') as f:
	for i in x:
	f.write('{}\n'.format(i))

	if __name__ == '__main__':
	main()