guessi · May 16, 2018 13:18
diff --git a/extract-line-add-friend-links-from-urls.py b/extract-line-add-friend-links-from-urls.py
 #!/usr/bin/env python3

 import re

 from bs4 import BeautifulSoup
 from requests import get
 from sys import stdin

 scanned_urls = []


 def loop_search(match=None, depth=0):
    for url in list(set([i.attrs["href"] for i in match])):
        search = re.compile(r'https?:\/\/line.me').search(url)
        if search == None:
            extract_lineat(url, depth)


 def extract_lineat(url, depth=0):
    if url in scanned_urls:
        return
    else:
        scanned_urls.append(url)

    print('==> processing: {0}'.format(url.strip()))

    soup = BeautifulSoup(get(url.strip()).text, 'html.parser')

    # pattern for the line@ links
    m1 = soup.select('a["href^=line://ti/p/"]')
    m2 = soup.select('a[href^="https://line.me/R/ti/p/"]')
    m3 = soup.select('a[href^="http://line.me/R/ti/p/"]')

    [print(i.rsplit('/', 1)[1].replace('%40', '@'))
        for i in list(set([i.attrs["href"]
            for i in (m1 + m2 + m3)]))]

    # find all normal urls
    http_urls = soup.select('a[href^="http"]')

    # search with finite loop
    depth += 1
    if depth < 3:
        loop_search(http_urls, depth)


 for url in stdin.readlines():
    extract_lineat(url, 0)
	#!/usr/bin/env python3

	import re

	from bs4 import BeautifulSoup
	from requests import get
	from sys import stdin

	scanned_urls = []


	def loop_search(match=None, depth=0):
	for url in list(set([i.attrs["href"] for i in match])):
	search = re.compile(r'https?:\/\/line.me').search(url)
	if search == None:
	extract_lineat(url, depth)


	def extract_lineat(url, depth=0):
	if url in scanned_urls:
	return
	else:
	scanned_urls.append(url)

	print('==> processing: {0}'.format(url.strip()))

	soup = BeautifulSoup(get(url.strip()).text, 'html.parser')

	# pattern for the line@ links
	m1 = soup.select('a["href^=line://ti/p/"]')
	m2 = soup.select('a[href^="https://line.me/R/ti/p/"]')
	m3 = soup.select('a[href^="http://line.me/R/ti/p/"]')

	[print(i.rsplit('/', 1)[1].replace('%40', '@'))
	for i in list(set([i.attrs["href"]
	for i in (m1 + m2 + m3)]))]

	# find all normal urls
	http_urls = soup.select('a[href^="http"]')

	# search with finite loop
	depth += 1
	if depth < 3:
	loop_search(http_urls, depth)


	for url in stdin.readlines():
	extract_lineat(url, 0)
No results found