treethought · May 22, 2018 14:20 · slavakurilyak · May 22, 2018
diff --git a/scan.py b/scan.py
 import os
 import sys
 import re
 import click
 import subprocess

 def get_py_files(dir):
    for dirname, dirnames, filenames in os.walk(dir):
        # path to all subdirectories first.
        for subdirname in dirnames:
            get_py_files(subdirname)
            pass

        # print path to all filenames.
        for filename in filenames:
            if os.path.splitext(filename)[1] == '.py':
                # print('Checking {}'.format(filename))
                yield os.path.join(dirname, filename)


        # Advanced usage:
        # editing the 'dirnames' list will stop os.walk() from recursing into there.
        if '.git' in dirnames:
            # don't go into any .git directories.
            dirnames.remove('.git')
        if 'tests' in dirnames:
            # don't go into any .git directories.
            dirnames.remove('tests')



 def scan_file(path):
    with open(path, 'r') as f:
        for line in [l.rstrip() for l in f]:
            for pkg in parse_line(line):
                yield pkg


 def parse_simple_import(line):
    names = line.split('import ')[1]
    name_list = names.split(', ')

    for pkg in name_list:
        first_string = re.findall('\w+', pkg)[0] # in case of ";"
        package = first_string.split('.')[0]
        yield package


 def parse_from_statement(line):
    top_import = re.findall('\S*\s+import', line)[0]
    package = top_import.rstrip(' import')
    if package.startswith('.'):
        # relative import
        return

    elif '.' in package:
        package = package.split('.')[0]

    return package

 def parse_line(line):
    packages = []
    try:
        if line.startswith('import'):
            for p in parse_simple_import(line):
                yield p

        if line.startswith('from'):
            p = parse_from_statement(line)
            yield p

    except Exception as e:
        print('SKipping line: {}'.format(line))


 @click.command('scan')
 @click.argument('dirpath')
 def scan_dir(dirpath):
    packages = set()
    for f in get_py_files(dirpath):
        for p in scan_file(f):
            packages.add(p)

    with open('requirements-fetch.txt', 'w') as f:
        for p in packages:
            f.write(str(p) + '\n')


 if __name__ == '__main__':
    scan_dir()
	import os
	import sys
	import re
	import click
	import subprocess

	def get_py_files(dir):
	for dirname, dirnames, filenames in os.walk(dir):
	# path to all subdirectories first.
	for subdirname in dirnames:
	get_py_files(subdirname)
	pass

	# print path to all filenames.
	for filename in filenames:
	if os.path.splitext(filename)[1] == '.py':
	# print('Checking {}'.format(filename))
	yield os.path.join(dirname, filename)


	# Advanced usage:
	# editing the 'dirnames' list will stop os.walk() from recursing into there.
	if '.git' in dirnames:
	# don't go into any .git directories.
	dirnames.remove('.git')
	if 'tests' in dirnames:
	# don't go into any .git directories.
	dirnames.remove('tests')



	def scan_file(path):
	with open(path, 'r') as f:
	for line in [l.rstrip() for l in f]:
	for pkg in parse_line(line):
	yield pkg


	def parse_simple_import(line):
	names = line.split('import ')[1]
	name_list = names.split(', ')

	for pkg in name_list:
	first_string = re.findall('\w+', pkg)[0] # in case of ";"
	package = first_string.split('.')[0]
	yield package


	def parse_from_statement(line):
	top_import = re.findall('\S*\s+import', line)[0]
	package = top_import.rstrip(' import')
	if package.startswith('.'):
	# relative import
	return

	elif '.' in package:
	package = package.split('.')[0]

	return package

	def parse_line(line):
	packages = []
	try:
	if line.startswith('import'):
	for p in parse_simple_import(line):
	yield p

	if line.startswith('from'):
	p = parse_from_statement(line)
	yield p

	except Exception as e:
	print('SKipping line: {}'.format(line))


	@click.command('scan')
	@click.argument('dirpath')
	def scan_dir(dirpath):
	packages = set()
	for f in get_py_files(dirpath):
	for p in scan_file(f):
	packages.add(p)

	with open('requirements-fetch.txt', 'w') as f:
	for p in packages:
	f.write(str(p) + '\n')


	if __name__ == '__main__':
	scan_dir()