karenc · December 21, 2020 16:38 · karenc · Dec 21, 2020
diff --git a/benchmark_urls.py b/benchmark_urls.py
 #!/usr/bin/env python3
 from datetime import datetime
 import glob
 import os
 import pathlib
 import re
 import subprocess
 import sys
 import tempfile
 from urllib.parse import urlparse, urljoin

 root_url = os.getenv('ROOT_URL', 'http://localhost:6868')
 paths = [
    '/api/annot/',
    '/view/',
    '/view/imagesets/',
    '/api/image/',
    '/api/name/',
    '/api/review/',
    '/turk/',
    '/turk/cameratrap/?imgsetid=None',
    '/turk/detection/?imgsetid=None',
    '/turk/annotation/?imgsetid=None',
    '/turk/species/?imgsetid=None',
    '/turk/viewpoint/?imgsetid=None',
    '/turk/viewpoint3/?imgsetid=None',
    '/turk/quality/?imgsetid=None',
    '/turk/demographics/?imgsetid=None',
    '/turk/part/type/?imgsetid=None',
    '/turk/part/contour/?imgsetid=None',
    '/turk/identification/lnbnn/?imgsetid=None',
    '/turk/identification/graph/',
    '/turk/identification/hardcase/',
 ]

 def slugify(url):
    path = urlparse(url).path
    return re.sub('[^A-Za-z0-9%]+', '-', path).strip('-')


 def get_url(path, dirpath):
    url = urljoin(root_url, path)
    fname = '{}.html'.format(os.path.join(dirpath, slugify(url)))
    output = subprocess.check_output(['wget', '-O', fname, url], stderr=subprocess.STDOUT)
    with open('wget.stdout', 'ab') as f:
        f.write(output)
    start_time = None
    for line in output.splitlines():
        line = line.decode('utf-8')
        time = re.search('^-?-?([0-9-]+ [0-9:]+)', line)
        if time:
            last_time = datetime.strptime(time.group(1), '%Y-%m-%d %H:%M:%S')
        elif re.search('awaiting response... [0-9]+', line) and not start_time:
            start_time = last_time
    time_taken = (last_time - start_time).seconds
    msg = '{} {} seconds'.format(url, time_taken)
    if time_taken >=60:
        msg += ' ({} minutes {} seconds)'.format(time_taken // 60, time_taken % 60)
    print(msg)
    with open(fname) as f:
        if 'Traceback' not in f.read():
            pathlib.Path(fname).unlink()


 if __name__ == '__main__':
    print('ROOT_URL={}'.format(root_url))
    dirpath = tempfile.mkdtemp(dir='./')
    for path in paths:
        get_url(path, dirpath)
    if glob.glob('{}/*'.format(dirpath)):
        print('These files need to be checked manually:')
        print('\n'.join(glob.glob('{}/*'.format(dirpath))))
        sys.exit(1)
    else:
        pathlib.Path(dirpath).rmdir()
	#!/usr/bin/env python3
	from datetime import datetime
	import glob
	import os
	import pathlib
	import re
	import subprocess
	import sys
	import tempfile
	from urllib.parse import urlparse, urljoin

	root_url = os.getenv('ROOT_URL', 'http://localhost:6868')
	paths = [
	'/api/annot/',
	'/view/',
	'/view/imagesets/',
	'/api/image/',
	'/api/name/',
	'/api/review/',
	'/turk/',
	'/turk/cameratrap/?imgsetid=None',
	'/turk/detection/?imgsetid=None',
	'/turk/annotation/?imgsetid=None',
	'/turk/species/?imgsetid=None',
	'/turk/viewpoint/?imgsetid=None',
	'/turk/viewpoint3/?imgsetid=None',
	'/turk/quality/?imgsetid=None',
	'/turk/demographics/?imgsetid=None',
	'/turk/part/type/?imgsetid=None',
	'/turk/part/contour/?imgsetid=None',
	'/turk/identification/lnbnn/?imgsetid=None',
	'/turk/identification/graph/',
	'/turk/identification/hardcase/',
	]

	def slugify(url):
	path = urlparse(url).path
	return re.sub('[^A-Za-z0-9%]+', '-', path).strip('-')


	def get_url(path, dirpath):
	url = urljoin(root_url, path)
	fname = '{}.html'.format(os.path.join(dirpath, slugify(url)))
	output = subprocess.check_output(['wget', '-O', fname, url], stderr=subprocess.STDOUT)
	with open('wget.stdout', 'ab') as f:
	f.write(output)
	start_time = None
	for line in output.splitlines():
	line = line.decode('utf-8')
	time = re.search('^-?-?([0-9-]+ [0-9:]+)', line)
	if time:
	last_time = datetime.strptime(time.group(1), '%Y-%m-%d %H:%M:%S')
	elif re.search('awaiting response... [0-9]+', line) and not start_time:
	start_time = last_time
	time_taken = (last_time - start_time).seconds
	msg = '{} {} seconds'.format(url, time_taken)
	if time_taken >=60:
	msg += ' ({} minutes {} seconds)'.format(time_taken // 60, time_taken % 60)
	print(msg)
	with open(fname) as f:
	if 'Traceback' not in f.read():
	pathlib.Path(fname).unlink()


	if __name__ == '__main__':
	print('ROOT_URL={}'.format(root_url))
	dirpath = tempfile.mkdtemp(dir='./')
	for path in paths:
	get_url(path, dirpath)
	if glob.glob('{}/*'.format(dirpath)):
	print('These files need to be checked manually:')
	print('\n'.join(glob.glob('{}/*'.format(dirpath))))
	sys.exit(1)
	else:
	pathlib.Path(dirpath).rmdir()
No results found