ralphbean · January 15, 2022 23:43 · ghost · Jan 1, 2020
diff --git a/flickr-scraper.py b/flickr-scraper.py
 #!/usr/bin/env python
 """ Script to scrape images from a flickr account.

 Author: Ralph Bean <rbean@redhat.com>
 """

 import ConfigParser
 import urllib
 import requests

 # Get config secrets from a file
 config = ConfigParser.ConfigParser()
 config.read(['flickr.ini', '/etc/flickr.ini'])
 flickr_api_key = config.get('general', 'flickr_api_key')

 # API urls
 flickr_url = 'https://api.flickr.com/services/rest/'


 def flickr_request(**kwargs):
    response = requests.get(flickr_url, params=dict(
        api_key=flickr_api_key,
        format='json',
        nojsoncallback=1,
        **kwargs))
    return response.json()


 def get_flickr_page(nsid, page=1):
    return flickr_request(
        method='flickr.people.getPhotos',
        user_id=nsid,
        content_type=1,  # photos only
        page=page,
    )


 def get_photos_for_person(nsid):
    pages = get_flickr_page(nsid)['photos']['pages']

    seen = {}
    # Step backwards through the pictures
    for page in range(pages, 1, -1):
        d = get_flickr_page(nsid, page=page)
        for photo in d['photos']['photo']:
            yield photo


 def main():

    nsid = raw_input("NSID of the flickr user you want to scrape: ")

    # First get all photos
    # https://secure.flickr.com/services/api/flickr.people.getPhotos.html
    photos = get_photos_for_person(nsid)

    # Then, with photo objects, get the images
    # https://secure.flickr.com/services/api/misc.urls.html
    # Each of these photo objects looks something like this
    # {u'farm': 8,
    #  u'id': u'13606821584',
    #  u'isfamily': 0,
    #  u'isfriend': 0,
    #  u'ispublic': 1,
    #  u'owner': u'65490292@N04',
    #  u'secret': u'c5bfa5eb3e',
    #  u'server': u'7171',
    #  u'title': u''}

    output = 'flickr/'
    prefix = "http://farm{farm}.staticflickr.com/{server}/"
    suffix = "{id}_{secret}_b.jpg"
    template = prefix + suffix

    for i, photo in enumerate(photos):
        url = template.format(**photo)
        index = "%0.6i" % i
        local = output + index + "-" + suffix.format(**photo)
        print "* saving", url
        urllib.urlretrieve(url, local)
        print "      as", local


 if __name__ == '__main__':
    main()
diff --git a/flickr.ini b/flickr.ini
 [general]

 flickr_api_key = put-your-api-key-here
	#!/usr/bin/env python
	""" Script to scrape images from a flickr account.

	Author: Ralph Bean <rbean@redhat.com>
	"""

	import ConfigParser
	import urllib
	import requests

	# Get config secrets from a file
	config = ConfigParser.ConfigParser()
	config.read(['flickr.ini', '/etc/flickr.ini'])
	flickr_api_key = config.get('general', 'flickr_api_key')

	# API urls
	flickr_url = 'https://api.flickr.com/services/rest/'


	def flickr_request(**kwargs):
	response = requests.get(flickr_url, params=dict(
	api_key=flickr_api_key,
	format='json',
	nojsoncallback=1,
	**kwargs))
	return response.json()


	def get_flickr_page(nsid, page=1):
	return flickr_request(
	method='flickr.people.getPhotos',
	user_id=nsid,
	content_type=1, # photos only
	page=page,
	)


	def get_photos_for_person(nsid):
	pages = get_flickr_page(nsid)['photos']['pages']

	seen = {}
	# Step backwards through the pictures
	for page in range(pages, 1, -1):
	d = get_flickr_page(nsid, page=page)
	for photo in d['photos']['photo']:
	yield photo


	def main():

	nsid = raw_input("NSID of the flickr user you want to scrape: ")

	# First get all photos
	# https://secure.flickr.com/services/api/flickr.people.getPhotos.html
	photos = get_photos_for_person(nsid)

	# Then, with photo objects, get the images
	# https://secure.flickr.com/services/api/misc.urls.html
	# Each of these photo objects looks something like this
	# {u'farm': 8,
	# u'id': u'13606821584',
	# u'isfamily': 0,
	# u'isfriend': 0,
	# u'ispublic': 1,
	# u'owner': u'65490292@N04',
	# u'secret': u'c5bfa5eb3e',
	# u'server': u'7171',
	# u'title': u''}

	output = 'flickr/'
	prefix = "http://farm{farm}.staticflickr.com/{server}/"
	suffix = "{id}_{secret}_b.jpg"
	template = prefix + suffix

	for i, photo in enumerate(photos):
	url = template.format(**photo)
	index = "%0.6i" % i
	local = output + index + "-" + suffix.format(**photo)
	print "* saving", url
	urllib.urlretrieve(url, local)
	print " as", local


	if __name__ == '__main__':
	main()
No results found