ccbikai · December 31, 2019 12:15
diff --git a/unsplash.py b/unsplash.py
 # -*- coding: utf-8 -*-
 import sys
 reload(sys)
 sys.setdefaultencoding('utf-8')

 # unsplash 全站下载脚本
 # 请先安装 requests ，BeautifulSoup
 # pip install requests beautifulsoup4
 # 运行 python unsplash.py
 # 输入最小页数和最大页数

 import os
 import requests
 from bs4 import BeautifulSoup	

 def unsplash(page):
 	headers = {
 	'Accept':'*/*; q=0.01',
 	'Accept-Encoding':'gzip,deflate',
 	'Accept-Language':'zh-CN,zh;q=0.8,en-US;q=0.6,en;q=0.4',
 	'Cache-Control':'no-cache',
 	'Connection':'keep-alive',
 	'Referer':'https://unsplash.com/?page={0}'.format(page),
 	'User-Agent':'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/37.0.2062.102 Safari/537.36'
 	}
 	r = requests.get('https://unsplash.com/?page={0}'.format(page),headers=headers)
 	print '爬取第{0}页成功'.format(page)
 	soup = BeautifulSoup(r.text)
 	urls = soup.select('.photo a')
 	pics = []
 	for url in urls:
 		pics.append(url.get('href'))
 	return pics
 	
 def download(pic):
 	headers = {
 	'Accept':'*/*; q=0.01',
 	'Accept-Encoding':'gzip,deflate',
 	'Accept-Language':'zh-CN,zh;q=0.8,en-US;q=0.6,en;q=0.4',
 	'Cache-Control':'no-cache',
 	'Connection':'keep-alive',
 	'Referer':'https://unsplash.com/',
 	'User-Agent':'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/37.0.2062.102 Safari/537.36'
 	}
 	id = pic.split('/')[-2]
 	print '开始下载图片 https://unsplash.com/photos/{0}/download'.format(id)
 	with open('unsplash/{0}.jpg'.format(id), 'wb') as f:
 		f.write(requests.get('https://unsplash.com/photos/{0}/download'.format(id),headers = headers).content)
 	
 def main():
 	minpage = int(raw_input("请输入最小页数（如 1 ）："))
 	maxpage = int(raw_input("请输入最大页数（如 47 ）："))+1
 	for page in range(minpage,maxpage):
 		pics = unsplash(page)
 		for pic in pics:
 			download(pic)
 	print 'OK'

 def mkdir(path): 
    # 去除首位空格
    path=path.strip()
    # 去除尾部 \ 符号
    path=path.rstrip("\\")
 
    # 判断路径是否存在
    # 存在     True
    # 不存在   False
    isExists=os.path.exists(path)
 
    # 判断结果
    if not isExists:
        # 如果不存在则创建目录
        print path+' 创建成功'
        # 创建目录操作函数
        os.makedirs(path)
        return True
    else:
        # 如果目录存在则不创建，并提示目录已存在
        print path+' 目录已存在'
        return False

 if __name__ == "__main__":
 	mkdir('unsplash')
 	main()
	# -- coding: utf-8 --
	import sys
	reload(sys)
	sys.setdefaultencoding('utf-8')

	# unsplash 全站下载脚本
	# 请先安装 requests ，BeautifulSoup
	# pip install requests beautifulsoup4
	# 运行 python unsplash.py
	# 输入最小页数和最大页数

	import os
	import requests
	from bs4 import BeautifulSoup

	def unsplash(page):
	headers = {
	'Accept':'/; q=0.01',
	'Accept-Encoding':'gzip,deflate',
	'Accept-Language':'zh-CN,zh;q=0.8,en-US;q=0.6,en;q=0.4',
	'Cache-Control':'no-cache',
	'Connection':'keep-alive',
	'Referer':'https://unsplash.com/?page={0}'.format(page),
	'User-Agent':'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/37.0.2062.102 Safari/537.36'
	}
	r = requests.get('https://unsplash.com/?page={0}'.format(page),headers=headers)
	print '爬取第{0}页成功'.format(page)
	soup = BeautifulSoup(r.text)
	urls = soup.select('.photo a')
	pics = []
	for url in urls:
	pics.append(url.get('href'))
	return pics

	def download(pic):
	headers = {
	'Accept':'/; q=0.01',
	'Accept-Encoding':'gzip,deflate',
	'Accept-Language':'zh-CN,zh;q=0.8,en-US;q=0.6,en;q=0.4',
	'Cache-Control':'no-cache',
	'Connection':'keep-alive',
	'Referer':'https://unsplash.com/',
	'User-Agent':'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/37.0.2062.102 Safari/537.36'
	}
	id = pic.split('/')[-2]
	print '开始下载图片 https://unsplash.com/photos/{0}/download'.format(id)
	with open('unsplash/{0}.jpg'.format(id), 'wb') as f:
	f.write(requests.get('https://unsplash.com/photos/{0}/download'.format(id),headers = headers).content)

	def main():
	minpage = int(raw_input("请输入最小页数（如 1 ）："))
	maxpage = int(raw_input("请输入最大页数（如 47 ）："))+1
	for page in range(minpage,maxpage):
	pics = unsplash(page)
	for pic in pics:
	download(pic)
	print 'OK'

	def mkdir(path):
	# 去除首位空格
	path=path.strip()
	# 去除尾部 \ 符号
	path=path.rstrip("\\")

	# 判断路径是否存在
	# 存在 True
	# 不存在 False
	isExists=os.path.exists(path)

	# 判断结果
	if not isExists:
	# 如果不存在则创建目录
	print path+' 创建成功'
	# 创建目录操作函数
	os.makedirs(path)
	return True
	else:
	# 如果目录存在则不创建，并提示目录已存在
	print path+' 目录已存在'
	return False

	if __name__ == "__main__":
	mkdir('unsplash')
	main()