January 28, 2015 13:56
diff --git a/gistfile1.py b/gistfile1.py
 import requests
 import bs4
 import csv

 url = []
 url.append('http://www.ntust.edu.tw/files/40-1000-167-')
 url.append('.php')
 data = []
 tmp = 'title', 'date', 'content'
 data.append(tmp)

 for page in range(7):

    response = requests.get(str(page).join(url))
    soup = bs4.BeautifulSoup(response.content)
    newstitle = soup.select('.M39 .module-ptlist .h5 a')
    newsdate = soup.select('.M39 .module-ptlist .h5 .date')
    newscontent = soup.select('.message p')

    for i in range(len(newstitle)):
        tmp = newstitle[i].text,newsdate[i].text.replace('[',' ').replace(']',' ').strip(),newscontent[i].text
        data.append(tmp)

 f = open("news.csv","w")
 w = csv.writer(f)
 w.writerows(data)
 f.close()
	import requests
	import bs4
	import csv

	url = []
	url.append('http://www.ntust.edu.tw/files/40-1000-167-')
	url.append('.php')
	data = []
	tmp = 'title', 'date', 'content'
	data.append(tmp)

	for page in range(7):

	response = requests.get(str(page).join(url))
	soup = bs4.BeautifulSoup(response.content)
	newstitle = soup.select('.M39 .module-ptlist .h5 a')
	newsdate = soup.select('.M39 .module-ptlist .h5 .date')
	newscontent = soup.select('.message p')

	for i in range(len(newstitle)):
	tmp = newstitle[i].text,newsdate[i].text.replace('[',' ').replace(']',' ').strip(),newscontent[i].text
	data.append(tmp)

	f = open("news.csv","w")
	w = csv.writer(f)
	w.writerows(data)
	f.close()
No results found