import requests
import bs4
from pprint import pprint
url = "http://movie.naver.com/movie/bi/mi/pointWriteFormList.nhn?code=140695&type=after&isActualPointWriteExecute=false&isMileageSubscriptionAlready=false&isMileageSubscriptionReject=false"
def find_div(bs, class_name):
return bs.find("div", {"class": class_name})
find_score = lambda bs: find_div(bs, "star_score").get_text().strip()
find_review = lambda bs: find_div(bs, "score_reple").find("p").get_text().strip()
data = requests.get(url).text
bs = bs4.BeautifulSoup(data)
results = find_div(bs, "score_result").find_all("li")
results = [(find_score(l), find_review(l)) for l in results]
pprint(results)
[('10',
'BEST유해진이라는 배우가 실력이 없어서 조연의 역할을 맡는게 아니라는걸 여실하게 보여준 작품. 앞으로도 주연의 위치에서 연기하는 '
'모습을 좀 더 보고싶다.'),
('9',
'BEST최근 본 영화 중에 코믹 요소가 잘 맞았고 배우에 비해 재밌었는데 평점 왜이러죠???? 아수라보다 최소 10배 재밌는데 개연성도 '
'충분했다고 생각되는데요'),
('10', 'BEST관람객이혼위기로 우울했는데 잠시나마 잊게해준영화'),
('10', 'BEST관람객대박 완전 신나게ㅋㅋ 진짜 빵빵터지는 영화ㅋ'),
('10', 'BEST관람객엄마랑 보고왓는ㄷㅔ 웃다가 실신할 뻔 ㅋㅋㅋㅋ 엄마가 유해진 짱팬됨'),
('10', '유료시사회 진짜재밋게봤는데 평점이왜이래ㅋㅋ진짜 간만에 영화 편하게재밋게봄ㅋㅋ추천!'),
('10', '관람객존잼존잼전잼존잼잼존잼'),
('10', '아수라보다 10배 재미있고 개연성도 있음. 재미있음.'),
('9', '관람객너무 재밌게 잘 봤어요!!'),
('10', '쩌는뎅ㅋ 재미없다고 이게? ㅋㅋ')]