파이콘에서 "케이블 영화 채널 편성표 수집하기" 세션 잘 들었습니다. (세션 페이지)
이는 페이징와 화면 렌더링 처리가 javascript로 되어있기 때문 여러 채널 수집에 Selenium을 쓰셨더라구요.
이 부분에 대해 requests를 통해 처리하는 샘플코드를 간략하게나마 작성해봤습니다.
참고한 세션 코드 저장소 : https://github.com/rubysoho07/MovieScheduler/blob/master/scheduler_core/tests.py
아래 소스코드를 참고해서, requests를 통해 보다 효율적으로 페이징 크롤링을 해보세요.
필요한 라이브러리 설치
pip install requests demjson
By AskDjango
여러분의 파이썬/장고 페이스메이커가 되겠습니다.
- 페이스북 그룹 그룹을 통해 파이썬/장고 궁금증을 해결해가세요.
- About
- 크롤링 차근차근 시작하기 VOD
- 이 외에도 다양한 AskDjango VOD가 있습니다.