sakage24 · May 31, 2017 10:28
diff --git a/requirements.txt b/requirements.txt
 certifi==2017.4.17
 chardet==3.0.3
 colorama==0.3.9
 cssselect==1.0.1
 Django==1.11.1
 httplib2==0.10.3
 idna==2.5
 image==1.5.5
 lxml==3.7.3
 olefile==0.44
 Pillow==4.1.1
 pytz==2017.2
 requests==2.16.0
 selenium==3.4.2
 urllib3==1.21.1
diff --git a/猿でも出来るhttplib2とlxmlの組み合わせ技 b/猿でも出来るhttplib2とlxmlの組み合わせ技
 # チョー簡単な使い方です。なんかurllibよりhttplib2使ったほうがいいらしいよ。
 # httplib2で接続して、chardetで文字コード取得、取得したデータをlxmlで解析...っていう流れですね。

 import httplib2
 import lxml.html
 import chardet

 # 試しにうちのブログに接続してみる
 http = httplib2.Http('.cache')
 response, content = http.request("http://sakage24.hatenablog.jp/entry/2017/05/26/100420")

 # 文字コード取得
 moji = chardet.detect(content)

 # 取得した文字コードでデコードする
 str_content = content.decode(moji['encoding'])

 # lxmlで扱いやすいように変換する
 root = lxml.html.fromstring(str_content)

 # pタグの全ての要素を表示する
 for p in root.cssselect('p'):
    print(p.text)
	# チョー簡単な使い方です。なんかurllibよりhttplib2使ったほうがいいらしいよ。
	# httplib2で接続して、chardetで文字コード取得、取得したデータをlxmlで解析...っていう流れですね。

	import httplib2
	import lxml.html
	import chardet

	# 試しにうちのブログに接続してみる
	http = httplib2.Http('.cache')
	response, content = http.request("http://sakage24.hatenablog.jp/entry/2017/05/26/100420")

	# 文字コード取得
	moji = chardet.detect(content)

	# 取得した文字コードでデコードする
	str_content = content.decode(moji['encoding'])

	# lxmlで扱いやすいように変換する
	root = lxml.html.fromstring(str_content)

	# pタグの全ての要素を表示する
	for p in root.cssselect('p'):
	print(p.text)
No results found