ShadowKyogre · February 17, 2015 04:03
diff --git a/gen_article_names.py b/gen_article_names.py
 from lxml import etree

 cards="http://yugioh.wikia.com/api.php?format=xml&action=query&list=categorymembers&cmtitle=Category:OCG_cards&cmprop=title&cmlimit=5000"

 ignore=set(["List of unnamed cards", "List of unseen cards"])

 cmcontinue=""
 titles=[]
 querycount=1

 while cmcontinue is not None:
 	xmltree=None
 	print("--- page {} ---".format(querycount))
 	if cmcontinue is not None and cmcontinue != "":
 		xmltree=etree.parse("{}&cmcontinue={}".format(cards, cmcontinue)).getroot()
 	elif cmcontinue == "":
 		xmltree=etree.parse(cards).getroot()
 	for title in xmltree.iter("cm"):
 		if title.attrib["title"] in ignore: continue
 		print(title.attrib["title"])
 		titles.append("{}\n".format(title.attrib["title"]))
 	got_something = False
 	for durp in xmltree.iter("query-continue"):
 		for hurp in durp.iter("categorymembers"):
 			cmcontinue = hurp.attrib["cmcontinue"]
 			querycount+=1
 			got_something = True
 	if not got_something:
 		cmcontinue=None

 with open("articles.txt", mode='w', encoding="utf-8") as f:
 	f.writelines(titles)
	from lxml import etree

	cards="http://yugioh.wikia.com/api.php?format=xml&action=query&list=categorymembers&cmtitle=Category:OCG_cards&cmprop=title&cmlimit=5000"

	ignore=set(["List of unnamed cards", "List of unseen cards"])

	cmcontinue=""
	titles=[]
	querycount=1

	while cmcontinue is not None:
	xmltree=None
	print("--- page {} ---".format(querycount))
	if cmcontinue is not None and cmcontinue != "":
	xmltree=etree.parse("{}&cmcontinue={}".format(cards, cmcontinue)).getroot()
	elif cmcontinue == "":
	xmltree=etree.parse(cards).getroot()
	for title in xmltree.iter("cm"):
	if title.attrib["title"] in ignore: continue
	print(title.attrib["title"])
	titles.append("{}\n".format(title.attrib["title"]))
	got_something = False
	for durp in xmltree.iter("query-continue"):
	for hurp in durp.iter("categorymembers"):
	cmcontinue = hurp.attrib["cmcontinue"]
	querycount+=1
	got_something = True
	if not got_something:
	cmcontinue=None

	with open("articles.txt", mode='w', encoding="utf-8") as f:
	f.writelines(titles)
No results found