ktnyt · November 3, 2017 08:32
diff --git a/pickleTinyImageNet.py b/pickleTinyImageNet.py
 #!/usr/bin/env python
 import numpy as np
 from PIL import Image
 import six.moves.cPickle as pickle

 wnids = map(lambda x: x.strip(), open('wnids.txt').readlines())

 data = {}
 data['train'] = {}
 data['train']['data'] = np.ndarray(shape=(100000, 3, 64, 64), dtype=np.uint8)
 data['train']['target'] = np.ndarray(shape=(100000,), dtype=np.uint8)
 data['val'] = {}
 data['val']['data'] = np.ndarray(shape=(10000, 3, 64, 64), dtype=np.uint8)
 data['val']['target'] = np.ndarray(shape=(10000,), dtype=np.uint8)

 for i in xrange(len(wnids)):
    wnid = wnids[i]
    print "{}: {} / {}".format(wnid, i + 1, len(wnids))
    for j in xrange(500):
        path = "train/{0}/images/{0}_{1}.JPEG".format(wnid, j)
        data['train']['data'][i * 500 + j] = np.asarray(Image.open(path).convert('RGB')).transpose(2, 0, 1)
        data['train']['target'][i * 500 + j] = i


 for i, line in enumerate(map(lambda s: s.strip(), open('val/val_annotations.txt'))):
    name, wnid = line.split('\t')[0:2]
    path = "val/images/{0}".format(name)
    data['val']['data'][i] = np.asarray(Image.open(path).convert('RGB')).transpose(2, 0, 1)
    data['val']['target'][i] = wnids.index(wnid)

 print "Dump to train.pkl..."
 pickle.dump(data, open('tiny_imagenet.pkl', 'wb', -1))
	#!/usr/bin/env python
	import numpy as np
	from PIL import Image
	import six.moves.cPickle as pickle

	wnids = map(lambda x: x.strip(), open('wnids.txt').readlines())

	data = {}
	data['train'] = {}
	data['train']['data'] = np.ndarray(shape=(100000, 3, 64, 64), dtype=np.uint8)
	data['train']['target'] = np.ndarray(shape=(100000,), dtype=np.uint8)
	data['val'] = {}
	data['val']['data'] = np.ndarray(shape=(10000, 3, 64, 64), dtype=np.uint8)
	data['val']['target'] = np.ndarray(shape=(10000,), dtype=np.uint8)

	for i in xrange(len(wnids)):
	wnid = wnids[i]
	print "{}: {} / {}".format(wnid, i + 1, len(wnids))
	for j in xrange(500):
	path = "train/{0}/images/{0}_{1}.JPEG".format(wnid, j)
	data['train']['data'][i * 500 + j] = np.asarray(Image.open(path).convert('RGB')).transpose(2, 0, 1)
	data['train']['target'][i * 500 + j] = i


	for i, line in enumerate(map(lambda s: s.strip(), open('val/val_annotations.txt'))):
	name, wnid = line.split('\t')[0:2]
	path = "val/images/{0}".format(name)
	data['val']['data'][i] = np.asarray(Image.open(path).convert('RGB')).transpose(2, 0, 1)
	data['val']['target'][i] = wnids.index(wnid)

	print "Dump to train.pkl..."
	pickle.dump(data, open('tiny_imagenet.pkl', 'wb', -1))