ginrou · April 23, 2019 15:32
diff --git a/unet_segmentation_google_colab b/unet_segmentation_google_colab
 ## empty
diff --git a/unet_segmentation_google_colab.py b/unet_segmentation_google_colab.py
 #!/bin/usr/env python

 import numpy as np
 import os
 import itertools

 from keras.models import Model, load_model
 from keras.layers import Input, BatchNormalization, Activation, Dense, Dropout
 from keras.layers.core import Lambda, RepeatVector, Reshape
 from keras.layers.convolutional import Conv2D, Conv2DTranspose
 from keras.layers.pooling import MaxPooling2D, GlobalMaxPool2D
 from keras.layers.merge import concatenate, add
 from keras.callbacks import EarlyStopping, ModelCheckpoint, ReduceLROnPlateau
 from keras.optimizers import Adam
 from keras.preprocessing.image import ImageDataGenerator, array_to_img, img_to_array, load_img

 class Unet:
    @staticmethod
    def conv2d_block(input, filters, skip_dropout = False, dropout = 0.5, kernel_size=3, batchnorm = True):
        c = Conv2D(filters=filters, kernel_size=(kernel_size, kernel_size), padding="same", kernel_initializer="he_normal")(input)
        if batchnorm:
            c = BatchNormalization()(c)
        c = Activation("relu")(c)

        c = Conv2D(filters=filters, kernel_size=(kernel_size, kernel_size), padding="same", kernel_initializer="he_normal")(c)
        if batchnorm:
            c = BatchNormalization()(c)
        c = Activation("relu")(c)

        if skip_dropout:
            return c
        else:
            p = MaxPooling2D((2,2))(c)
            p = Dropout(dropout)(p)
            return (c, p)

    @staticmethod
    def trans_conv2d_block(input_upsample, input_concat, filters, kernel_size=3, strides=2, dropout=0.5):
        u = Conv2DTranspose(filters, (kernel_size, kernel_size), strides=(strides, strides), padding="same")(input_upsample)
        u = concatenate([u, input_concat])
        u = Dropout(dropout)(u)
        c = Unet.conv2d_block(u, filters, skip_dropout=True)
        return (u,c)


    def __init__(self):
        self.IMG_HEIGHT = 256
        self.IMG_WIDTH = 256
        self.IMG_CHANNELS = 3
        self.NUM_CLASS = 21

        self.FILTER_BASE = 16

        self.input = Input((self.IMG_HEIGHT, self.IMG_WIDTH, self.IMG_CHANNELS))
        c1, p1 = self.conv2d_block(self.input, self.FILTER_BASE * 1)
        c2, p2 = self.conv2d_block(p1, self.FILTER_BASE * 2)
        c3, p3 = self.conv2d_block(p2, self.FILTER_BASE * 4)
        c4, p4 = self.conv2d_block(p3, self.FILTER_BASE * 8)

        c5 = self.conv2d_block(p4, self.FILTER_BASE * 16, skip_dropout=True)

        u6, c6 = self.trans_conv2d_block(c5, c4, self.FILTER_BASE * 8)
        u7, c7 = self.trans_conv2d_block(c6, c3, self.FILTER_BASE * 4)
        u8, c8 = self.trans_conv2d_block(c7, c2, self.FILTER_BASE * 2)
        u9, c9 = self.trans_conv2d_block(c8, c1, self.FILTER_BASE * 1)

        self.output = Conv2D(self.NUM_CLASS, (1,1), activation="sigmoid")(c9)
        self.model = Model(inputs=[self.input], outputs=[self.output])

    def predict(self, input_img): ## input_img will be numpy array which has same shape with self.input
        return self.model.predict(input_img)

    def to_index_color_img(self, predict_result):
        arg_max_img = np.argmax(predict_result, axis=2)
        color_img = np.array(arg_max_img.shape)
        cmap = color_map()


    @staticmethod
    def color_map(N=256, normalized=False):
        def bitget(byteval, idx):
            return ((byteval & (1 << idx)) != 0)

        dtype = 'float32' if normalized else 'uint8'
        cmap = np.zeros((N, 3), dtype=dtype)
        for i in range(N):
            r = g = b = 0
            c = i
            for j in range(8):
                r = r | (bitget(c, 0) << 7-j)
                g = g | (bitget(c, 1) << 7-j)
                b = b | (bitget(c, 2) << 7-j)
                c = c >> 3

            cmap[i] = np.array([r, g, b])

        cmap = cmap/255 if normalized else cmap
        return cmap

 class ImageLoader:

    def crop(self, img, shape):
        W, H = img.size
        X, Y = shape
        top_left = img.crop((0,0,X,Y))
        top_right = img.crop((W-X, 0, W, Y))
        bottom_left = img.crop((0, H-Y, X, H))
        bottom_right = img.crop((W-X, H-Y, W, H))
        center = img.crop(((W-X)/2, (H-Y)/2, (W+X)/2, (H+Y)/2 ))
        return top_left, top_right, bottom_left, bottom_right, center

    def load(self, data_dir, img_size, num_train = 100):
        self.keys = sorted([f[:-4] for f in os.listdir(os.path.join(data_dir, "SegmentationClass"))])
        self.img_path_list = [os.path.join(data_dir, "JPEGImages", k + ".jpg") for k in self.keys]
        self.mask_path_list = [os.path.join(data_dir, "SegmentationClass", k + ".png") for k in self.keys]
        imgs =  list(itertools.chain.from_iterable([ self.crop(load_img(p), img_size) for p in self.img_path_list] ))
        masks = list(itertools.chain.from_iterable([ self.crop(load_img(p), img_size) for p in self.mask_path_list] ))
        self.train_imgs, self.test_imgs = imgs[:-num_train], imgs[:num_train]
        self.train_masks, self.test_masks = masks[:-num_train], masks[:num_train]
	#!/bin/usr/env python

	import numpy as np
	import os
	import itertools

	from keras.models import Model, load_model
	from keras.layers import Input, BatchNormalization, Activation, Dense, Dropout
	from keras.layers.core import Lambda, RepeatVector, Reshape
	from keras.layers.convolutional import Conv2D, Conv2DTranspose
	from keras.layers.pooling import MaxPooling2D, GlobalMaxPool2D
	from keras.layers.merge import concatenate, add
	from keras.callbacks import EarlyStopping, ModelCheckpoint, ReduceLROnPlateau
	from keras.optimizers import Adam
	from keras.preprocessing.image import ImageDataGenerator, array_to_img, img_to_array, load_img

	class Unet:
	@staticmethod
	def conv2d_block(input, filters, skip_dropout = False, dropout = 0.5, kernel_size=3, batchnorm = True):
	c = Conv2D(filters=filters, kernel_size=(kernel_size, kernel_size), padding="same", kernel_initializer="he_normal")(input)
	if batchnorm:
	c = BatchNormalization()(c)
	c = Activation("relu")(c)

	c = Conv2D(filters=filters, kernel_size=(kernel_size, kernel_size), padding="same", kernel_initializer="he_normal")(c)
	if batchnorm:
	c = BatchNormalization()(c)
	c = Activation("relu")(c)

	if skip_dropout:
	return c
	else:
	p = MaxPooling2D((2,2))(c)
	p = Dropout(dropout)(p)
	return (c, p)

	@staticmethod
	def trans_conv2d_block(input_upsample, input_concat, filters, kernel_size=3, strides=2, dropout=0.5):
	u = Conv2DTranspose(filters, (kernel_size, kernel_size), strides=(strides, strides), padding="same")(input_upsample)
	u = concatenate([u, input_concat])
	u = Dropout(dropout)(u)
	c = Unet.conv2d_block(u, filters, skip_dropout=True)
	return (u,c)


	def __init__(self):
	self.IMG_HEIGHT = 256
	self.IMG_WIDTH = 256
	self.IMG_CHANNELS = 3
	self.NUM_CLASS = 21

	self.FILTER_BASE = 16

	self.input = Input((self.IMG_HEIGHT, self.IMG_WIDTH, self.IMG_CHANNELS))
	c1, p1 = self.conv2d_block(self.input, self.FILTER_BASE * 1)
	c2, p2 = self.conv2d_block(p1, self.FILTER_BASE * 2)
	c3, p3 = self.conv2d_block(p2, self.FILTER_BASE * 4)
	c4, p4 = self.conv2d_block(p3, self.FILTER_BASE * 8)

	c5 = self.conv2d_block(p4, self.FILTER_BASE * 16, skip_dropout=True)

	u6, c6 = self.trans_conv2d_block(c5, c4, self.FILTER_BASE * 8)
	u7, c7 = self.trans_conv2d_block(c6, c3, self.FILTER_BASE * 4)
	u8, c8 = self.trans_conv2d_block(c7, c2, self.FILTER_BASE * 2)
	u9, c9 = self.trans_conv2d_block(c8, c1, self.FILTER_BASE * 1)

	self.output = Conv2D(self.NUM_CLASS, (1,1), activation="sigmoid")(c9)
	self.model = Model(inputs=[self.input], outputs=[self.output])

	def predict(self, input_img): ## input_img will be numpy array which has same shape with self.input
	return self.model.predict(input_img)

	def to_index_color_img(self, predict_result):
	arg_max_img = np.argmax(predict_result, axis=2)
	color_img = np.array(arg_max_img.shape)
	cmap = color_map()


	@staticmethod
	def color_map(N=256, normalized=False):
	def bitget(byteval, idx):
	return ((byteval & (1 << idx)) != 0)

	dtype = 'float32' if normalized else 'uint8'
	cmap = np.zeros((N, 3), dtype=dtype)
	for i in range(N):
	r = g = b = 0
	c = i
	for j in range(8):
	r = r \| (bitget(c, 0) << 7-j)
	g = g \| (bitget(c, 1) << 7-j)
	b = b \| (bitget(c, 2) << 7-j)
	c = c >> 3

	cmap[i] = np.array([r, g, b])

	cmap = cmap/255 if normalized else cmap
	return cmap

	class ImageLoader:

	def crop(self, img, shape):
	W, H = img.size
	X, Y = shape
	top_left = img.crop((0,0,X,Y))
	top_right = img.crop((W-X, 0, W, Y))
	bottom_left = img.crop((0, H-Y, X, H))
	bottom_right = img.crop((W-X, H-Y, W, H))
	center = img.crop(((W-X)/2, (H-Y)/2, (W+X)/2, (H+Y)/2 ))
	return top_left, top_right, bottom_left, bottom_right, center

	def load(self, data_dir, img_size, num_train = 100):
	self.keys = sorted([f[:-4] for f in os.listdir(os.path.join(data_dir, "SegmentationClass"))])
	self.img_path_list = [os.path.join(data_dir, "JPEGImages", k + ".jpg") for k in self.keys]
	self.mask_path_list = [os.path.join(data_dir, "SegmentationClass", k + ".png") for k in self.keys]
	imgs = list(itertools.chain.from_iterable([ self.crop(load_img(p), img_size) for p in self.img_path_list] ))
	masks = list(itertools.chain.from_iterable([ self.crop(load_img(p), img_size) for p in self.mask_path_list] ))
	self.train_imgs, self.test_imgs = imgs[:-num_train], imgs[:num_train]
	self.train_masks, self.test_masks = masks[:-num_train], masks[:num_train]