gautamchitnis · December 17, 2019 19:08
diff --git a/detectron2_balloon_sample b/detectron2_balloon_sample
 import os
 import random

 import cv2
 import numpy as np
 import json
 from detectron2.structures import BoxMode
 import itertools

 from detectron2.data import DatasetCatalog, MetadataCatalog
 from detectron2.engine import DefaultTrainer
 from detectron2.engine import DefaultPredictor
 from detectron2.config import get_cfg

 from detectron2.utils.visualizer import Visualizer
 from detectron2.utils.visualizer import ColorMode

 def get_balloon_dicts(img_dir):
    json_file = os.path.join(img_dir, "via_region_data.json")
    with open(json_file) as f:
        imgs_anns = json.load(f)

    dataset_dicts = []
    for idx, v in enumerate(imgs_anns.values()):
        record = {}

        filename = os.path.join(img_dir, v["filename"])
        height, width = cv2.imread(filename).shape[:2]

        record["file_name"] = filename
        record["image_id"] = idx
        record["height"] = height
        record["width"] = width

        annos = v["regions"]
        objs = []
        for _, anno in annos.items():
            assert not anno["region_attributes"]
            anno = anno["shape_attributes"]
            px = anno["all_points_x"]
            py = anno["all_points_y"]
            poly = [(x + 0.5, y + 0.5) for x, y in zip(px, py)]
            poly = list(itertools.chain.from_iterable(poly))

            obj = {
                "bbox": [np.min(px), np.min(py), np.max(px), np.max(py)],
                "bbox_mode": BoxMode.XYXY_ABS,
                "segmentation": [poly],
                "category_id": 0,
                "iscrowd": 0
            }
            objs.append(obj)
        record["annotations"] = objs
        dataset_dicts.append(record)
    return dataset_dicts


 for d in ["train", "val"]:
    DatasetCatalog.register("balloon_" + d, lambda d=d: get_balloon_dicts("DIRECTORY PATH" + d))
    MetadataCatalog.get("balloon_" + d).set(thing_classes=["balloon"])
 balloon_metadata = MetadataCatalog.get("balloon_train")

 dataset_dicts = get_balloon_dicts("DIRECTORY PATH")

 cfg = get_cfg()
 cfg.merge_from_file("DIRECTORY PATH\\detectron2\\configs\\COCO-InstanceSegmentation\\mask_rcnn_R_50_FPN_3x.yaml")
 cfg.DATASETS.TRAIN = ("balloon_train",)
 cfg.DATASETS.TEST = ()
 cfg.DATALOADER.NUM_WORKERS = 1
 cfg.MODEL.WEIGHTS = "detectron2://COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x/137849600/model_final_f10217.pkl"  # initialize from model zoo
 cfg.SOLVER.IMS_PER_BATCH = 1
 cfg.SOLVER.BASE_LR = 0.00025
 cfg.SOLVER.MAX_ITER = 300    # 300 iterations seems good enough, but you can certainly train longer
 cfg.MODEL.ROI_HEADS.BATCH_SIZE_PER_IMAGE = 64   # faster, and good enough for this toy dataset
 cfg.MODEL.ROI_HEADS.NUM_CLASSES = 1  # only has one class (ballon)
 cfg.OUTPUT_DIR = "DIRECTORY PATH\\output"

 os.makedirs(cfg.OUTPUT_DIR, exist_ok=True)
 trainer = DefaultTrainer(cfg)
 trainer.resume_or_load(resume=False)
 trainer.train()

 cfg.MODEL.WEIGHTS = os.path.join(cfg.OUTPUT_DIR, "model_final.pth")
 cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0.7   # set the testing threshold for this model
 cfg.DATASETS.TEST = ("balloon_val", )
 predictor = DefaultPredictor(cfg)

 dataset_dicts = get_balloon_dicts("DIRECTORY PATH\\balloon\\val")
 for d in random.sample(dataset_dicts, 3):
    while True:
        im = cv2.imread(d["file_name"])
        outputs = predictor(im)
        v = Visualizer(im[:, :, ::-1],
                       metadata=balloon_metadata,
                       scale=0.8,
                       instance_mode=ColorMode.IMAGE_BW   # remove the colors of unsegmented pixels
        )
        v = v.draw_instance_predictions(outputs["instances"].to("cpu"))
        cv2.imshow("a",v.get_image()[:, :, ::-1])
        k = cv2.waitKey(30) & 0xff
        if k == 27:
            break

 cv2.destroyAllWindows()
	import os
	import random

	import cv2
	import numpy as np
	import json
	from detectron2.structures import BoxMode
	import itertools

	from detectron2.data import DatasetCatalog, MetadataCatalog
	from detectron2.engine import DefaultTrainer
	from detectron2.engine import DefaultPredictor
	from detectron2.config import get_cfg

	from detectron2.utils.visualizer import Visualizer
	from detectron2.utils.visualizer import ColorMode

	def get_balloon_dicts(img_dir):
	json_file = os.path.join(img_dir, "via_region_data.json")
	with open(json_file) as f:
	imgs_anns = json.load(f)

	dataset_dicts = []
	for idx, v in enumerate(imgs_anns.values()):
	record = {}

	filename = os.path.join(img_dir, v["filename"])
	height, width = cv2.imread(filename).shape[:2]

	record["file_name"] = filename
	record["image_id"] = idx
	record["height"] = height
	record["width"] = width

	annos = v["regions"]
	objs = []
	for _, anno in annos.items():
	assert not anno["region_attributes"]
	anno = anno["shape_attributes"]
	px = anno["all_points_x"]
	py = anno["all_points_y"]
	poly = [(x + 0.5, y + 0.5) for x, y in zip(px, py)]
	poly = list(itertools.chain.from_iterable(poly))

	obj = {
	"bbox": [np.min(px), np.min(py), np.max(px), np.max(py)],
	"bbox_mode": BoxMode.XYXY_ABS,
	"segmentation": [poly],
	"category_id": 0,
	"iscrowd": 0
	}
	objs.append(obj)
	record["annotations"] = objs
	dataset_dicts.append(record)
	return dataset_dicts


	for d in ["train", "val"]:
	DatasetCatalog.register("balloon_" + d, lambda d=d: get_balloon_dicts("DIRECTORY PATH" + d))
	MetadataCatalog.get("balloon_" + d).set(thing_classes=["balloon"])
	balloon_metadata = MetadataCatalog.get("balloon_train")

	dataset_dicts = get_balloon_dicts("DIRECTORY PATH")

	cfg = get_cfg()
	cfg.merge_from_file("DIRECTORY PATH\\detectron2\\configs\\COCO-InstanceSegmentation\\mask_rcnn_R_50_FPN_3x.yaml")
	cfg.DATASETS.TRAIN = ("balloon_train",)
	cfg.DATASETS.TEST = ()
	cfg.DATALOADER.NUM_WORKERS = 1
	cfg.MODEL.WEIGHTS = "detectron2://COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x/137849600/model_final_f10217.pkl" # initialize from model zoo
	cfg.SOLVER.IMS_PER_BATCH = 1
	cfg.SOLVER.BASE_LR = 0.00025
	cfg.SOLVER.MAX_ITER = 300 # 300 iterations seems good enough, but you can certainly train longer
	cfg.MODEL.ROI_HEADS.BATCH_SIZE_PER_IMAGE = 64 # faster, and good enough for this toy dataset
	cfg.MODEL.ROI_HEADS.NUM_CLASSES = 1 # only has one class (ballon)
	cfg.OUTPUT_DIR = "DIRECTORY PATH\\output"

	os.makedirs(cfg.OUTPUT_DIR, exist_ok=True)
	trainer = DefaultTrainer(cfg)
	trainer.resume_or_load(resume=False)
	trainer.train()

	cfg.MODEL.WEIGHTS = os.path.join(cfg.OUTPUT_DIR, "model_final.pth")
	cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0.7 # set the testing threshold for this model
	cfg.DATASETS.TEST = ("balloon_val", )
	predictor = DefaultPredictor(cfg)

	dataset_dicts = get_balloon_dicts("DIRECTORY PATH\\balloon\\val")
	for d in random.sample(dataset_dicts, 3):
	while True:
	im = cv2.imread(d["file_name"])
	outputs = predictor(im)
	v = Visualizer(im[:, :, ::-1],
	metadata=balloon_metadata,
	scale=0.8,
	instance_mode=ColorMode.IMAGE_BW # remove the colors of unsegmented pixels
	)
	v = v.draw_instance_predictions(outputs["instances"].to("cpu"))
	cv2.imshow("a",v.get_image()[:, :, ::-1])
	k = cv2.waitKey(30) & 0xff
	if k == 27:
	break

	cv2.destroyAllWindows()