Skip to content

Instantly share code, notes, and snippets.

View YimianDai's full-sized avatar
💭
I may be slow to respond.

Yimian Dai YimianDai

💭
I may be slow to respond.
View GitHub Profile
@YimianDai
YimianDai / hpc.md
Last active September 21, 2019 20:57
HPC

在 HPC 上 Verify driver version

$ cat /proc/driver/nvidia/version

在 HPC 上 Verify Runtime / Toolkit 版本

$ ls /cm/shared/modulefiles
@YimianDai
YimianDai / aws.md
Last active September 26, 2019 23:01
Notes on AWS
@YimianDai
YimianDai / YOLOOutputV3.md
Last active September 13, 2019 00:30
YOLOOutputV3

这个 Block 真正学习的 component 只有将 feature map 转化成 Prediction 的那个 Conv2D 而已, 剩下的都是在做一些 class / bbox decoding, 具体而言 YOLOOutputV3 的 forward 依次完成了如下步骤:

  1. 根据给定的 feature map 通过 Conv2D 做出 Prediction, 这个 Prediction 依次包含 [cx, cy, w, h, objness, class_pred], class_pred 有 num_class 个长度
  2. 分别从上一步的 Prediction 中 slice 出 cx, cy, w, h, objness, class_pred
  3. 根据当前的 offsets 和 stride, 将 Feature Map 上的 cx, cy, w, h 映射成原图上的 [xmin, ymin, xmax, ymax]
  4. 根据 objness 得到 confidence, 即 confidence = sigmoid(objness)
  5. 根据 confidence 和 class_pred 得到 class_score, 即 sigmoid(class_pred) * confidence, 其中 sigmoid(class_pred) 是每类各自的概率, 概率乘上 confidence 才是这个类的 score
  6. 将 ids, scores, bboxes 拼成 detections
@YimianDai
YimianDai / DarknetV3.md
Last active September 10, 2019 21:02
DarknetV3

Darknet53 整体架构如下图所示:

def _conv2d(channel, kernel, padding, stride, norm_layer=BatchNorm, norm_kwargs=None):
    """A common conv-bn-leakyrelu cell"""
    cell = nn.HybridSequential(prefix='')
 cell.add(nn.Conv2D(channel, kernel_size=kernel,
@YimianDai
YimianDai / YOLOV3.md
Last active September 16, 2019 21:52
YOLOV3
@YimianDai
YimianDai / YOLOV3PrefetchTargetGenerator.md
Last active September 16, 2019 22:59
YOLOV3PrefetchTargetGenerator
@YimianDai
YimianDai / YOLO3DefaultTrainTransform.md
Last active September 15, 2019 06:27
YOLO3DefaultTrainTransform

YOLO3DefaultTrainTransform 接受 VOCDetection 的输入, 完成两个功能:

  1. 一个是对 img 做 data augmentation, label 也做相应变换
  2. 另一个是按照 YOLOV3 的要求, 将 Human Labels for BBox 转变成 Model Labels for Anchors (targets)

__init__

@YimianDai
YimianDai / train_yolo3.md
Last active September 16, 2019 03:26
train_yolo3.py
  1. parse_args
  2. get_dataset
  3. get_dataloader
  4. save_params
  5. validate
  6. train
  7. __main__

1. parse_args