vuiseng9/nncf_wrap_bert.py

vuiseng9 · 2022-10-26T23:13:53Z

Following is nncf_wrap_swin.py. as of Oct 26, 2022

import functools
from typing import Dict, Callable, Any, Union, List, Tuple

import torch
import torch.nn as nn
from torch.utils.data import DataLoader
from torch.utils.data import Dataset

from nncf.torch.nncf_network import NNCFNetwork
from nncf.torch.dynamic_graph.graph_tracer import create_input_infos, create_dummy_forward_fn
from nncf.torch import create_compressed_model
from nncf import NNCFConfig
from nncf.torch.initialization import register_default_init_args
from abc import ABC, abstractmethod
from nncf.experimental.torch.search_building_blocks.search_blocks import BuildingBlock, get_building_blocks, BuildingBlockType, BlockFilteringStrategy

# from transformers import AutoFeatureExtractor, SwinForImageClassification
from transformers import AutoModelForImageClassification

class BaseDatasetMock(Dataset, ABC):
    def __init__(self, input_size: Tuple, num_samples: int = 10):
        super().__init__()
        self._input_size = input_size
        self._len = num_samples

    @abstractmethod
    def __getitem__(self, index: int) -> Tuple[torch.Tensor, torch.Tensor]:
        pass

    def __len__(self) -> int:
        return self._len

class RandomDatasetMock(BaseDatasetMock):
    def __getitem__(self, index):
        return torch.rand(self._input_size), torch.zeros(1)

def create_any_mock_dataloader(dataset_cls: type, config: NNCFConfig, num_samples: int = 1,
                               batch_size: int = 1) -> DataLoader:
    input_infos_list = create_input_infos(config)
    input_sample_size = input_infos_list[0].shape
    data_loader = DataLoader(dataset_cls(input_sample_size[1:], num_samples),
                             batch_size=batch_size,
                             num_workers=0,  # Workaround
                             shuffle=False, drop_last=True)
    return data_loader

create_random_mock_dataloader = functools.partial(create_any_mock_dataloader, dataset_cls=RandomDatasetMock)

bs=8
nbatch = 3200 # dummy

model_path = 'microsoft/swin-tiny-patch4-window7-224'
# feature_extractor = AutoFeatureExtractor.from_pretrained(model_path)
# model = SwinForImageClassification.from_pretrained(model_path)
model = AutoModelForImageClassification.from_pretrained(model_path)

nncf_cfgdict = dict(
    input_info = dict(sample_size=[1, 3, 224, 224]),
)
nncf_cfg = NNCFConfig.from_dict(nncf_cfgdict)

mock_dataloader = create_random_mock_dataloader(config=nncf_cfg, num_samples=nbatch*bs, batch_size=bs)
nncf_cfg = register_default_init_args(nncf_cfg, mock_dataloader)

nncf_ctrl, nncf_model = create_compressed_model(model, nncf_cfg)

building_blocks, _ = get_building_blocks(nncf_model,
                                target_block_types=[BuildingBlockType.MSHA, BuildingBlockType.FF],
                                block_filter_strategy=BlockFilteringStrategy.KEEP_SMALL,
                                hw_fused_ops=True)

for idx, block in enumerate(building_blocks):
    print("\n- Block {} | {} -".format(idx, block.block_type))
    print("\t__start_node: {}".format(block.start_node_name))
    print("\t____end_node: {}".format(block.end_node_name))
    print("\top_addresses:")
    for i, op in enumerate(block.op_addresses):
        print("\t\t({:2}, {:2}) {}".format(idx, i, op))
    
print("done")

vuiseng9 · 2022-10-27T19:47:53Z

Setup

# NNCF: 836455b16
git clone https://github.com/openvinotoolkit/nncf
cd nncf
python setup.py develop

# Install torch (adjust accordingly to your server setup)
pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116

# Microsoft's Swin: d19503d7
git clone https://github.com/microsoft/Swin-Transformer
cd Swin-Transformer
pip install timm==0.4.12 opencv-python==4.4.0.46 termcolor==1.1.0 yacs==0.1.8

Wrap Microsoft's Swin with NNCF + Block Tracing

import functools
from typing import Dict, Callable, Any, Union, List, Tuple

import torch
import torch.nn as nn
from torch.utils.data import DataLoader
from torch.utils.data import Dataset

from nncf.torch.nncf_network import NNCFNetwork
from nncf.torch.dynamic_graph.graph_tracer import create_input_infos, create_dummy_forward_fn
from nncf.torch import create_compressed_model
from nncf import NNCFConfig
from nncf.torch.initialization import register_default_init_args
from abc import ABC, abstractmethod
from nncf.experimental.torch.search_building_blocks.search_blocks import BuildingBlock, get_building_blocks, BuildingBlockType, BlockFilteringStrategy

from models.swin_transformer import SwinTransformer
import torch.nn as nn


class BaseDatasetMock(Dataset, ABC):
    def __init__(self, input_size: Tuple, num_samples: int = 10):
        super().__init__()
        self._input_size = input_size
        self._len = num_samples

    @abstractmethod
    def __getitem__(self, index: int) -> Tuple[torch.Tensor, torch.Tensor]:
        pass

    def __len__(self) -> int:
        return self._len

class RandomDatasetMock(BaseDatasetMock):
    def __getitem__(self, index):
        return torch.rand(self._input_size), torch.zeros(1)

def create_any_mock_dataloader(dataset_cls: type, config: NNCFConfig, num_samples: int = 1,
                               batch_size: int = 1) -> DataLoader:
    input_infos_list = create_input_infos(config)
    input_sample_size = input_infos_list[0].shape
    data_loader = DataLoader(dataset_cls(input_sample_size[1:], num_samples),
                             batch_size=batch_size,
                             num_workers=0,  # Workaround
                             shuffle=False, drop_last=True)
    return data_loader

create_random_mock_dataloader = functools.partial(create_any_mock_dataloader, dataset_cls=RandomDatasetMock)

bs=8
nbatch = 3200 # dummy

#Swin-Tiny
model = SwinTransformer(
    img_size=224,
    patch_size=4,
    in_chans=3,
    num_classes=1000,
    embed_dim=96,
    depths=[2, 2, 6, 2],
    num_heads=[3, 6, 12, 24],
    window_size=7,
    mlp_ratio=4.0,
    qkv_bias=True,
    qk_scale=None,
    drop_rate=0.0,
    drop_path_rate=0.2,
    ape=False,
    norm_layer=nn.LayerNorm,
    patch_norm=True,
    use_checkpoint=False,
    fused_window_process=False)

#Swin-Base
# model = SwinTransformer(
#     img_size=224,
#     patch_size=4,
#     in_chans=3,
#     num_classes=1000,
#     embed_dim=128,
#     depths=[2, 2, 18, 2],
#     num_heads=[4, 8, 16, 32],
#     window_size=7,
#     mlp_ratio=4.0,
#     qkv_bias=True,
#     qk_scale=None,
#     drop_rate=0.0,
#     drop_path_rate=0.2,
#     ape=False,
#     norm_layer=nn.LayerNorm,
#     patch_norm=True,
#     use_checkpoint=False,
#     fused_window_process=False)

nncf_cfgdict = dict(
    input_info = dict(sample_size=[1, 3, 224, 224]),
)
nncf_cfg = NNCFConfig.from_dict(nncf_cfgdict)

mock_dataloader = create_random_mock_dataloader(config=nncf_cfg, num_samples=nbatch*bs, batch_size=bs)
nncf_cfg = register_default_init_args(nncf_cfg, mock_dataloader)

nncf_ctrl, nncf_model = create_compressed_model(model, nncf_cfg)

building_blocks, _ = get_building_blocks(nncf_model,
                                target_block_types=[BuildingBlockType.MSHA, BuildingBlockType.FF],
                                block_filter_strategy=BlockFilteringStrategy.KEEP_SMALL,
                                hw_fused_ops=True)

for idx, block in enumerate(building_blocks):
    print("\n- Block {} | {} -".format(idx, block.block_type))
    print("\t__start_node: {}".format(block.start_node_name))
    print("\t____end_node: {}".format(block.end_node_name))
    print("\top_addresses:")
    for i, op in enumerate(block.op_addresses):
        print("\t\t({:2}, {:2}) {}".format(idx, i, op))

print("done")

Output (single layer of the QKV projection is not captured)

- Block 0 | BuildingBlockType.FF -
        __start_node: SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[0]/__add___0
        ____end_node: SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[0]/__add___1
        op_addresses:
                ( 0,  0) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/Dropout[drop]/dropout_0
                ( 0,  1) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/NNCFLinear[fc1]/linear_0
                ( 0,  2) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[0]/NNCFLayerNorm[norm2]/layer_norm_0
                ( 0,  3) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/Dropout[drop]/dropout_1
                ( 0,  4) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[0]/__add___1
                ( 0,  5) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/NNCFLinear[fc2]/linear_0
                ( 0,  6) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/GELU[act]/gelu_0

- Block 1 | BuildingBlockType.FF -
        __start_node: SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[1]/__add___0
        ____end_node: SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[1]/__add___1
        op_addresses:
                ( 1,  0) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[1]/NNCFLayerNorm[norm2]/layer_norm_0
                ( 1,  1) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/NNCFLinear[fc2]/linear_0
                ( 1,  2) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/Dropout[drop]/dropout_1
                ( 1,  3) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[1]/__add___1
                ( 1,  4) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/Dropout[drop]/dropout_0
                ( 1,  5) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/NNCFLinear[fc1]/linear_0
                ( 1,  6) SwinTransformer/ModuleList[layers]/BasicLayer[0]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/GELU[act]/gelu_0

- Block 2 | BuildingBlockType.FF -
        __start_node: SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[0]/__add___0
        ____end_node: SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[0]/__add___1
        op_addresses:
                ( 2,  0) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/Dropout[drop]/dropout_1
                ( 2,  1) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/Dropout[drop]/dropout_0
                ( 2,  2) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/NNCFLinear[fc2]/linear_0
                ( 2,  3) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[0]/NNCFLayerNorm[norm2]/layer_norm_0
                ( 2,  4) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[0]/__add___1
                ( 2,  5) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/NNCFLinear[fc1]/linear_0
                ( 2,  6) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/GELU[act]/gelu_0

- Block 3 | BuildingBlockType.FF -
        __start_node: SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[1]/__add___0
        ____end_node: SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[1]/__add___1
        op_addresses:
                ( 3,  0) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/Dropout[drop]/dropout_0
                ( 3,  1) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/NNCFLinear[fc2]/linear_0
                ( 3,  2) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/GELU[act]/gelu_0
                ( 3,  3) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[1]/__add___1
                ( 3,  4) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/NNCFLinear[fc1]/linear_0
                ( 3,  5) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[1]/NNCFLayerNorm[norm2]/layer_norm_0
                ( 3,  6) SwinTransformer/ModuleList[layers]/BasicLayer[1]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/Dropout[drop]/dropout_1

- Block 4 | BuildingBlockType.FF -
        __start_node: SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[0]/__add___0
        ____end_node: SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[0]/__add___1
        op_addresses:
                ( 4,  0) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/Dropout[drop]/dropout_1
                ( 4,  1) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/Dropout[drop]/dropout_0
                ( 4,  2) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[0]/NNCFLayerNorm[norm2]/layer_norm_0
                ( 4,  3) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/NNCFLinear[fc1]/linear_0
                ( 4,  4) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/NNCFLinear[fc2]/linear_0
                ( 4,  5) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[0]/__add___1
                ( 4,  6) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/GELU[act]/gelu_0

- Block 5 | BuildingBlockType.FF -
        __start_node: SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[1]/__add___0
        ____end_node: SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[1]/__add___1
        op_addresses:
                ( 5,  0) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/GELU[act]/gelu_0
                ( 5,  1) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/Dropout[drop]/dropout_1
                ( 5,  2) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/NNCFLinear[fc2]/linear_0
                ( 5,  3) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[1]/NNCFLayerNorm[norm2]/layer_norm_0
                ( 5,  4) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/Dropout[drop]/dropout_0
                ( 5,  5) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/NNCFLinear[fc1]/linear_0
                ( 5,  6) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[1]/__add___1

- Block 6 | BuildingBlockType.FF -
        __start_node: SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[2]/__add___0
        ____end_node: SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[2]/__add___1
        op_addresses:
                ( 6,  0) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[2]/Mlp[mlp]/Dropout[drop]/dropout_0
                ( 6,  1) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[2]/__add___1
                ( 6,  2) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[2]/Mlp[mlp]/NNCFLinear[fc1]/linear_0
                ( 6,  3) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[2]/NNCFLayerNorm[norm2]/layer_norm_0
                ( 6,  4) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[2]/Mlp[mlp]/GELU[act]/gelu_0
                ( 6,  5) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[2]/Mlp[mlp]/Dropout[drop]/dropout_1
                ( 6,  6) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[2]/Mlp[mlp]/NNCFLinear[fc2]/linear_0

- Block 7 | BuildingBlockType.FF -
        __start_node: SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[3]/__add___0
        ____end_node: SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[3]/__add___1
        op_addresses:
                ( 7,  0) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[3]/Mlp[mlp]/Dropout[drop]/dropout_0
                ( 7,  1) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[3]/NNCFLayerNorm[norm2]/layer_norm_0
                ( 7,  2) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[3]/Mlp[mlp]/GELU[act]/gelu_0
                ( 7,  3) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[3]/Mlp[mlp]/NNCFLinear[fc2]/linear_0
                ( 7,  4) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[3]/Mlp[mlp]/Dropout[drop]/dropout_1
                ( 7,  5) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[3]/Mlp[mlp]/NNCFLinear[fc1]/linear_0
                ( 7,  6) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[3]/__add___1

- Block 8 | BuildingBlockType.FF -
        __start_node: SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[4]/__add___0
        ____end_node: SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[4]/__add___1
        op_addresses:
                ( 8,  0) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[4]/NNCFLayerNorm[norm2]/layer_norm_0
                ( 8,  1) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[4]/Mlp[mlp]/GELU[act]/gelu_0
                ( 8,  2) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[4]/Mlp[mlp]/Dropout[drop]/dropout_1
                ( 8,  3) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[4]/Mlp[mlp]/NNCFLinear[fc1]/linear_0
                ( 8,  4) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[4]/Mlp[mlp]/Dropout[drop]/dropout_0
                ( 8,  5) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[4]/__add___1
                ( 8,  6) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[4]/Mlp[mlp]/NNCFLinear[fc2]/linear_0

- Block 9 | BuildingBlockType.FF -
        __start_node: SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[5]/__add___0
        ____end_node: SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[5]/__add___1
        op_addresses:
                ( 9,  0) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[5]/Mlp[mlp]/NNCFLinear[fc1]/linear_0
                ( 9,  1) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[5]/Mlp[mlp]/Dropout[drop]/dropout_1
                ( 9,  2) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[5]/__add___1
                ( 9,  3) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[5]/Mlp[mlp]/Dropout[drop]/dropout_0
                ( 9,  4) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[5]/Mlp[mlp]/NNCFLinear[fc2]/linear_0
                ( 9,  5) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[5]/NNCFLayerNorm[norm2]/layer_norm_0
                ( 9,  6) SwinTransformer/ModuleList[layers]/BasicLayer[2]/ModuleList[blocks]/SwinTransformerBlock[5]/Mlp[mlp]/GELU[act]/gelu_0

- Block 10 | BuildingBlockType.FF -
        __start_node: SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[0]/__add___0
        ____end_node: SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[0]/__add___1
        op_addresses:
                (10,  0) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/NNCFLinear[fc1]/linear_0
                (10,  1) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/GELU[act]/gelu_0
                (10,  2) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[0]/__add___1
                (10,  3) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/NNCFLinear[fc2]/linear_0
                (10,  4) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/Dropout[drop]/dropout_1
                (10,  5) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[0]/Mlp[mlp]/Dropout[drop]/dropout_0
                (10,  6) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[0]/NNCFLayerNorm[norm2]/layer_norm_0

- Block 11 | BuildingBlockType.FF -
        __start_node: SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[1]/__add___0
        ____end_node: SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[1]/__add___1
        op_addresses:
                (11,  0) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[1]/__add___1
                (11,  1) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/GELU[act]/gelu_0
                (11,  2) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[1]/NNCFLayerNorm[norm2]/layer_norm_0
                (11,  3) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/NNCFLinear[fc1]/linear_0
                (11,  4) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/NNCFLinear[fc2]/linear_0
                (11,  5) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/Dropout[drop]/dropout_1
                (11,  6) SwinTransformer/ModuleList[layers]/BasicLayer[3]/ModuleList[blocks]/SwinTransformerBlock[1]/Mlp[mlp]/Dropout[drop]/dropout_0

vuiseng9 · 2022-11-08T18:27:53Z

Wrap mobilebert

import functools
from typing import Dict, Callable, Any, Union, List, Tuple

import torch
import torch.nn as nn
from torch.utils.data import DataLoader
from torch.utils.data import Dataset

from nncf.torch.nncf_network import NNCFNetwork
from nncf.torch.dynamic_graph.graph_tracer import create_input_infos, create_dummy_forward_fn
from nncf.torch import create_compressed_model
from nncf import NNCFConfig
from nncf.torch.initialization import register_default_init_args
from abc import ABC, abstractmethod
from nncf.experimental.torch.search_building_blocks.search_blocks import BuildingBlock, get_building_blocks, BuildingBlockType, BlockFilteringStrategy


from transformers import AutoModelForQuestionAnswering

class BaseDatasetMock(Dataset, ABC):
    def __init__(self, input_size: Tuple, num_samples: int = 10):
        super().__init__()
        self._input_size = input_size
        self._len = num_samples

    @abstractmethod
    def __getitem__(self, index: int) -> Tuple[torch.Tensor, torch.Tensor]:
        pass

    def __len__(self) -> int:
        return self._len

class RandomDatasetMock(BaseDatasetMock):
    def __getitem__(self, index):
        return torch.rand(self._input_size), torch.zeros(1)

def create_any_mock_dataloader(dataset_cls: type, config: NNCFConfig, num_samples: int = 1,
                               batch_size: int = 1) -> DataLoader:
    input_infos_list = create_input_infos(config)
    input_sample_size = input_infos_list[0].shape
    data_loader = DataLoader(dataset_cls(input_sample_size[1:], num_samples),
                             batch_size=batch_size,
                             num_workers=0,  # Workaround
                             shuffle=False, drop_last=True)
    return data_loader

create_random_mock_dataloader = functools.partial(create_any_mock_dataloader, dataset_cls=RandomDatasetMock)

bs=1
nbatch = 3200 # dummy
seqlen = 384

model_path = 'csarron/mobilebert-uncased-squad-v1'
model = AutoModelForQuestionAnswering.from_pretrained(model_path)

nncf_cfgdict = dict(
    input_info = [dict(sample_size=[bs, seqlen], type='long')]*3,
)
nncf_cfg = NNCFConfig.from_dict(nncf_cfgdict)

mock_dataloader = create_random_mock_dataloader(config=nncf_cfg, num_samples=nbatch*bs, batch_size=bs)
nncf_cfg = register_default_init_args(nncf_cfg, mock_dataloader)

nncf_ctrl, nncf_model = create_compressed_model(model, nncf_cfg)

building_blocks, _ = get_building_blocks(nncf_model,
                                target_block_types=[BuildingBlockType.MSHA, BuildingBlockType.FF],
                                block_filter_strategy=BlockFilteringStrategy.KEEP_SMALL,
                                hw_fused_ops=True)

for idx, block in enumerate(building_blocks):
    print("\n- Block {} | {} -".format(idx, block.block_type))
    print("\t__start_node: {}".format(block.start_node_name))
    print("\t____end_node: {}".format(block.end_node_name))
    print("\top_addresses:")
    for i, op in enumerate(block.op_addresses):
        if 'NNCFLinear' in str(op):
            print("\t\t({:2}, {:2}) {}".format(idx, i, op))
print("done")

vuiseng9 · 2023-04-13T22:41:20Z

New API, April 2023

import functools
from typing import Dict, Callable, Any, Union, List, Tuple
import os
from pathlib import Path

import torch
import torch.nn as nn
from torch.utils.data import DataLoader
from torch.utils.data import Dataset

from nncf.torch.nncf_network import NNCFNetwork
from nncf.torch.dynamic_graph.graph_tracer import create_input_infos, create_dummy_forward_fn
from nncf.torch import create_compressed_model
from nncf import NNCFConfig
from nncf.torch.initialization import register_default_init_args
from abc import ABC, abstractmethod
# from nncf.experimental.torch.search_building_blocks.search_blocks import get_building_blocks, get_building_blocks_info
from nncf.experimental.common.pruning.nodes_grouping import get_pruning_groups
from nncf.experimental.torch.pruning.operations import PT_EXPERIMENTAL_PRUNING_OPERATOR_METATYPES

from transformers import AutoModelForQuestionAnswering

class BaseDatasetMock(Dataset, ABC):
    def __init__(self, input_size: Tuple, num_samples: int = 10):
        super().__init__()
        self._input_size = input_size
        self._len = num_samples

    @abstractmethod
    def __getitem__(self, index: int) -> Tuple[torch.Tensor, torch.Tensor]:
        pass

    def __len__(self) -> int:
        return self._len

class RandomDatasetMock(BaseDatasetMock):
    def __getitem__(self, index):
        return torch.rand(self._input_size), torch.zeros(1)

def create_any_mock_dataloader(dataset_cls: type, config: NNCFConfig, num_samples: int = 1,
                               batch_size: int = 1) -> DataLoader:
    input_infos_list = create_input_infos(config)
    input_sample_size = input_infos_list[0].shape
    data_loader = DataLoader(dataset_cls(input_sample_size[1:], num_samples),
                             batch_size=batch_size,
                             num_workers=0,  # Workaround
                             shuffle=False, drop_last=True)
    return data_loader

create_random_mock_dataloader = functools.partial(create_any_mock_dataloader, dataset_cls=RandomDatasetMock)

bs=1
nbatch = 3200 # dummy
seqlen = 384

model_path = 'bert-base-uncased'
model = AutoModelForQuestionAnswering.from_pretrained(model_path)

nncf_cfgdict = dict(
    input_info = [dict(sample_size=[bs, seqlen], type='long')]*3,
)
nncf_cfg = NNCFConfig.from_dict(nncf_cfgdict)

mock_dataloader = create_random_mock_dataloader(config=nncf_cfg, num_samples=nbatch*bs, batch_size=bs)
nncf_cfg = register_default_init_args(nncf_cfg, mock_dataloader)

nncf_ctrl, nncf_model = create_compressed_model(model, nncf_cfg)

pruning_producing_types = ['linear']
nncf_graph = nncf_model.get_original_graph()
pruning_groups = get_pruning_groups(nncf_model.get_graph(),
                                   PT_EXPERIMENTAL_PRUNING_OPERATOR_METATYPES,
                                   pruning_producing_types,
                                   Path(os.getcwd()))

groups = []
for group_id, group in enumerate(pruning_groups):
    ctxes = []
    print(f"\nGroup {group_id}")
    for block in group.dim_blocks:
        nncf_node = nncf_graph.get_node_by_id(block.producer_id)
        # module = nncf_model.nncf.get_containing_module(nncf_node.node_name)
        print("\t- {} | {} ---".format(group_id, nncf_node))

print("end")

vuiseng9/nncf_wrap_bert.py

vuiseng9 commented Oct 26, 2022 •

edited

Loading

Uh oh!

vuiseng9 commented Oct 27, 2022 •

edited

Loading

Uh oh!

vuiseng9 commented Nov 8, 2022 •

edited

Loading

Uh oh!

vuiseng9 commented Apr 13, 2023

Uh oh!

	import functools
	from typing import Dict, Callable, Any, Union, List, Tuple

	import torch
	import torch.nn as nn
	from torch.utils.data import DataLoader
	from torch.utils.data import Dataset

	from nncf.torch.nncf_network import NNCFNetwork
	from nncf.torch.dynamic_graph.graph_tracer import create_input_infos, create_dummy_forward_fn
	from nncf.torch import create_compressed_model
	from nncf import NNCFConfig
	from nncf.torch.initialization import register_default_init_args
	from abc import ABC, abstractmethod
	from nncf.experimental.torch.search_building_blocks.search_blocks import get_building_blocks, get_building_blocks_info

	from transformers import AutoModelForQuestionAnswering

	class BaseDatasetMock(Dataset, ABC):
	def __init__(self, input_size: Tuple, num_samples: int = 10):
	super().__init__()
	self._input_size = input_size
	self._len = num_samples

	@abstractmethod
	def __getitem__(self, index: int) -> Tuple[torch.Tensor, torch.Tensor]:
	pass

	def __len__(self) -> int:
	return self._len

	class RandomDatasetMock(BaseDatasetMock):
	def __getitem__(self, index):
	return torch.rand(self._input_size), torch.zeros(1)

	def create_any_mock_dataloader(dataset_cls: type, config: NNCFConfig, num_samples: int = 1,
	batch_size: int = 1) -> DataLoader:
	input_infos_list = create_input_infos(config)
	input_sample_size = input_infos_list[0].shape
	data_loader = DataLoader(dataset_cls(input_sample_size[1:], num_samples),
	batch_size=batch_size,
	num_workers=0, # Workaround
	shuffle=False, drop_last=True)
	return data_loader

	create_random_mock_dataloader = functools.partial(create_any_mock_dataloader, dataset_cls=RandomDatasetMock)

	bs=1
	nbatch = 3200 # dummy
	seqlen = 384

	model_path = 'bert-base-uncased'
	model = AutoModelForQuestionAnswering.from_pretrained(model_path)

	nncf_cfgdict = dict(
	input_info = [dict(sample_size=[bs, seqlen], type='long')]*3,
	)
	nncf_cfg = NNCFConfig.from_dict(nncf_cfgdict)

	mock_dataloader = create_random_mock_dataloader(config=nncf_cfg, num_samples=nbatch*bs, batch_size=bs)
	nncf_cfg = register_default_init_args(nncf_cfg, mock_dataloader)

	nncf_ctrl, nncf_model = create_compressed_model(model, nncf_cfg)

	blocks, _, group_dependent = get_building_blocks(nncf_model, allow_nested_blocks=False)
	blocks_info = get_building_blocks_info(blocks, nncf_model)

	DETAIL=False
	g=nncf_model.get_graph()
	for i, bbi in enumerate(blocks_info):
	op_addresses_ids = list(map(lambda x: g.get_node_by_name(x.__str__()).node_id, bbi.op_addresses))
	print("\n- {} \| {} ---".format(i, bbi.block_type))
	print("start : {}\nend : {}\nNodeIDs:{}\n\|\n".format(
	bbi.building_block.start_node_name,
	bbi.building_block.end_node_name,
	op_addresses_ids))

	if DETAIL is True:
	for oi, opaddr in enumerate(bbi.op_addresses):
	print("NodeID {:3}: {}".format(g.get_node_by_name(opaddr.__str__()).node_id, opaddr))

vuiseng9/nncf_wrap_bert.py

vuiseng9 commented Oct 26, 2022 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

vuiseng9 commented Oct 27, 2022 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Setup

Wrap Microsoft's Swin with NNCF + Block Tracing

Output (single layer of the QKV projection is not captured)

Uh oh!

vuiseng9 commented Nov 8, 2022 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Wrap mobilebert

Uh oh!

vuiseng9 commented Apr 13, 2023

New API, April 2023

Uh oh!

vuiseng9 commented Oct 26, 2022 •

edited

Loading

vuiseng9 commented Oct 27, 2022 •

edited

Loading

vuiseng9 commented Nov 8, 2022 •

edited

Loading