leslie-fang-intel’s gists

leslie-fang-intel / demo of quantization 2.0 conv add relu recipe.py

Created March 8, 2023 08:15

	import torch
	import torch._dynamo as torchdynamo
	from torch.ao.quantization import (
	get_default_qconfig,
	QConfigMapping,
	)
	from torch.ao.quantization._quantize_pt2e import prepare_pt2e, convert_pt2e

	class Mod(torch.nn.Module):
	def __init__(self,) -> None:

leslie-fang-intel / issue of serials of conv_add_relu patten.py

Last active March 20, 2023 01:57

issue of serials of conv_add_relu patten.py

	import torch
	import torch._dynamo as torchdynamo
	from torch.ao.quantization import (
	get_default_qconfig,
	QConfigMapping,
	)
	from torch.ao.quantization._quantize_pt2e import prepare_pt2e, convert_pt2e

	class Mod(torch.nn.Module):
	def __init__(self,) -> None:

leslie-fang-intel / benchmark_decomposed_dq__maxpool.py

Created April 20, 2023 06:34

benchmark decomposed dequant maxpool code gen performance

	import torch
	from torch import _dynamo, _inductor
	from torch._inductor import config
	import logging
	import numpy as np
	import random
	from torch._inductor import codecache, config, metrics, test_operators
	import torch.ao.quantization.fx._decomposed

	torch._dynamo.config.verbose = True

leslie-fang-intel / pytorch_2_quantization_rn50_qat.py

Created April 24, 2023 05:00

	import torch
	import torchvision
	import torch._dynamo as torchdynamo
	import copy
	from torch.ao.quantization._pt2e.quantizer import (
	QNNPackQuantizer,
	)
	from torch.ao.quantization._quantize_pt2e import (
	convert_pt2e,
	prepare_qat_pt2e_quantizer,

leslie-fang-intel / LLaMA_dynamo_export_error_message.log

Created May 6, 2023 08:05

LLaMA dynamo export error message

	Error Message:
	╭─────────────────────────────── Traceback (most recent call last) ────────────────────────────────╮
	│ /home/lesliefang/pytorch_1_7_1/torch_inductor/torch_script/inductor/int8/test_dynamo_export_none │
	│ _full_graph/test_Llama_dynamo_export.py:43 in <module> │
	│ │
	│ 40 │ return │
	│ 41 │
	│ 42 if __name__ == "__main__": │
	│ ❱ 43 │ test_Llama() │
	│ 44 │

leslie-fang-intel / RN50_Quantization_2_0_Jit_trace_graph.py

Created May 11, 2023 10:02

RN50 Quantization 2.0 Jit trace graph

	graph(%self : __torch__.torch.fx.graph_module.___torch_mangle_1.GraphModule,
	%x : Tensor):
	%self._param_constant160 : Float(1000, strides=[1], requires_grad=0, device=cpu) = prim::Constant[value=<Tensor>]()
	%self._param_constant156_bias : Float(2048, strides=[1], requires_grad=0, device=cpu) = prim::Constant[value=<Tensor>]()
	%self._param_constant153_bias : Float(512, strides=[1], requires_grad=0, device=cpu) = prim::Constant[value=<Tensor>]()
	%self._param_constant150_bias : Float(512, strides=[1], requires_grad=0, device=cpu) = prim::Constant[value=<Tensor>]()
	%self._param_constant147_bias : Float(2048, strides=[1], requires_grad=0, device=cpu) = prim::Constant[value=<Tensor>]()
	%self._param_constant144_bias : Float(512, strides=[1], requires_grad=0, device=cpu) = prim::Constant[value=<Tensor>]()
	%self._param_constant141_bias : Float(512, strides=[1], requires_grad=0, device=cpu) = prim::Constant[value=<Tensor>]()
	%self._param_constant138_bias : Float(2048, strides=[1], requires_grad=0,

leslie-fang-intel / RN50_Quantization_1_0_Jit_trace_graph.py

Created May 11, 2023 10:09

RN50 Quantization 1.0 Jit trace graph

	graph(%self.1 : __torch__.intel_extension_for_pytorch.quantization._quantize_utils.___torch_mangle_194.QuantizationDispatchModule,
	%x : Tensor):
	%2 : float = prim::Constant[value=0.020705882459878922]() # /home/lesliefang/pytorch_1_7_1/quantization/frameworks.ai.pytorch.private-cpu/torch/_tensor.py:1298:0
	%3 : int = prim::Constant[value=0]() # /home/lesliefang/pytorch_1_7_1/quantization/frameworks.ai.pytorch.private-cpu/torch/_tensor.py:1298:0
	%4 : int = prim::Constant[value=12]() # /home/lesliefang/pytorch_1_7_1/quantization/frameworks.ai.pytorch.private-cpu/torch/_tensor.py:1298:0
	%5 : int = prim::Constant[value=1]() # /home/lesliefang/pytorch_1_7_1/quantization/frameworks.ai.pytorch.private-cpu/torch/_tensor.py:1298:0
	%6 : int[] = prim::Constant[value=[1, 1]]()
	%7 : int = prim::Constant[value=-1]() # /home/lesliefang/pytorch_1_7_1/quantization/frameworks.ai.pytorch.private-cpu/torch/_tensor.py:1298:0
	%ret.1 : Tensor = aten::quantize_per_tensor(%x, %2, %3, %4) # /home/lesliefang/pytorch_

leslie-fang-intel / example_conv2d_quantized_model_representation

Created May 26, 2023 08:18

	def forward(self, x):
	arg0, = fx_pytree.tree_flatten_spec(([x], {}), self._in_spec)
	_scale_0 = self._scale_0
	_zero_point_0 = self._zero_point_0
	quantize_per_tensor = torch.ops.quantized_decomposed.quantize_per_tensor(arg0, _scale_0, _zero_point_0, 0, 255, torch.uint8); arg0 = None
	dequantize_per_tensor = torch.ops.quantized_decomposed.dequantize_per_tensor(quantize_per_tensor, _scale_0, _zero_point_0, 0, 255, torch.uint8); quantize_per_tensor = _scale_0 = _zero_point_0 = None
	_param_constant0 = self._param_constant0
	conv_scale_0 = self.conv_scale_0
	conv_zero_point_0 = self.conv_zero_point_0
	quantize_per_channel = torch.ops.quantized_decomposed.quantize_per_channel(_param_constant0, conv_scale_0, conv_zero_point_0, 0, -128, 127, torch.int8); _param_constant0 = None

leslie-fang-intel / Quant2_constant_folding.py

Created May 29, 2023 00:38

	import torch
	import torch.nn as nn
	import torch._dynamo as torchdynamo
	import copy

	from torch.ao.quantization._quantize_pt2e import (
	convert_pt2e,
	)
	from torch._inductor.compile_fx import compile_fx
	import torch.ao.quantization._pt2e.quantizer.qnnpack_quantizer as qq

leslie-fang-intel / test_script.py

Created June 2, 2023 05:08

	import copy
	import itertools
	import operator
	from typing import Callable, Dict, List, Optional, Set, Any

	import torch
	import torch._dynamo as torchdynamo
	from torch.ao.quantization._pt2e.quantizer.utils import (
	_annotate_input_qspec_map,
	_annotate_output_qspec,

Leslie Fang leslie-fang-intel