vfdev-5 · February 16, 2022 18:16
diff --git a/check_make_functional_on_tv_det_models.log b/check_make_functional_on_tv_det_models.log

 Torch: 1.12.0.dev20220215+cu111
 torchvision: 0.13.0.dev20220215+cu111
 Functorch: 0.2.0a0+c9d03e8

 -- Check fasterrcnn_resnet50_fpn model
 -- Check fasterrcnn_mobilenet_v3_large_320_fpn model
 -- Check fasterrcnn_mobilenet_v3_large_fpn model
 -- Check maskrcnn_resnet50_fpn model
 -- Check keypointrcnn_resnet50_fpn model
 -- Check retinanet_resnet50_fpn model
 -- Check ssd300_vgg16 model
 -- Check ssdlite320_mobilenet_v3_large model
 -- Check fcos_resnet50_fpn model
diff --git a/check_make_functional_on_tv_det_models.py b/check_make_functional_on_tv_det_models.py
 import torch
 import torch.nn as nn
 import torchvision
 import torchvision.models.detection as models

 from functorch.version import __version__ as ft_version
 from functorch import make_functional_with_buffers, make_functional, grad

 tested_models = []
 for model_name in models.__dict__:
    if model_name.startswith("_") or model_name[0].isupper():
        continue
    if not callable(models.__dict__[model_name]):
        continue
    tested_models.append(model_name)


 def compute_grads(model, images, targets):
    # Fix seed to fix dropout
    torch.manual_seed(0)
    loss_dict = model(images, targets)
    loss = sum(loss for loss in loss_dict.values())
    loss.backward()


 device = 'cpu'


 def check_grads_model(model_name, device):
    batch_size = 8
    torch.manual_seed(0)

    size = (224, 224)
    model = models.__dict__[model_name](num_classes=10, pretrained=False, pretrained_backbone=False)
    model = model.to(device)

    images = [torch.rand(3, 224, 224) for _ in range(4)]
    targets = [
        {
            "boxes": torch.tensor([[10 + i, 10 + i, 20 + i, 20 + i], [20 + i, 20 + i, 30 + i, 30 + i]]),
            "labels": torch.tensor([(1 + i) % 10, (2 + i) % 10]),
            "keypoints": torch.rand(2, 12, 3),
            "masks": torch.randint(0, 1, size=(2, 224, 224), dtype=torch.uint8),
        }
        for i in range(4)
    ]

    has_buffers = len(list(model.buffers())) > 0
    gen_make_functional_fn = None
    if has_buffers:
        gen_make_functional_fn = make_functional_with_buffers
    else:
        gen_make_functional_fn = make_functional

    output = gen_make_functional_fn(model)
    if has_buffers:
        func_model, weights, buffers = output
    else:
        func_model, weights = output
        buffers = None

    def compute_loss_ft(weights, buffers, images, targets):
        # Fix seed to fix dropout
        torch.manual_seed(0)

        if buffers is None:
            loss_dict = func_model(weights, images, targets)
        else:
            loss_dict = func_model(weights, buffers, images, targets)
        loss = sum(loss for loss in loss_dict.values())
        return loss

    compute_grad = grad(compute_loss_ft)
    w_grads = compute_grad(weights, buffers, images, targets)

    compute_grads(model, images, targets)

    assert len(w_grads) == len(list(model.parameters()))

    for wg, (n, p) in zip(w_grads, model.named_parameters()):
        assert p.grad.allclose(wg, atol=1e-5), f"grad mismatch for {n}: {p.grad.mean()} vs {wg.mean()}"

 print("")
 print("Torch:", torch.__version__)
 print("torchvision:", torchvision.__version__)
 print("Functorch:", ft_version)
 print("")

 for model_name in tested_models:

    print(f"-- Check {model_name} model")
    try:
        check_grads_model(model_name, device=device)
    except AssertionError as e:
        print(e)
diff --git a/check_make_functional_on_tv_segm_models.py b/check_make_functional_on_tv_segm_models.py
 import torch
 import torch.nn as nn
 import torchvision
 import torchvision.models.segmentation as models

 from functorch.version import __version__ as ft_version
 from functorch import make_functional_with_buffers, make_functional, grad

 tested_models = []
 for model_name in models.__dict__:
    if model_name.startswith("_") or model_name[0].isupper():
        continue
    if not callable(models.__dict__[model_name]):
        continue
    tested_models.append(model_name)

 criterion = nn.CrossEntropyLoss()


 def compute_grads(model, image, target):
    # Fix seed to fix dropout
    torch.manual_seed(0)
    output = model(image)
    loss = criterion(output["out"], target)
    loss.backward()


 device = 'cpu'


 def check_grads_model(model_name, device):
    batch_size = 8
    torch.manual_seed(0)

    size = (224, 224)
    model = models.__dict__[model_name](num_classes=10, pretrained=False, pretrained_backbone=False)
    model = model.to(device)

    images = torch.randn(batch_size, 3, *size, device=device)
    targets = torch.randint(0, 10, (batch_size, ) + size, device=device)

    has_buffers = len(list(model.buffers())) > 0
    gen_make_functional_fn = None
    if has_buffers:
        gen_make_functional_fn = make_functional_with_buffers
    else:
        gen_make_functional_fn = make_functional

    output = gen_make_functional_fn(model)
    if has_buffers:
        func_model, weights, buffers = output
    else:
        func_model, weights = output
        buffers = None

    def compute_loss_ft(weights, buffers, image, target):
        # Fix seed to fix dropout
        torch.manual_seed(0)

        if buffers is None:
            output = func_model(weights, image)
        else:
            output = func_model(weights, buffers, image)
        loss = criterion(output["out"], target)
        return loss

    compute_grad = grad(compute_loss_ft)
    w_grads = compute_grad(weights, buffers, images, targets)

    compute_grads(model, images, targets)

    assert len(w_grads) == len(list(model.parameters()))

    for wg, (n, p) in zip(w_grads, model.named_parameters()):
        assert p.grad.allclose(wg, atol=1e-5), f"grad mismatch for {n}: {p.grad.mean()} vs {wg.mean()}"

 print("")
 print("Torch:", torch.__version__)
 print("torchvision:", torchvision.__version__)
 print("Functorch:", ft_version)
 print("")

 for model_name in tested_models:

    print(f"-- Check {model_name} model")
    try:
        check_grads_model(model_name, device=device)
    except AssertionError as e:
        print(e)
diff --git a/check_make_functional_on_tvmodels.py b/check_make_functional_on_tvmodels.py
 import torch
 import torch.nn as nn
 import torchvision
 import torchvision.models as models

 from functorch.version import __version__ as ft_version
 from functorch import make_functional_with_buffers, make_functional, grad

 tested_models = []
 for model_name in models.__dict__:
    if model_name.startswith("_") or model_name[0].isupper():
        continue
    if model_name in ["segmentation", "detection", "video", "quantization", "feature_extraction"]:
        continue
    if not callable(models.__dict__[model_name]):
        continue
    tested_models.append(model_name)

 criterion = nn.CrossEntropyLoss()


 def compute_grads(model, image, target):
    # Fix seed to fix dropout
    torch.manual_seed(0)
    output = model(image)
    loss = criterion(output, target)
    loss.backward()


 device = 'cpu'


 def check_grads_model(model_name, device):
    batch_size = 8
    torch.manual_seed(0)

    if model_name == "inception_v3":
        size = (299, 299)
        kwargs = {"aux_logits": False}
    elif model_name == "googlenet":
        size = (224, 224)
        kwargs = {"aux_logits": False}
    else:
        size = (224, 224)
        kwargs = {}

    model = models.__dict__[model_name](num_classes=10, **kwargs)
    model = model.to(device)

    images = torch.randn(batch_size, 3, *size, device=device)
    targets = torch.randint(0, 10, (batch_size,), device=device)

    has_buffers = len(list(model.buffers())) > 0
    gen_make_functional_fn = None
    if has_buffers:
        gen_make_functional_fn = make_functional_with_buffers
    else:
        gen_make_functional_fn = make_functional

    output = gen_make_functional_fn(model)
    if has_buffers:
        func_model, weights, buffers = output
    else:
        func_model, weights = output
        buffers = None

    def compute_loss_ft(weights, buffers, image, target):
        # Fix seed to fix dropout
        torch.manual_seed(0)

        if buffers is None:
            output = func_model(weights, image)
        else:
            output = func_model(weights, buffers, image)
        loss = criterion(output, target)
        return loss

    compute_grad = grad(compute_loss_ft)
    w_grads = compute_grad(weights, buffers, images, targets)

    compute_grads(model, images, targets)

    assert len(w_grads) == len(list(model.parameters()))

    for wg, (n, p) in zip(w_grads, model.named_parameters()):
        assert p.grad.allclose(wg, atol=1e-5), f"grad mismatch for {n}: {p.grad.mean()} vs {wg.mean()}"

 print("")
 print("Torch:", torch.__version__)
 print("torchvision:", torchvision.__version__)
 print("Functorch:", ft_version)
 print("")

 for model_name in tested_models:

    print(f"-- Check {model_name} model")
    try:
        check_grads_model(model_name, device=device)
    except AssertionError as e:
        print(e)
diff --git a/output_classif_models.logs b/output_classif_models.logs

 Torch: 1.12.0.dev20220209+cu111
 torchvision: 0.13.0.dev20220209+cu111
 Functorch: 0.2.0a0+da6ec37

 -- Check alexnet model
 -- Check convnext_tiny model
 -- Check convnext_small model
 -- Check convnext_base model
 -- Check convnext_large model
 -- Check resnet18 model
 -- Check resnet34 model
 -- Check resnet50 model
 -- Check resnet101 model
 -- Check resnet152 model
 -- Check resnext50_32x4d model
 -- Check resnext101_32x8d model
 -- Check wide_resnet50_2 model
 -- Check wide_resnet101_2 model
 -- Check vgg11 model
 -- Check vgg11_bn model
 -- Check vgg13 model
 -- Check vgg13_bn model
 -- Check vgg16 model
 -- Check vgg16_bn model
 -- Check vgg19_bn model
 -- Check vgg19 model
 -- Check squeezenet1_0 model
 -- Check squeezenet1_1 model
 -- Check inception_v3 model
 -- Check densenet121 model
 -- Check densenet169 model
 -- Check densenet201 model
 -- Check densenet161 model
 -- Check googlenet model
 -- Check mobilenet_v2 model
 -- Check mobilenet_v3_large model
 -- Check mobilenet_v3_small model
 -- Check mnasnet0_5 model
 -- Check mnasnet0_75 model
 -- Check mnasnet1_0 model
 -- Check mnasnet1_3 model
 -- Check shufflenet_v2_x0_5 model
 -- Check shufflenet_v2_x1_0 model
 -- Check shufflenet_v2_x1_5 model
 -- Check shufflenet_v2_x2_0 model
 -- Check efficientnet_b0 model
 grad mismatch for features.1.0.block.0.0.weight: -0.12117128819227219 vs -0.12117135524749756
 -- Check efficientnet_b1 model
 grad mismatch for features.0.0.weight: -0.008784545585513115 vs -0.008784502744674683
 -- Check efficientnet_b2 model
 grad mismatch for features.0.0.weight: -0.17733778059482574 vs -0.17733803391456604
 -- Check efficientnet_b3 model
 grad mismatch for features.0.0.weight: 0.056723516434431076 vs 0.05672360211610794
 -- Check efficientnet_b4 model
 grad mismatch for features.0.0.weight: -0.008806591853499413 vs -0.008806349709630013
 -- Check efficientnet_b5 model
 grad mismatch for features.0.0.weight: 0.18076033890247345 vs 0.1807602196931839
 -- Check efficientnet_b6 model
 grad mismatch for features.0.0.weight: 0.1274760216474533 vs 0.12747612595558167
 -- Check efficientnet_b7 model
 grad mismatch for features.0.0.weight: -0.030335871502757072 vs -0.030335767194628716
 -- Check regnet_y_400mf model
 -- Check regnet_y_800mf model
 -- Check regnet_y_1_6gf model
 -- Check regnet_y_3_2gf model
 -- Check regnet_y_8gf model
 -- Check regnet_y_16gf model
 -- Check regnet_y_32gf model
 -- Check regnet_y_128gf model
 -- Check regnet_x_400mf model
 -- Check regnet_x_800mf model
 -- Check regnet_x_1_6gf model
 -- Check regnet_x_3_2gf model
 -- Check regnet_x_8gf model
 -- Check regnet_x_16gf model
 -- Check regnet_x_32gf model
 -- Check vit_b_16 model
 -- Check vit_b_32 model
 -- Check vit_l_16 model
 -- Check vit_l_32 model
diff --git a/output_segm_models.log b/output_segm_models.log

 Torch: 1.12.0.dev20220209+cu111
 torchvision: 0.13.0.dev20220209+cu111
 Functorch: 0.2.0a0+da6ec37

 -- Check fcn_resnet50 model
 -- Check fcn_resnet101 model
 -- Check deeplabv3_resnet50 model
 -- Check deeplabv3_resnet101 model
 -- Check deeplabv3_mobilenet_v3_large model
 -- Check lraspp_mobilenet_v3_large model

	Torch: 1.12.0.dev20220215+cu111
	torchvision: 0.13.0.dev20220215+cu111
	Functorch: 0.2.0a0+c9d03e8

	-- Check fasterrcnn_resnet50_fpn model
	-- Check fasterrcnn_mobilenet_v3_large_320_fpn model
	-- Check fasterrcnn_mobilenet_v3_large_fpn model
	-- Check maskrcnn_resnet50_fpn model
	-- Check keypointrcnn_resnet50_fpn model
	-- Check retinanet_resnet50_fpn model
	-- Check ssd300_vgg16 model
	-- Check ssdlite320_mobilenet_v3_large model
	-- Check fcos_resnet50_fpn model
	import torch
	import torch.nn as nn
	import torchvision
	import torchvision.models.detection as models

	from functorch.version import __version__ as ft_version
	from functorch import make_functional_with_buffers, make_functional, grad

	tested_models = []
	for model_name in models.__dict__:
	if model_name.startswith("_") or model_name[0].isupper():
	continue
	if not callable(models.__dict__[model_name]):
	continue
	tested_models.append(model_name)


	def compute_grads(model, images, targets):
	# Fix seed to fix dropout
	torch.manual_seed(0)
	loss_dict = model(images, targets)
	loss = sum(loss for loss in loss_dict.values())
	loss.backward()


	device = 'cpu'


	def check_grads_model(model_name, device):
	batch_size = 8
	torch.manual_seed(0)

	size = (224, 224)
	model = models.__dict__[model_name](num_classes=10, pretrained=False, pretrained_backbone=False)
	model = model.to(device)

	images = [torch.rand(3, 224, 224) for _ in range(4)]
	targets = [
	{
	"boxes": torch.tensor([[10 + i, 10 + i, 20 + i, 20 + i], [20 + i, 20 + i, 30 + i, 30 + i]]),
	"labels": torch.tensor([(1 + i) % 10, (2 + i) % 10]),
	"keypoints": torch.rand(2, 12, 3),
	"masks": torch.randint(0, 1, size=(2, 224, 224), dtype=torch.uint8),
	}
	for i in range(4)
	]

	has_buffers = len(list(model.buffers())) > 0
	gen_make_functional_fn = None
	if has_buffers:
	gen_make_functional_fn = make_functional_with_buffers
	else:
	gen_make_functional_fn = make_functional

	output = gen_make_functional_fn(model)
	if has_buffers:
	func_model, weights, buffers = output
	else:
	func_model, weights = output
	buffers = None

	def compute_loss_ft(weights, buffers, images, targets):
	# Fix seed to fix dropout
	torch.manual_seed(0)

	if buffers is None:
	loss_dict = func_model(weights, images, targets)
	else:
	loss_dict = func_model(weights, buffers, images, targets)
	loss = sum(loss for loss in loss_dict.values())
	return loss

	compute_grad = grad(compute_loss_ft)
	w_grads = compute_grad(weights, buffers, images, targets)

	compute_grads(model, images, targets)

	assert len(w_grads) == len(list(model.parameters()))

	for wg, (n, p) in zip(w_grads, model.named_parameters()):
	assert p.grad.allclose(wg, atol=1e-5), f"grad mismatch for {n}: {p.grad.mean()} vs {wg.mean()}"

	print("")
	print("Torch:", torch.__version__)
	print("torchvision:", torchvision.__version__)
	print("Functorch:", ft_version)
	print("")

	for model_name in tested_models:

	print(f"-- Check {model_name} model")
	try:
	check_grads_model(model_name, device=device)
	except AssertionError as e:
	print(e)

	Torch: 1.12.0.dev20220209+cu111
	torchvision: 0.13.0.dev20220209+cu111
	Functorch: 0.2.0a0+da6ec37

	-- Check alexnet model
	-- Check convnext_tiny model
	-- Check convnext_small model
	-- Check convnext_base model
	-- Check convnext_large model
	-- Check resnet18 model
	-- Check resnet34 model
	-- Check resnet50 model
	-- Check resnet101 model
	-- Check resnet152 model
	-- Check resnext50_32x4d model
	-- Check resnext101_32x8d model
	-- Check wide_resnet50_2 model
	-- Check wide_resnet101_2 model
	-- Check vgg11 model
	-- Check vgg11_bn model
	-- Check vgg13 model
	-- Check vgg13_bn model
	-- Check vgg16 model
	-- Check vgg16_bn model
	-- Check vgg19_bn model
	-- Check vgg19 model
	-- Check squeezenet1_0 model
	-- Check squeezenet1_1 model
	-- Check inception_v3 model
	-- Check densenet121 model
	-- Check densenet169 model
	-- Check densenet201 model
	-- Check densenet161 model
	-- Check googlenet model
	-- Check mobilenet_v2 model
	-- Check mobilenet_v3_large model
	-- Check mobilenet_v3_small model
	-- Check mnasnet0_5 model
	-- Check mnasnet0_75 model
	-- Check mnasnet1_0 model
	-- Check mnasnet1_3 model
	-- Check shufflenet_v2_x0_5 model
	-- Check shufflenet_v2_x1_0 model
	-- Check shufflenet_v2_x1_5 model
	-- Check shufflenet_v2_x2_0 model
	-- Check efficientnet_b0 model
	grad mismatch for features.1.0.block.0.0.weight: -0.12117128819227219 vs -0.12117135524749756
	-- Check efficientnet_b1 model
	grad mismatch for features.0.0.weight: -0.008784545585513115 vs -0.008784502744674683
	-- Check efficientnet_b2 model
	grad mismatch for features.0.0.weight: -0.17733778059482574 vs -0.17733803391456604
	-- Check efficientnet_b3 model
	grad mismatch for features.0.0.weight: 0.056723516434431076 vs 0.05672360211610794
	-- Check efficientnet_b4 model
	grad mismatch for features.0.0.weight: -0.008806591853499413 vs -0.008806349709630013
	-- Check efficientnet_b5 model
	grad mismatch for features.0.0.weight: 0.18076033890247345 vs 0.1807602196931839
	-- Check efficientnet_b6 model
	grad mismatch for features.0.0.weight: 0.1274760216474533 vs 0.12747612595558167
	-- Check efficientnet_b7 model
	grad mismatch for features.0.0.weight: -0.030335871502757072 vs -0.030335767194628716
	-- Check regnet_y_400mf model
	-- Check regnet_y_800mf model
	-- Check regnet_y_1_6gf model
	-- Check regnet_y_3_2gf model
	-- Check regnet_y_8gf model
	-- Check regnet_y_16gf model
	-- Check regnet_y_32gf model
	-- Check regnet_y_128gf model
	-- Check regnet_x_400mf model
	-- Check regnet_x_800mf model
	-- Check regnet_x_1_6gf model
	-- Check regnet_x_3_2gf model
	-- Check regnet_x_8gf model
	-- Check regnet_x_16gf model
	-- Check regnet_x_32gf model
	-- Check vit_b_16 model
	-- Check vit_b_32 model
	-- Check vit_l_16 model
	-- Check vit_l_32 model