mlazos’s gists

mlazos / code.cpp

Created May 12, 2025 21:34

	using Accum = cutlass::epilogue::fusion::Sm90AccFetch;

	using ElementD = cutlass::half_t;
	using StrideD = cute::Stride<int64_t, cute::Int<1>, cute::Int<0>>;

	using Bias = cutlass::epilogue::fusion::Sm90ColBroadcast<
	0 /Stages/, typename EpilogueDescriptor::TileShape, cutlass::half_t, cutlass::half_t,
	cute::Stride<cute::Int<1>, cute::Int<0>, cute::Int<0>>
	>;

mlazos / gist:c87b19997dc029316980c506234193d4

Last active May 12, 2025 20:39

	using Accum = cutlass::epilogue::fusion::Sm90AccFetch;

	using ElementD = cutlass::half_t;
	using StrideD = cute::Stride<int64_t, cute::Int<1>, cute::Int<0>>;

	using Bias = cutlass::epilogue::fusion::Sm90ColBroadcast<
	0 /Stages/, typename EpilogueDescriptor::TileShape, cutlass::half_t, cutlass::half_t,
	cute::Stride<cute::Int<1>, cute::Int<0>, cute::Int<0>>
	>;

mlazos / gist:45b600432a8d89e29323673db61552d5

Created May 9, 2025 00:11

	// Place your key bindings in this file to override the defaults
	[
	{
	"key": "ctrl+tab",
	"command": "-workbench.action.quickOpenPreviousRecentlyUsedEditorInGroup"
	},
	{
	"key": "ctrl+tab",
	"command": "workbench.action.nextEditor"
	},

mlazos / output_code.py

Created April 25, 2025 21:59

	from ctypes import c_void_p, c_long, c_int
	import torch
	import math
	import random
	import os
	import tempfile
	from math import inf, nan
	from cmath import nanj
	from torch._inductor.hooks import run_intermediate_hooks
	from torch._inductor.utils import maybe_profile

mlazos / code.py

Created April 25, 2025 21:57

	import torch
	from torch._inductor.utils import fresh_inductor_cache

	torch._logging.set_logs(fusion=True)

	with fresh_inductor_cache():
	@torch.compile()
	def foo(x, y):
	return (x @ y).permute(1, 0).relu().permute(1, 0).sigmoid()

mlazos / reindex.py

Created April 23, 2025 23:12

	import torch

	torch._logging.set_logs(fusion=True)

	@torch.compile()
	def foo(x, y):
	return (x @ y).permute(1, 0).relu().permute(1, 0).contiguous()

	foo(torch.ones(256, 256, device="cuda"), torch.ones(256, 256, device="cuda"))

mlazos / reindex.py

Created April 23, 2025 23:12

	import torch

	torch._logging.set_logs(fusion=True)

	@torch.compile()
	def foo(x, y):
	return (x @ y).permute(1, 0).relu().permute(1, 0).contiguous()

	foo(torch.ones(256, 256, device="cuda"), torch.ones(256, 256, device="cuda"))

mlazos / gist:752185f2ed5eae17b02d5e1759e0ee2d

Created April 12, 2025 23:36

	# mypy: allow-untyped-defs

	from numpy import dtype
	from torch._inductor.ir import ComputedBuffer, InputBuffer
	from typing import Union

	from ..cutlass_utils import try_import_cutlass


	if try_import_cutlass():

mlazos / evt.py

Last active April 9, 2025 01:43

	def render_evt(tile_desc, epilogue_schedule):
	from .cutlass_lib_extensions import evt_extensions

	LayoutType = cutlass_lib.LayoutType
	DataType = cutlass_lib.DataType
	CutlassTensor = evt_extensions.CutlassTensor

	bias_code = """def example_epilogue(accum, alpha, C, beta, aux, bias):
	F = alpha * accum + (beta * C + aux)
	E = relu(F + 1) + bias

mlazos / gist:c0adab4557533cbf57dd949b17225abd

Created April 4, 2025 23:09

	ERROR:common:
	Traceback (most recent call last):
	File "/data/users/mlazos/pytorch/benchmarks/dynamo/common.py", line 2216, in check_accuracy
	new_result = self.run_n_iterations(
	File "/data/users/mlazos/pytorch/benchmarks/dynamo/common.py", line 1930, in run_n_iterations
	model_iter_fn(mod, inputs, collect_outputs=False)
	File "/data/users/mlazos/pytorch/torch/_dynamo/eval_frame.py", line 658, in _fn
	return fn(args, *kwargs)
	File "/data/users/mlazos/pytorch/benchmarks/dynamo/huggingface.py", line 531, in forward_and_backward_pass
	cloned_inputs = clone_inputs(inputs)

Michael Lazos mlazos