Qihui Yang IsaacYQH

🚄

working hard!

Birch-san / _06_fused_attention_blockptr_jvp.py

Last active August 11, 2025 08:35

Triton fused attention tutorial, updated with JVP support. Albeit with atol=1e-3 accuracy on JVP.

	from __future__ import annotations
	"""
	Fused Attention
	===============

	This is a Triton implementation of the Flash Attention v2 algorithm from Tri Dao (https://tridao.me/publications/flash2/flash2.pdf)

	Credits: OpenAI kernel team
	Extra Credits:

Ryu1845 / standalone_multihead_jvp_test.py

Last active July 31, 2025 22:36

	import gc
	from typing import Tuple

	import torch
	import torch.nn.functional as F
	import triton
	import triton.language as tl
	import triton.testing
	from kernels import get_kernel