Yunxuan Xiao woshiyyya

⚡

zzz

# Contributing to @ray-project

woshiyyya / requirements-repro-262.txt

Created August 30, 2023 01:10

woshiyyya / torch_ddp.py

Last active October 23, 2023 21:16

Torch_DDP_Example

	import os
	import tempfile

	import torch
	from torch import nn
	from torch.nn.parallel import DistributedDataParallel

	import ray
	from ray.train import Checkpoint, CheckpointConfig, RunConfig, ScalingConfig
	from ray.train.torch import TorchTrainer

woshiyyya / ray_trainium_ddp.py

Created October 25, 2023 00:29

	import torch
	import torch.nn as nn
	import torch.optim as optim
	import torch_xla.core.xla_model as xm
	import torch_xla.distributed.xla_backend # noqa: F401

	from ray.train import ScalingConfig
	from ray.train.torch import TorchTrainer, prepare_model
	from ray.train.torch.xla import TorchXLAConfig

woshiyyya / trainium-2node.py

Last active October 30, 2023 21:06

	# This script is tested with the PR(https://github.com/ray-project/ray/pull/39130) from AWS team.
	# It configures the required environment variables for Neuron XLA.

	import os
	import torch
	import torch.nn as nn
	import torch.optim as optim
	import torch_xla.core.xla_model as xm
	import torch_xla.distributed.xla_backend # noqa: F401

woshiyyya / precompute_latents.py

Last active November 2, 2023 05:45

	"""
	Cluster: 16 x A10G GPUs
	Command: python precompute_latents.py --subset_size 50 --mode debug
	"""

	import argparse
	import io
	import pandas as pd
	import pyarrow.dataset as pds
	import os

woshiyyya / ray_neuron_training.py

Created November 16, 2023 17:44

	import os
	import time
	import torch
	from torch import nn

	from ray.train import ScalingConfig
	from ray.train.torch import TorchTrainer
	from ray.train.torch.xla import TorchXLAConfig

	from torchvision.datasets import mnist

woshiyyya / ray_train_kvcache.py

Last active December 14, 2023 22:24

	import ray
	import ray.train
	import numpy as np
	from ray.train.torch import TorchTrainer
	from ray.train import ScalingConfig
	from dataclasses import dataclass


	@dataclass
	class DummyDataclass:

woshiyyya / benchmark_ray_mnist.py

Created January 9, 2024 01:33

	#!/usr/bin/env python3
	# pylint: skip-file
	import os

	import torch
	from torch import distributed as dist
	from torchvision.models import resnet18
	from torchvision.datasets import FashionMNIST
	from torchvision.transforms import ToTensor, Normalize, Compose
	from torch.utils.data import DataLoader, DistributedSampler

woshiyyya / check_node_ip.py

Last active February 28, 2024 05:43

	import ray

	ray.init()

	node_resources = {}
	for node in ray.nodes():
	print(node, "\n")
	node_resources[node["NodeID"]] = node["Resources"]

	import ray

woshiyyya / run.py

Created April 9, 2024 18:14

Test Async Actor DDP

	from collections import defaultdict
	from ray.train._internal.utils import get_address_and_port
	import ray
	import os

	import torch
	import torch.nn as nn
	from torch.nn.parallel import DistributedDataParallel as DDP
	import time