EvilFreelancer · April 30, 2024 11:11
diff --git a/README.md b/README.md
diff --git a/gemma_2B_lora_single_device.yaml b/gemma_2B_lora_single_device.yaml
 # Tokenizer
 tokenizer:
  _component_: torchtune.models.gemma.gemma_tokenizer
  path: ./gemma/tokenizer.model

 # Dataset
 dataset:
  - _component_: torchtune.datasets.instruct_dataset
    source: vicgalle/alpaca-gpt4
    template: AlpacaInstructTemplate
    split: train
    train_on_input: True
  - _component_: torchtune.datasets.instruct_dataset
    source: samsum
    template: SummarizeTemplate
    column_map: {"output": "summary"}
    split: train
    train_on_input: False
 seed: null
 shuffle: True

 # Model Arguments
 model:
  _component_: torchtune.models.gemma.lora_gemma_2b
  lora_attn_modules: ['q_proj', 'k_proj', 'v_proj']
  apply_lora_to_mlp: True
  lora_rank: 64
  lora_alpha: 16

 checkpointer:
  _component_: torchtune.utils.FullModelHFCheckpointer
  checkpoint_dir: ./gemma/
  checkpoint_files: [
    model-00001-of-00002.safetensors,
    model-00002-of-00002.safetensors,
  ]
  recipe_checkpoint: null
  output_dir: ./gemma
  model_type: GEMMA
 resume_from_checkpoint: False

 optimizer:
  _component_: torch.optim.AdamW
  lr: 2e-5

 lr_scheduler:
  _component_: torchtune.modules.get_cosine_schedule_with_warmup
  num_warmup_steps: 100

 loss:
  _component_: torch.nn.CrossEntropyLoss

 # Fine-tuning arguments
 batch_size: 2
 epochs: 1
 max_steps_per_epoch: null
 gradient_accumulation_steps: 4
 compile: False

 # Training env
 device: cuda

 # Memory management
 enable_activation_checkpointing: True

 # Reduced precision
 dtype: bf16

 # Logging
 metric_logger:
  _component_: torchtune.utils.metric_logging.WandBLogger
  project: gemma_2B_lora_single_device
 output_dir: ./alpaca-gemma-lora
 log_every_n_steps: 1
 log_peak_memory_stats: False

 # Show case the usage of pytorch profiler
 # Set enabled to False as it's only needed for debugging training
 profiler:
  _component_: torchtune.utils.profiler
  enabled: False
  output_dir: ./alpaca-gemma-finetune/torchtune_perf_tracing.json
	# Tokenizer
	tokenizer:
	_component_: torchtune.models.gemma.gemma_tokenizer
	path: ./gemma/tokenizer.model

	# Dataset
	dataset:
	- _component_: torchtune.datasets.instruct_dataset
	source: vicgalle/alpaca-gpt4
	template: AlpacaInstructTemplate
	split: train
	train_on_input: True
	- _component_: torchtune.datasets.instruct_dataset
	source: samsum
	template: SummarizeTemplate
	column_map: {"output": "summary"}
	split: train
	train_on_input: False
	seed: null
	shuffle: True

	# Model Arguments
	model:
	_component_: torchtune.models.gemma.lora_gemma_2b
	lora_attn_modules: ['q_proj', 'k_proj', 'v_proj']
	apply_lora_to_mlp: True
	lora_rank: 64
	lora_alpha: 16

	checkpointer:
	_component_: torchtune.utils.FullModelHFCheckpointer
	checkpoint_dir: ./gemma/
	checkpoint_files: [
	model-00001-of-00002.safetensors,
	model-00002-of-00002.safetensors,
	]
	recipe_checkpoint: null
	output_dir: ./gemma
	model_type: GEMMA
	resume_from_checkpoint: False

	optimizer:
	_component_: torch.optim.AdamW
	lr: 2e-5

	lr_scheduler:
	_component_: torchtune.modules.get_cosine_schedule_with_warmup
	num_warmup_steps: 100

	loss:
	_component_: torch.nn.CrossEntropyLoss

	# Fine-tuning arguments
	batch_size: 2
	epochs: 1
	max_steps_per_epoch: null
	gradient_accumulation_steps: 4
	compile: False

	# Training env
	device: cuda

	# Memory management
	enable_activation_checkpointing: True

	# Reduced precision
	dtype: bf16

	# Logging
	metric_logger:
	_component_: torchtune.utils.metric_logging.WandBLogger
	project: gemma_2B_lora_single_device
	output_dir: ./alpaca-gemma-lora
	log_every_n_steps: 1
	log_peak_memory_stats: False

	# Show case the usage of pytorch profiler
	# Set enabled to False as it's only needed for debugging training
	profiler:
	_component_: torchtune.utils.profiler
	enabled: False
	output_dir: ./alpaca-gemma-finetune/torchtune_perf_tracing.json
No results found