lucataco · July 23, 2024 04:24
diff --git a/script.py b/script.py
 import torch
 import random

 random.seed(42)
 torch.manual_seed(42)


 from transformers import LlamaTokenizer, LlamaForCausalLM
 model_path = 'openlm-research/open_llama_3b_v2'
 tokenizer = LlamaTokenizer.from_pretrained(model_path, legacy=True);
 base_model = LlamaForCausalLM.from_pretrained(model_path);


 from peft import LoraConfig, PeftModel
 lora_config = LoraConfig(
    r=64,
    lora_alpha=32,
    lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM",
 )
 model = PeftModel(base_model, lora_config, adapter_name="Shakespeare")

 device = torch.device("mps")
 model.to(device);


 import os
 import requests
 file_name = "shakespeare.txt"
 url = "https://raw.githubusercontent.com/karpathy/char-rnn/master/data/tinyshakespeare/input.txt"
 if not os.path.isfile(file_name):
    data = requests.get(url)

    with open(file_name, 'w') as f:
        f.write(data.text)

 from transformers import TextDataset
 train_dataset = TextDataset(tokenizer=tokenizer, file_path=file_name, block_size=128)[:256]


 from transformers import Trainer, TrainingArguments
 training_args = TrainingArguments(
    output_dir="output",
    overwrite_output_dir=True,
    num_train_epochs=10,
    per_device_train_batch_size=32,
    evaluation_strategy='no',
 )


 from transformers import DataCollatorForLanguageModeling
 data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm=False)
 trainer = Trainer(
    model=model,
    args=training_args,
    data_collator=data_collator,
    train_dataset=train_dataset,
 )


 def generate_response(prompt_text, model, tokenizer, max_length=30, num_return_sequences=1):
    input_ids = tokenizer.encode(prompt_text, return_tensors="pt").to('mps')
    attention_mask = torch.ones(input_ids.shape, dtype=torch.long, device='mps')

    output_sequences = model.generate(
        input_ids=input_ids,
        attention_mask=attention_mask,
        max_length=max_length,
        num_return_sequences=num_return_sequences,
        no_repeat_ngram_size=2,
    )

    responses = []
    for response_id in output_sequences:
        response = tokenizer.decode(response_id, skip_special_tokens=True)
        responses.append(response)

    return responses


 prompt_text="Uneasy lies the head that wears a crown."
 responses = generate_response(prompt_text, model, tokenizer)
 for resp in responses:
    print(resp)


 trainer.train()


 responses = generate_response(prompt_text, model, tokenizer, max_length=50)
 for resp in responses:
    print(resp)


 save_path = "merged_fine_tune_openllama_3b_v2_shakespeare"
 tokenizer.save_pretrained(save_path)
 merged_model = model.merge_and_unload()
 merged_model.save_pretrained(save_path)
	import torch
	import random

	random.seed(42)
	torch.manual_seed(42)


	from transformers import LlamaTokenizer, LlamaForCausalLM
	model_path = 'openlm-research/open_llama_3b_v2'
	tokenizer = LlamaTokenizer.from_pretrained(model_path, legacy=True);
	base_model = LlamaForCausalLM.from_pretrained(model_path);


	from peft import LoraConfig, PeftModel
	lora_config = LoraConfig(
	r=64,
	lora_alpha=32,
	lora_dropout=0.05,
	bias="none",
	task_type="CAUSAL_LM",
	)
	model = PeftModel(base_model, lora_config, adapter_name="Shakespeare")

	device = torch.device("mps")
	model.to(device);


	import os
	import requests
	file_name = "shakespeare.txt"
	url = "https://raw.githubusercontent.com/karpathy/char-rnn/master/data/tinyshakespeare/input.txt"
	if not os.path.isfile(file_name):
	data = requests.get(url)

	with open(file_name, 'w') as f:
	f.write(data.text)

	from transformers import TextDataset
	train_dataset = TextDataset(tokenizer=tokenizer, file_path=file_name, block_size=128)[:256]


	from transformers import Trainer, TrainingArguments
	training_args = TrainingArguments(
	output_dir="output",
	overwrite_output_dir=True,
	num_train_epochs=10,
	per_device_train_batch_size=32,
	evaluation_strategy='no',
	)


	from transformers import DataCollatorForLanguageModeling
	data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm=False)
	trainer = Trainer(
	model=model,
	args=training_args,
	data_collator=data_collator,
	train_dataset=train_dataset,
	)


	def generate_response(prompt_text, model, tokenizer, max_length=30, num_return_sequences=1):
	input_ids = tokenizer.encode(prompt_text, return_tensors="pt").to('mps')
	attention_mask = torch.ones(input_ids.shape, dtype=torch.long, device='mps')

	output_sequences = model.generate(
	input_ids=input_ids,
	attention_mask=attention_mask,
	max_length=max_length,
	num_return_sequences=num_return_sequences,
	no_repeat_ngram_size=2,
	)

	responses = []
	for response_id in output_sequences:
	response = tokenizer.decode(response_id, skip_special_tokens=True)
	responses.append(response)

	return responses


	prompt_text="Uneasy lies the head that wears a crown."
	responses = generate_response(prompt_text, model, tokenizer)
	for resp in responses:
	print(resp)


	trainer.train()


	responses = generate_response(prompt_text, model, tokenizer, max_length=50)
	for resp in responses:
	print(resp)


	save_path = "merged_fine_tune_openllama_3b_v2_shakespeare"
	tokenizer.save_pretrained(save_path)
	merged_model = model.merge_and_unload()
	merged_model.save_pretrained(save_path)
No results found