alfredplpl · April 2, 2024 01:59
diff --git a/calm2-7b-jmmlu.py b/calm2-7b-jmmlu.py
 import torch
 from transformers import AutoTokenizer,AutoModelForCausalLM
 import pandas

 model_name_or_path = "cyberagent/calm2-7b-chat"
 tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
 model = AutoModelForCausalLM.from_pretrained(model_name_or_path, device_map="cpu", torch_dtype=torch.float32)

 # https://github.com/nlp-waseda/JMMLU/blob/main/JMMLU/college_computer_science.csv
 df=pandas.read_csv("college_computer_science.csv",header=None)
 correct=0
 total=0
 for i,row in df.iterrows():
    prompt = f"""USER:{row[0]} 次の選択肢の中からA,B,C,Dのいずれかだけ答えなさい。
 A. {row[1]}
 B. {row[2]}
 C. {row[3]}
 D. {row[4]}
 ASSISTANT:"""

    input_ids = tokenizer(prompt, return_tensors="pt")
    outputs = model.generate(
        **input_ids,
        max_new_tokens=1,
        do_sample=True,
        top_p=0.95,
        temperature=0.2,
        repetition_penalty=1.1,
    )
    sentence=tokenizer.decode(outputs[0])
    print(sentence,f"ANSWER:{row[5]}")
    if(sentence[-1]==row[5]):
        correct+=1
    total+=1

 print("rate:",correct/total)
 # rate: 0.23232323232323232
	import torch
	from transformers import AutoTokenizer,AutoModelForCausalLM
	import pandas

	model_name_or_path = "cyberagent/calm2-7b-chat"
	tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
	model = AutoModelForCausalLM.from_pretrained(model_name_or_path, device_map="cpu", torch_dtype=torch.float32)

	# https://github.com/nlp-waseda/JMMLU/blob/main/JMMLU/college_computer_science.csv
	df=pandas.read_csv("college_computer_science.csv",header=None)
	correct=0
	total=0
	for i,row in df.iterrows():
	prompt = f"""USER:{row[0]} 次の選択肢の中からA,B,C,Dのいずれかだけ答えなさい。
	A. {row[1]}
	B. {row[2]}
	C. {row[3]}
	D. {row[4]}
	ASSISTANT:"""

	input_ids = tokenizer(prompt, return_tensors="pt")
	outputs = model.generate(
	**input_ids,
	max_new_tokens=1,
	do_sample=True,
	top_p=0.95,
	temperature=0.2,
	repetition_penalty=1.1,
	)
	sentence=tokenizer.decode(outputs[0])
	print(sentence,f"ANSWER:{row[5]}")
	if(sentence[-1]==row[5]):
	correct+=1
	total+=1

	print("rate:",correct/total)
	# rate: 0.23232323232323232
No results found