pszemraj · November 9, 2022 16:45
diff --git a/README.md b/README.md
diff --git a/perplexity_from_dataset.py b/perplexity_from_dataset.py
 perplexity = evaluate.load("perplexity", module_type="metric")
 input_texts = datasets.load_dataset("wikitext",
                                    "wikitext-2-raw-v1",
                                    split="test")["text"][:50]
 input_texts = [s for s in input_texts if s!='']
 results = perplexity.compute(model_id='gpt2',
                             predictions=input_texts)
 print(list(results.keys()))
 #>>>['perplexities', 'mean_perplexity']
 print(round(results["mean_perplexity"], 2))
 print(round(results["perplexities"][0], 2))
diff --git a/perplexity_simple.py b/perplexity_simple.py
 perplexity = evaluate.load("perplexity", module_type="metric")
 input_texts = ["lorem ipsum", "Happy Birthday!", "Bienvenue"]
 results = perplexity.compute(model_id='gpt2',
                             add_start_token=False,
                             predictions=input_texts)
 print(list(results.keys()))
 # >>>['perplexities', 'mean_perplexity']
 print(round(results["mean_perplexity"], 2))
 print(round(results["perplexities"][0], 2))
	perplexity = evaluate.load("perplexity", module_type="metric")
	input_texts = datasets.load_dataset("wikitext",
	"wikitext-2-raw-v1",
	split="test")["text"][:50]
	input_texts = [s for s in input_texts if s!='']
	results = perplexity.compute(model_id='gpt2',
	predictions=input_texts)
	print(list(results.keys()))
	#>>>['perplexities', 'mean_perplexity']
	print(round(results["mean_perplexity"], 2))
	print(round(results["perplexities"][0], 2))
	perplexity = evaluate.load("perplexity", module_type="metric")
	input_texts = ["lorem ipsum", "Happy Birthday!", "Bienvenue"]
	results = perplexity.compute(model_id='gpt2',
	add_start_token=False,
	predictions=input_texts)
	print(list(results.keys()))
	# >>>['perplexities', 'mean_perplexity']
	print(round(results["mean_perplexity"], 2))
	print(round(results["perplexities"][0], 2))