DominguesM · July 18, 2023 18:56
diff --git a/llama2.py b/llama2.py
 !pip install -q transformers sentencepiece

 from transformers import AutoTokenizer
 import transformers
 import torch

 model = "meta-llama/Llama-2-13b-chat-hf"

 tokenizer = AutoTokenizer.from_pretrained(model)
 pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    torch_dtype=torch.bfloat16,
    trust_remote_code=True,
    device_map="auto",
 )

 sequences = pipeline(
   "Quem é o presidente do Brasil ?",
    do_sample=True,
    top_k=10,
    num_return_sequences=1,
    eos_token_id=tokenizer.eos_token_id,
 )

 for seq in sequences:
    print(f"Result: {seq['generated_text']}")
	!pip install -q transformers sentencepiece

	from transformers import AutoTokenizer
	import transformers
	import torch

	model = "meta-llama/Llama-2-13b-chat-hf"

	tokenizer = AutoTokenizer.from_pretrained(model)
	pipeline = transformers.pipeline(
	"text-generation",
	model=model,
	tokenizer=tokenizer,
	torch_dtype=torch.bfloat16,
	trust_remote_code=True,
	device_map="auto",
	)

	sequences = pipeline(
	"Quem é o presidente do Brasil ?",
	do_sample=True,
	top_k=10,
	num_return_sequences=1,
	eos_token_id=tokenizer.eos_token_id,
	)

	for seq in sequences:
	print(f"Result: {seq['generated_text']}")