Felflare · February 10, 2020 03:03 · LifeIsStrange · Oct 23, 2020
diff --git a/XLNet_span_selection_squad b/XLNet_span_selection_squad
 from transformers import XLNetTokenizer, XLNetForQuestionAnsweringSimple
 import torch
 tokenizer = XLNetTokenizer.from_pretrained('xlnet-base-cased')
 model = XLNetForQuestionAnsweringSimple.from_pretrained('xlnet-base-cased')
 input_ids = torch.tensor(tokenizer.encode("Hello, my dog is cute", add_special_tokens=True)).unsqueeze(0)  # Batch size 1
 print(f'Encoded sequence ids -- {input_ids.tolist()[0]}')
 # Encoded sequence ids -- [17, 11368, 19, 94, 2288, 27, 10920, 4, 3]

 start_positions = torch.tensor([1])
 end_positions = torch.tensor([3])
 print(f'Extracted sequence ids -- {input_ids.tolist()[0][start_positions.tolist()[0]:end_positions.tolist()[0]]}')
 # Extracted sequence ids -- [11368, 19]
 print(f'Extracted sequence is -- {tokenizer.decode(input_ids.tolist()[0][start_positions.tolist()[0]:end_positions.tolist()[0]])}')
 # Extracted sequence is -- Hello,
 outputs = model(input_ids, start_positions=start_positions, end_positions=end_positions)
 loss = outputs[0]
 print(f'Loss value of the selected span is -- {loss.tolist()}')
 # Loss value of the selected span is -- 2.9509589672088623
	from transformers import XLNetTokenizer, XLNetForQuestionAnsweringSimple
	import torch
	tokenizer = XLNetTokenizer.from_pretrained('xlnet-base-cased')
	model = XLNetForQuestionAnsweringSimple.from_pretrained('xlnet-base-cased')
	input_ids = torch.tensor(tokenizer.encode("Hello, my dog is cute", add_special_tokens=True)).unsqueeze(0) # Batch size 1
	print(f'Encoded sequence ids -- {input_ids.tolist()[0]}')
	# Encoded sequence ids -- [17, 11368, 19, 94, 2288, 27, 10920, 4, 3]

	start_positions = torch.tensor([1])
	end_positions = torch.tensor([3])
	print(f'Extracted sequence ids -- {input_ids.tolist()[0][start_positions.tolist()[0]:end_positions.tolist()[0]]}')
	# Extracted sequence ids -- [11368, 19]
	print(f'Extracted sequence is -- {tokenizer.decode(input_ids.tolist()[0][start_positions.tolist()[0]:end_positions.tolist()[0]])}')
	# Extracted sequence is -- Hello,
	outputs = model(input_ids, start_positions=start_positions, end_positions=end_positions)
	loss = outputs[0]
	print(f'Loss value of the selected span is -- {loss.tolist()}')
	# Loss value of the selected span is -- 2.9509589672088623