GOROman · October 21, 2025 10:44
diff --git a/run_dpsk_ocr_cpu.py b/run_dpsk_ocr_cpu.py
 from transformers import AutoModel, AutoTokenizer
 import torch
 import os


 model_name = 'deepseek-ai/DeepSeek-OCR'


 tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
 model = AutoModel.from_pretrained(model_name, trust_remote_code=True, use_safetensors=True)
 model = model.eval()



 # prompt = "<image>\nFree OCR. "
 prompt = "<image>\n<|grounding|>Convert the document to markdown. "
 image_file = 'your_image.png'
 output_path = 'output/'



 # infer(self, tokenizer, prompt='', image_file='', output_path = ' ', base_size = 1024, image_size = 640, crop_mode = True, test_compress = False, save_results = False):

 # Tiny: base_size = 512, image_size = 512, crop_mode = False
 # Small: base_size = 640, image_size = 640, crop_mode = False
 # Base: base_size = 1024, image_size = 1024, crop_mode = False
 # Large: base_size = 1280, image_size = 1280, crop_mode = False

 # Gundam: base_size = 1024, image_size = 640, crop_mode = True

 res = model.infer(tokenizer, prompt=prompt, image_file=image_file, output_path = output_path, base_size = 1024, image_size = 640, crop_mode=True, save_results = True, test_compress = True)
	from transformers import AutoModel, AutoTokenizer
	import torch
	import os


	model_name = 'deepseek-ai/DeepSeek-OCR'


	tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
	model = AutoModel.from_pretrained(model_name, trust_remote_code=True, use_safetensors=True)
	model = model.eval()



	# prompt = "<image>\nFree OCR. "
	prompt = "<image>\n<\|grounding\|>Convert the document to markdown. "
	image_file = 'your_image.png'
	output_path = 'output/'



	# infer(self, tokenizer, prompt='', image_file='', output_path = ' ', base_size = 1024, image_size = 640, crop_mode = True, test_compress = False, save_results = False):

	# Tiny: base_size = 512, image_size = 512, crop_mode = False
	# Small: base_size = 640, image_size = 640, crop_mode = False
	# Base: base_size = 1024, image_size = 1024, crop_mode = False
	# Large: base_size = 1280, image_size = 1280, crop_mode = False

	# Gundam: base_size = 1024, image_size = 640, crop_mode = True

	res = model.infer(tokenizer, prompt=prompt, image_file=image_file, output_path = output_path, base_size = 1024, image_size = 640, crop_mode=True, save_results = True, test_compress = True)
No results found