zhangw · February 4, 2024 09:23
diff --git a/fschat-codefuse-codellama-34B-4bits b/fschat-codefuse-codellama-34B-4bits
 python -m fastchat.serve.cli --gptq-wbits 4 --gptq-group 64 --model-path $HOME/.cache/modelscope/hub/codefuse-ai/CodeFuse-CodeLlama-34B-4bits --device cuda --style rich

 python -m fastchat.serve.controller
 python -m fastchat.serve.model_worker --gptq-wbits 4 --gptq-group 64 --model-path $HOME/.cache/modelscope/hub/codefuse-ai/CodeFuse-CodeLlama-34B-4bits --device cuda
 python -m fastchat.serve.test_message --model-name CodeFuse-CodeLlama-34B-4bits
 python -m fastchat.serve.gradio_web_server
	python -m fastchat.serve.cli --gptq-wbits 4 --gptq-group 64 --model-path $HOME/.cache/modelscope/hub/codefuse-ai/CodeFuse-CodeLlama-34B-4bits --device cuda --style rich

	python -m fastchat.serve.controller
	python -m fastchat.serve.model_worker --gptq-wbits 4 --gptq-group 64 --model-path $HOME/.cache/modelscope/hub/codefuse-ai/CodeFuse-CodeLlama-34B-4bits --device cuda
	python -m fastchat.serve.test_message --model-name CodeFuse-CodeLlama-34B-4bits
	python -m fastchat.serve.gradio_web_server
No results found