morganabc · April 14, 2025 06:01
diff --git a/anthropic.py b/anthropic.py
 #!/usr/bin/env python3
 import json
 import re
 import time

 import httpx
 from fastapi import FastAPI, Request, HTTPException
 from fastapi.responses import Response, StreamingResponse, JSONResponse
 from starlette.middleware.cors import CORSMiddleware

 CLAUDE_BASE_URL = "https://api.anthropic.com/v1/messages"

 app = FastAPI()

 app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],
    allow_methods=["*"],
    allow_headers=["*"],
    allow_credentials=True,
 )


 def get_api_key(headers: dict) -> str:
    auth = headers.get("authorization")
    if auth:
        parts = auth.split(" ")
        if len(parts) > 1:
            return parts[1]
    return


 def format_stream_response_json(claude_response: dict) -> dict:
    typ = claude_response.get("type")
    if typ == "message_start":
        return {
            "id": claude_response["message"]["id"],
            "model": claude_response["message"]["model"],
            "inputTokens": claude_response["message"]["usage"]["input_tokens"],
        }
    elif typ in ("content_block_start", "ping", "content_block_stop", "message_stop"):
        return None
    elif typ == "content_block_delta":
        return {"content": claude_response["delta"]["text"]}
    elif typ == "message_delta":
        return {
            "stopReason": claude_response["delta"].get("stop_reason"),
            "outputTokens": claude_response["usage"]["output_tokens"],
        }
    elif typ == "error":
        return {
            "errorType": claude_response["error"].get("type"),
            "errorMsg": claude_response["error"]["message"],
        }
    else:
        return None


 def claude_to_chatgpt_response(claude_response: dict, meta_info: dict, stream: bool = False) -> dict:
    timestamp = int(time.time())
    completion_tokens = meta_info.get("outputTokens", 0) or 0
    prompt_tokens = meta_info.get("inputTokens", 0) or 0

    if meta_info.get("stopReason") and stream:
        return {
            "id": meta_info.get("id"),
            "object": "chat.completion.chunk",
            "created": timestamp,
            "model": meta_info.get("model"),
            "choices": [
                {
                    "index": 0,
                    "delta": {},
                    "logprobs": None,
                    "finish_reason": "stop",
                }
            ],
            "usage": {
                "prompt_tokens": prompt_tokens,
                "completion_tokens": completion_tokens,
                "total_tokens": prompt_tokens + completion_tokens,
            },
        }

    message_content = claude_response.get("content", "")
    result = {
        "id": meta_info.get("id", "unknown"),
        "created": timestamp,
        "model": meta_info.get("model"),
        "usage": {
            "prompt_tokens": prompt_tokens,
            "completion_tokens": completion_tokens,
            "total_tokens": prompt_tokens + completion_tokens,
        },
        "choices": [{"index": 0}],
    }
    message = {"role": "assistant", "content": message_content}
    if not stream:
        result["object"] = "chat.completion"
        result["choices"][0]["message"] = message
        result["choices"][0]["finish_reason"] = "stop" if meta_info.get("stopReason") == "end_turn" else None
    else:
        result["object"] = "chat.completion.chunk"
        result["choices"][0]["delta"] = message
    return result


 async def stream_generator(response: httpx.Response, model: str):
    meta_info = {"model": model}
    buffer = ""
    regex = re.compile(r"event:\s*.*?\s*\ndata:\s*(.*?)(?=\n\n|\s*$)", re.DOTALL)
    async for chunk in response.aiter_text():
        buffer += chunk
        for match in regex.finditer(buffer):
            try:
                decoded_line = json.loads(match.group(1).strip())
            except Exception:
                continue

            formated_chunk = format_stream_response_json(decoded_line)
            if formated_chunk is None:
                continue
            if formated_chunk.get("errorType", None):
                etyp = formated_chunk.get("errorType")
                emsg  = formated_chunk.get("errorMsg")
                data = {"error": {"type": etyp, "code": etyp, "message": emsg, "param": None}}
                yield f"data: {json.dumps(data)}\n\n"
            
            meta_info["id"] = formated_chunk.get("id", meta_info.get("id"))
            meta_info["model"] = formated_chunk.get("model", meta_info.get("model"))
            meta_info["inputTokens"] = formated_chunk.get("inputTokens", meta_info.get("inputTokens"))
            meta_info["outputTokens"] = formated_chunk.get("outputTokens", meta_info.get("outputTokens"))
            meta_info["stopReason"] = formated_chunk.get("stopReason", meta_info.get("stopReason"))
            transformed_line = claude_to_chatgpt_response(formated_chunk, meta_info, stream=True)
            yield f"data: {json.dumps(transformed_line)}\n\n"

        else:
            try:
                resp = json.loads(buffer)
                etyp = resp["error"]["type"]
                emsg = resp["error"]["message"]
                data = {"error": {"type": etyp, "code": etyp, "message": emsg, "param": None}}
                yield f"data: {json.dumps(data)}\n\n"

            except Exception:
                pass

        last_end = 0
        for m in regex.finditer(buffer):
            last_end = m.end()
        buffer = buffer[last_end:]

    yield "data: [DONE]"


 @app.get("/v1/models")
 async def get_models(request: Request):
    headers = dict(request.headers)
    api_key = get_api_key(headers)
    if not api_key:
        raise HTTPException(status_code=403, detail="Not Allowed")

    async with httpx.AsyncClient() as client:
        anthro_resp = await client.get(
            "https://api.anthropic.com/v1/models",
            headers={
                "x-api-key": api_key,
                "anthropic-version": "2023-06-01",
            },
        )
    if anthro_resp.status_code != 200:
        raise HTTPException(status_code=anthro_resp.status_code, detail="Error getting models")

    data = anthro_resp.json()
    models_list = [
        {"id": m["id"], "object": m["type"], "owned_by": "Anthropic"}
        for m in data.get("data", [])
    ]

    return JSONResponse(content={"object": "list", "data": models_list})


 @app.post("/v1/chat/completions")
 async def chat_completions(request: Request):
    headers = dict(request.headers)
    api_key = get_api_key(headers)
    if not api_key:
        raise HTTPException(status_code=403, detail="Not Allowed")

    try:
        body = await request.json()
    except Exception:
        raise HTTPException(status_code=400, detail="Invalid JSON payload")
    
    model = body.get("model")
    messages = body.get("messages", [])
    temperature = body.get("n", 1)
    max_tokens = body.get("max_tokens", 4096)
    stop = body.get("stop")
    stream = body.get("stream", False)
    
    system_message = next((m for m in messages if m.get("role") == "system"), [])
    filtered_messages = [m for m in messages if m.get("role") != "system"]

    claude_request_body = {
        "model": model,
        "messages": filtered_messages,
        "temperature": temperature,
        "max_tokens": max_tokens,
        "stop_sequences": stop,
        "system": system_message.get("content") if system_message else [],
        "stream": stream,
    }
    
    if not stream:
        async with httpx.AsyncClient(timeout=None) as client:
            claude_resp = await client.post(
                CLAUDE_BASE_URL,
                headers={
                    "Content-Type": "application/json",
                    "x-api-key": api_key,
                    "anthropic-version": "2023-06-01",
                },
                json=claude_request_body,
            )
        
        if claude_resp.status_code != 200:
            print(claude_resp.content)
            return Response(status_code=claude_resp.status_code, content=claude_resp.content)
        
        resp_json = claude_resp.json()
        
        if resp_json.get("type") == "error":
            result = {
                "error": {
                    "message": resp_json.get("error", {}).get("message"),
                    "type": resp_json.get("error", {}).get("type"),
                    "param": None,
                    "code": resp_json.get("error", {}).get("type"),
                }
            }
        else:
            formated_info = {
                "id": resp_json.get("id"),
                "model": resp_json.get("model"),
                "inputTokens": resp_json.get("usage", {}).get("input_tokens"),
                "outputTokens": resp_json.get("usage", {}).get("output_tokens"),
                "stopReason": resp_json.get("stop_reason"),
            }

            content = ""
            try:
                content = resp_json.get("content", [])[0].get("text", "")
            except Exception:
                pass
            result = claude_to_chatgpt_response({"content": content}, formated_info)
        
        return JSONResponse(
            status_code=claude_resp.status_code,
            content=result
        )
    else:
        async def stream_response(model: str, claude_request_body: dict, api_key: str):
            async with httpx.AsyncClient(timeout=None) as client:
                async with client.stream(
                    "POST",
                    CLAUDE_BASE_URL,
                    headers={
                        "Content-Type": "application/json",
                        "x-api-key": api_key,
                        "anthropic-version": "2023-06-01",
                    },
                    json=claude_request_body,
                ) as response:
                    async for event in stream_generator(response, model):
                        yield event
    
        return StreamingResponse(
            stream_response(model, claude_request_body, api_key),
            media_type = "text/event-stream"
        
        )
	#!/usr/bin/env python3
	import json
	import re
	import time

	import httpx
	from fastapi import FastAPI, Request, HTTPException
	from fastapi.responses import Response, StreamingResponse, JSONResponse
	from starlette.middleware.cors import CORSMiddleware

	CLAUDE_BASE_URL = "https://api.anthropic.com/v1/messages"

	app = FastAPI()

	app.add_middleware(
	CORSMiddleware,
	allow_origins=["*"],
	allow_methods=["*"],
	allow_headers=["*"],
	allow_credentials=True,
	)


	def get_api_key(headers: dict) -> str:
	auth = headers.get("authorization")
	if auth:
	parts = auth.split(" ")
	if len(parts) > 1:
	return parts[1]
	return


	def format_stream_response_json(claude_response: dict) -> dict:
	typ = claude_response.get("type")
	if typ == "message_start":
	return {
	"id": claude_response["message"]["id"],
	"model": claude_response["message"]["model"],
	"inputTokens": claude_response["message"]["usage"]["input_tokens"],
	}
	elif typ in ("content_block_start", "ping", "content_block_stop", "message_stop"):
	return None
	elif typ == "content_block_delta":
	return {"content": claude_response["delta"]["text"]}
	elif typ == "message_delta":
	return {
	"stopReason": claude_response["delta"].get("stop_reason"),
	"outputTokens": claude_response["usage"]["output_tokens"],
	}
	elif typ == "error":
	return {
	"errorType": claude_response["error"].get("type"),
	"errorMsg": claude_response["error"]["message"],
	}
	else:
	return None


	def claude_to_chatgpt_response(claude_response: dict, meta_info: dict, stream: bool = False) -> dict:
	timestamp = int(time.time())
	completion_tokens = meta_info.get("outputTokens", 0) or 0
	prompt_tokens = meta_info.get("inputTokens", 0) or 0

	if meta_info.get("stopReason") and stream:
	return {
	"id": meta_info.get("id"),
	"object": "chat.completion.chunk",
	"created": timestamp,
	"model": meta_info.get("model"),
	"choices": [
	{
	"index": 0,
	"delta": {},
	"logprobs": None,
	"finish_reason": "stop",
	}
	],
	"usage": {
	"prompt_tokens": prompt_tokens,
	"completion_tokens": completion_tokens,
	"total_tokens": prompt_tokens + completion_tokens,
	},
	}

	message_content = claude_response.get("content", "")
	result = {
	"id": meta_info.get("id", "unknown"),
	"created": timestamp,
	"model": meta_info.get("model"),
	"usage": {
	"prompt_tokens": prompt_tokens,
	"completion_tokens": completion_tokens,
	"total_tokens": prompt_tokens + completion_tokens,
	},
	"choices": [{"index": 0}],
	}
	message = {"role": "assistant", "content": message_content}
	if not stream:
	result["object"] = "chat.completion"
	result["choices"][0]["message"] = message
	result["choices"][0]["finish_reason"] = "stop" if meta_info.get("stopReason") == "end_turn" else None
	else:
	result["object"] = "chat.completion.chunk"
	result["choices"][0]["delta"] = message
	return result


	async def stream_generator(response: httpx.Response, model: str):
	meta_info = {"model": model}
	buffer = ""
	regex = re.compile(r"event:\s.?\s\ndata:\s(.?)(?=\n\n\|\s$)", re.DOTALL)
	async for chunk in response.aiter_text():
	buffer += chunk
	for match in regex.finditer(buffer):
	try:
	decoded_line = json.loads(match.group(1).strip())
	except Exception:
	continue

	formated_chunk = format_stream_response_json(decoded_line)
	if formated_chunk is None:
	continue
	if formated_chunk.get("errorType", None):
	etyp = formated_chunk.get("errorType")
	emsg = formated_chunk.get("errorMsg")
	data = {"error": {"type": etyp, "code": etyp, "message": emsg, "param": None}}
	yield f"data: {json.dumps(data)}\n\n"

	meta_info["id"] = formated_chunk.get("id", meta_info.get("id"))
	meta_info["model"] = formated_chunk.get("model", meta_info.get("model"))
	meta_info["inputTokens"] = formated_chunk.get("inputTokens", meta_info.get("inputTokens"))
	meta_info["outputTokens"] = formated_chunk.get("outputTokens", meta_info.get("outputTokens"))
	meta_info["stopReason"] = formated_chunk.get("stopReason", meta_info.get("stopReason"))
	transformed_line = claude_to_chatgpt_response(formated_chunk, meta_info, stream=True)
	yield f"data: {json.dumps(transformed_line)}\n\n"

	else:
	try:
	resp = json.loads(buffer)
	etyp = resp["error"]["type"]
	emsg = resp["error"]["message"]
	data = {"error": {"type": etyp, "code": etyp, "message": emsg, "param": None}}
	yield f"data: {json.dumps(data)}\n\n"

	except Exception:
	pass

	last_end = 0
	for m in regex.finditer(buffer):
	last_end = m.end()
	buffer = buffer[last_end:]

	yield "data: [DONE]"


	@app.get("/v1/models")
	async def get_models(request: Request):
	headers = dict(request.headers)
	api_key = get_api_key(headers)
	if not api_key:
	raise HTTPException(status_code=403, detail="Not Allowed")

	async with httpx.AsyncClient() as client:
	anthro_resp = await client.get(
	"https://api.anthropic.com/v1/models",
	headers={
	"x-api-key": api_key,
	"anthropic-version": "2023-06-01",
	},
	)
	if anthro_resp.status_code != 200:
	raise HTTPException(status_code=anthro_resp.status_code, detail="Error getting models")

	data = anthro_resp.json()
	models_list = [
	{"id": m["id"], "object": m["type"], "owned_by": "Anthropic"}
	for m in data.get("data", [])
	]

	return JSONResponse(content={"object": "list", "data": models_list})


	@app.post("/v1/chat/completions")
	async def chat_completions(request: Request):
	headers = dict(request.headers)
	api_key = get_api_key(headers)
	if not api_key:
	raise HTTPException(status_code=403, detail="Not Allowed")

	try:
	body = await request.json()
	except Exception:
	raise HTTPException(status_code=400, detail="Invalid JSON payload")

	model = body.get("model")
	messages = body.get("messages", [])
	temperature = body.get("n", 1)
	max_tokens = body.get("max_tokens", 4096)
	stop = body.get("stop")
	stream = body.get("stream", False)

	system_message = next((m for m in messages if m.get("role") == "system"), [])
	filtered_messages = [m for m in messages if m.get("role") != "system"]

	claude_request_body = {
	"model": model,
	"messages": filtered_messages,
	"temperature": temperature,
	"max_tokens": max_tokens,
	"stop_sequences": stop,
	"system": system_message.get("content") if system_message else [],
	"stream": stream,
	}

	if not stream:
	async with httpx.AsyncClient(timeout=None) as client:
	claude_resp = await client.post(
	CLAUDE_BASE_URL,
	headers={
	"Content-Type": "application/json",
	"x-api-key": api_key,
	"anthropic-version": "2023-06-01",
	},
	json=claude_request_body,
	)

	if claude_resp.status_code != 200:
	print(claude_resp.content)
	return Response(status_code=claude_resp.status_code, content=claude_resp.content)

	resp_json = claude_resp.json()

	if resp_json.get("type") == "error":
	result = {
	"error": {
	"message": resp_json.get("error", {}).get("message"),
	"type": resp_json.get("error", {}).get("type"),
	"param": None,
	"code": resp_json.get("error", {}).get("type"),
	}
	}
	else:
	formated_info = {
	"id": resp_json.get("id"),
	"model": resp_json.get("model"),
	"inputTokens": resp_json.get("usage", {}).get("input_tokens"),
	"outputTokens": resp_json.get("usage", {}).get("output_tokens"),
	"stopReason": resp_json.get("stop_reason"),
	}

	content = ""
	try:
	content = resp_json.get("content", [])[0].get("text", "")
	except Exception:
	pass
	result = claude_to_chatgpt_response({"content": content}, formated_info)

	return JSONResponse(
	status_code=claude_resp.status_code,
	content=result
	)
	else:
	async def stream_response(model: str, claude_request_body: dict, api_key: str):
	async with httpx.AsyncClient(timeout=None) as client:
	async with client.stream(
	"POST",
	CLAUDE_BASE_URL,
	headers={
	"Content-Type": "application/json",
	"x-api-key": api_key,
	"anthropic-version": "2023-06-01",
	},
	json=claude_request_body,
	) as response:
	async for event in stream_generator(response, model):
	yield event

	return StreamingResponse(
	stream_response(model, claude_request_body, api_key),
	media_type = "text/event-stream"

	)