BlackHC · May 12, 2023 15:08 · drorhilman · May 11, 2023 · BlackHC · May 11, 2023
diff --git a/cached_chat_open_ai.py b/cached_chat_open_ai.py
 # PoC to cache prompts. Drop in your code. 
 # Andreas 'blackhc' Kirsch, 2023

 from typing import List, Optional

 import langchain
 from langchain import OpenAI
 from langchain.cache import SQLiteCache
 from langchain.schema import (
    AIMessage,
    BaseMessage,
    ChatGeneration,
    ChatResult,
    Generation
 )


 langchain.llm_cache = SQLiteCache(".chat.langchain.db")


 class CachedChatOpenAI(ChatOpenAI):
    def _generate(self, messages: List[BaseMessage], *args, **kwargs) -> ChatResult:
        # NOTE: the cache does currently not respect additional arguments beyond the messages.
        messages_prompt = repr(messages)
        if langchain.llm_cache:
            results = langchain.llm_cache.lookup(messages_prompt, self.model_name)
            if results:
                assert len(results) == 1
                result: Generation = results[0]
                chat_result = ChatResult(
                    generations=[ChatGeneration(message=AIMessage(content=result.text))],
                    llm_output=result.generation_info)
                return chat_result
        chat_result = super()._generate(messages, *args, **kwargs)
        if langchain.llm_cache:
            assert len(chat_result.generations) == 1
            result = Generation(
                text=chat_result.generations[0].message.content,
                generation_info=chat_result.llm_output
            )
            langchain.llm_cache.update(messages_prompt, self.model_name, [result])
        return chat_result


 chat_model = CachedChatOpenAI(max_tokens=512, model_kwargs=dict(temperature=0.))
	# PoC to cache prompts. Drop in your code.
	# Andreas 'blackhc' Kirsch, 2023

	from typing import List, Optional

	import langchain
	from langchain import OpenAI
	from langchain.cache import SQLiteCache
	from langchain.schema import (
	AIMessage,
	BaseMessage,
	ChatGeneration,
	ChatResult,
	Generation
	)


	langchain.llm_cache = SQLiteCache(".chat.langchain.db")


	class CachedChatOpenAI(ChatOpenAI):
	def _generate(self, messages: List[BaseMessage], args, *kwargs) -> ChatResult:
	# NOTE: the cache does currently not respect additional arguments beyond the messages.
	messages_prompt = repr(messages)
	if langchain.llm_cache:
	results = langchain.llm_cache.lookup(messages_prompt, self.model_name)
	if results:
	assert len(results) == 1
	result: Generation = results[0]
	chat_result = ChatResult(
	generations=[ChatGeneration(message=AIMessage(content=result.text))],
	llm_output=result.generation_info)
	return chat_result
	chat_result = super()._generate(messages, args, *kwargs)
	if langchain.llm_cache:
	assert len(chat_result.generations) == 1
	result = Generation(
	text=chat_result.generations[0].message.content,
	generation_info=chat_result.llm_output
	)
	langchain.llm_cache.update(messages_prompt, self.model_name, [result])
	return chat_result


	chat_model = CachedChatOpenAI(max_tokens=512, model_kwargs=dict(temperature=0.))