ranfysvalle02 · October 24, 2023 03:29 · ranfysvalle02 · Oct 24, 2023 · ranfysvalle02 · Oct 24, 2023
diff --git a/Playwright+Langchain+Atlas.py b/Playwright+Langchain+Atlas.py
 from pymongo import MongoClient
 import logging
 from langchain.document_loaders import PlaywrightURLLoader
 from langchain.vectorstores import MongoDBAtlasVectorSearch
 from langchain.embeddings.openai import OpenAIEmbeddings
 from langchain.embeddings import GPT4AllEmbeddings
 gpt4all_embd = GPT4AllEmbeddings()


 LOGGER = logging.getLogger(__name__)  
 logging.basicConfig(level=logging.INFO)  

 URLS = ["https://www.mongodb.com/customers/forbes"]

 MONGODB_URI = "mongodb+srv://abc-dev:[email protected]/test"  
 DATABASE_NAME = ""  
 COLLECTION_NAME = ""

 def main():  
    try:  
        gpt4all_embd = GPT4AllEmbeddings()  
        loader = PlaywrightURLLoader(urls=URLS, remove_selectors=["header", "footer"])  
        data = loader.load()  
  
        with MongoClient(MONGODB_URI) as client:  
            db = client[DATABASE_NAME]  
            collection = db[COLLECTION_NAME]  
            vectorstore = MongoDBAtlasVectorSearch(collection, gpt4all_embd)  
  
            # insert the documents in MongoDB Atlas with their embedding  
            vectorstore.from_documents(data, gpt4all_embd, collection=collection)  
            LOGGER.info("Documents inserted successfully.")  
            
    except Exception as e:  
        LOGGER.error("An error occurred: %s", str(e))  
  
 if __name__ == "__main__":  
    main()
	from pymongo import MongoClient
	import logging
	from langchain.document_loaders import PlaywrightURLLoader
	from langchain.vectorstores import MongoDBAtlasVectorSearch
	from langchain.embeddings.openai import OpenAIEmbeddings
	from langchain.embeddings import GPT4AllEmbeddings
	gpt4all_embd = GPT4AllEmbeddings()


	LOGGER = logging.getLogger(__name__)
	logging.basicConfig(level=logging.INFO)

	URLS = ["https://www.mongodb.com/customers/forbes"]

	MONGODB_URI = "mongodb+srv://abc-dev:[email protected]/test"
	DATABASE_NAME = ""
	COLLECTION_NAME = ""

	def main():
	try:
	gpt4all_embd = GPT4AllEmbeddings()
	loader = PlaywrightURLLoader(urls=URLS, remove_selectors=["header", "footer"])
	data = loader.load()

	with MongoClient(MONGODB_URI) as client:
	db = client[DATABASE_NAME]
	collection = db[COLLECTION_NAME]
	vectorstore = MongoDBAtlasVectorSearch(collection, gpt4all_embd)

	# insert the documents in MongoDB Atlas with their embedding
	vectorstore.from_documents(data, gpt4all_embd, collection=collection)
	LOGGER.info("Documents inserted successfully.")

	except Exception as e:
	LOGGER.error("An error occurred: %s", str(e))

	if __name__ == "__main__":
	main()