ranfysvalle02 · May 19, 2024 07:09 · ranfysvalle02 · Mar 31, 2024
diff --git a/mdb-agg-genai.py b/mdb-agg-genai.py
 import pymongo
 import os
 from openai import AzureOpenAI

 # Replace with your actual values
 AZURE_OPENAI_ENDPOINT = "https://DEMO.openai.azure.com"
 AZURE_OPENAI_API_KEY = "DEMO" 
 deployment_name = "gpt-4-32k"  # The name of your model deployment
 MDB_URI = ""
 # Authenticate and create client
 az_client = AzureOpenAI(
    api_key=AZURE_OPENAI_API_KEY,
    api_version="2023-03-15-preview",
    azure_endpoint=AZURE_OPENAI_ENDPOINT
 )
 # Connect to your MongoDB instance
 mdb_client = pymongo.MongoClient(MDB_URI)  
 db = mdb_client["sample_mflix"]
 movies_collection = db["movies"]




 MOVIE_DATA = list( movies_collection.find({"imdb.rating":{"$gt":5,"$lt":10}}, {"imdb.rating":1,"genres":1,"_id":0,"year":1,"title":1}).sort("imdb.rating",pymongo.DESCENDING).limit(500))
 QUESTION = """
 Which movie genres have the highest average ratings{ imdb.rating }?

 [response format]
 Genre: { genre }, Average Rating: { avgRating }, Count: { count }

 WHAT IS THE GENRE WITH THE HIGHEST AVERAGE RATING?
 """

 # Generate text using your deployed model
 prompt = "[mongodb atlas collection start]\n\n" + str(MOVIE_DATA) + "[mongodb atlas collection end]\n\n USING ONLY THE PREVIOUS MongoDB data, answer the following question: " + QUESTION
 answer = az_client.chat.completions.create(  
            model=deployment_name,  
            messages=[{"role":"user","content":f"{prompt}"}],  
            stop=None,    
            temperature=0, stream=False
        )  
 print("Which movie genres have the highest average ratings{ imdb.rating }?")
 print(answer.choices[0].message.content)

 print( "NOW FOR THE AGGREGATION PIPELINE MAGIC" )
 agg_pipeline_magic = [
    {"$unwind": "$genres"},
    {
        "$group": {
            "_id": "$genres",
            "avgRating": {"$avg": "$imdb.rating"},
            "count": {"$sum": 1},
        }
    },
    {"$sort": {"avgRating": -1}},
    {"$limit": 1},
 ]
 MOVIE_DATA = list( movies_collection.aggregate(agg_pipeline_magic))
 prompt = "[mongodb atlas collection start]\n\n" + str(MOVIE_DATA) + "[mongodb atlas collection end]\n\n USING ONLY THE PREVIOUS MongoDB data, answer the following question: " + QUESTION
 answer = az_client.chat.completions.create(  
            model=deployment_name,  
            messages=[{"role":"user","content":f"{prompt}"}],  
            stop=None,    
            temperature=0, stream=False
        )  
 print(answer.choices[0].message.content)

 """
 CORRECT ANSWER -- USING AGG MAGIC
 Genre: Film-Noir, Average Rating: 7.397402597402598, Count: 77
 Genre: Short, Average Rating: 7.377574370709382, Count: 442
 Genre: Documentary, Average Rating: 7.365679824561403, Count: 1834
 Genre: News, Average Rating: 7.252272727272728, Count: 44
 Genre: History, Average Rating: 7.1696100917431185, Count: 874
 """
	import pymongo
	import os
	from openai import AzureOpenAI

	# Replace with your actual values
	AZURE_OPENAI_ENDPOINT = "https://DEMO.openai.azure.com"
	AZURE_OPENAI_API_KEY = "DEMO"
	deployment_name = "gpt-4-32k" # The name of your model deployment
	MDB_URI = ""
	# Authenticate and create client
	az_client = AzureOpenAI(
	api_key=AZURE_OPENAI_API_KEY,
	api_version="2023-03-15-preview",
	azure_endpoint=AZURE_OPENAI_ENDPOINT
	)
	# Connect to your MongoDB instance
	mdb_client = pymongo.MongoClient(MDB_URI)
	db = mdb_client["sample_mflix"]
	movies_collection = db["movies"]




	MOVIE_DATA = list( movies_collection.find({"imdb.rating":{"$gt":5,"$lt":10}}, {"imdb.rating":1,"genres":1,"_id":0,"year":1,"title":1}).sort("imdb.rating",pymongo.DESCENDING).limit(500))
	QUESTION = """
	Which movie genres have the highest average ratings{ imdb.rating }?

	[response format]
	Genre: { genre }, Average Rating: { avgRating }, Count: { count }

	WHAT IS THE GENRE WITH THE HIGHEST AVERAGE RATING?
	"""

	# Generate text using your deployed model
	prompt = "[mongodb atlas collection start]\n\n" + str(MOVIE_DATA) + "[mongodb atlas collection end]\n\n USING ONLY THE PREVIOUS MongoDB data, answer the following question: " + QUESTION
	answer = az_client.chat.completions.create(
	model=deployment_name,
	messages=[{"role":"user","content":f"{prompt}"}],
	stop=None,
	temperature=0, stream=False
	)
	print("Which movie genres have the highest average ratings{ imdb.rating }?")
	print(answer.choices[0].message.content)

	print( "NOW FOR THE AGGREGATION PIPELINE MAGIC" )
	agg_pipeline_magic = [
	{"$unwind": "$genres"},
	{
	"$group": {
	"_id": "$genres",
	"avgRating": {"$avg": "$imdb.rating"},
	"count": {"$sum": 1},
	}
	},
	{"$sort": {"avgRating": -1}},
	{"$limit": 1},
	]
	MOVIE_DATA = list( movies_collection.aggregate(agg_pipeline_magic))
	prompt = "[mongodb atlas collection start]\n\n" + str(MOVIE_DATA) + "[mongodb atlas collection end]\n\n USING ONLY THE PREVIOUS MongoDB data, answer the following question: " + QUESTION
	answer = az_client.chat.completions.create(
	model=deployment_name,
	messages=[{"role":"user","content":f"{prompt}"}],
	stop=None,
	temperature=0, stream=False
	)
	print(answer.choices[0].message.content)

	"""
	CORRECT ANSWER -- USING AGG MAGIC
	Genre: Film-Noir, Average Rating: 7.397402597402598, Count: 77
	Genre: Short, Average Rating: 7.377574370709382, Count: 442
	Genre: Documentary, Average Rating: 7.365679824561403, Count: 1834
	Genre: News, Average Rating: 7.252272727272728, Count: 44
	Genre: History, Average Rating: 7.1696100917431185, Count: 874
	"""