#!/usr/bin/python3
import os
import sys
import json
import time
import configparser
#import pandas as pd

#from pandas import DataFrame as df
#from langchain_together import Together
#from langchain_together.embeddings import TogetherEmbeddings
#from ragas.metrics import (faithfulness, answer_relevancy, context_relevancy, context_utilization, context_recall)
# using ragas==0.1.9
from ragas.metrics import (faithfulness, answer_relevancy, context_relevancy, context_utilization)
from ragas import evaluate
from datasets import Dataset#, load_dataset

def evaluateDataset(num_evaluations, dataset, output_file):
  for n in range(0,num_evaluations):

    #results = evaluate(dataset, metrics=[faithfulness,context_utilization,context_relevancy,answer_relevancy], raise_exceptions=False)
    results = evaluate(dataset, metrics=[faithfulness,answer_relevancy, context_relevancy, context_utilization])
    print(results)
    with open(output_file, "a") as the_data:
        the_data.write(",\n")
        the_data.write(json.dumps(results, indent=2))
    time.sleep(20)


config = configparser.ConfigParser()
#config.read('/home/shebes/Coding/gn-ai/gnqa/paper1_eval/src/_config.cfg')
config.read('/code/paper1_eval/src/_config.cfg')

os.environ["OPENAI_API_KEY"] = config['key.api']['openai2']
together_key = config['key.api']['togetherai']

#embeddings = TogetherEmbeddings(model="togethercomputer/m2-bert-80M-8k-retrieval")
#embeddings = TogetherEmbeddings(model="togethercomputer/m2-bert-80M-32k-retrieval")

#together_completion = Together(
    #model="NousResearch/Nous-Hermes-2-Mixtral-8x7B-SFT",
    #model="togethercomputer/Llama-2-7B-32K-Instruct",
    #model="meta-llama/Llama-3-70b-chat-hf",
#    model="google/gemma-7b-it",
#    temperature=0.8,
#    max_tokens=4000,
#    top_k=1,
#    together_api_key=together_key
#)

read_file = str(sys.argv[1])
outp_file = str(sys.argv[2])
num_evals = int(sys.argv[3])

print(read_file)
print(outp_file)

with open(read_file, "r") as r_file:
    data = json.load(r_file)

dataset = Dataset.from_dict(data)
print(dataset)
evaluateDataset(num_evals, dataset, outp_file)
"""
results = evaluate(
    dataset,
    metrics=[faithfulness,answer_relevancy,context_relevancy,context_utilization],
    llm=together_completion,
    embeddings=embeddings)
"""