iqbalxo

iqbalxo

Pinned Loading

AI-Evaluation-And-Benchmarking AI-Evaluation-And-Benchmarking Public

AI evaluation and benchmarking platform with dataset ingestion, LLM-as-a-judge scoring, run tracing observability, and cost-aware model comparison.

Python 4