📝 README – Servicio RAG con HuggingFace Router

📌 Descripción del Proyecto

Este servicio implementa un sistema RAG (Retrieval-Augmented Generation) que:

Consulta un microservicio externo para obtener personas (opcional).
Procesa una pregunta del usuario.
Llama a un modelo LLM a través del HuggingFace Inference Router.
Retorna una respuesta generada por el modelo, usando modo sin pensamiento interno cuando es compatible.

Diseñado para ser simple, modular, fácil de contenerizar en Docker, y usable en proyectos académicos o demostrativos sin necesidad de proveedores con billing activo.

🚀 Endpoints Principales

GET /check_llm

Prueba simple para verificar la conexión con el modelo LLM.

Ejemplo de petición:

{
  "consulta": "¿Qué fecha es hoy?"
}

Ejemplo de respuesta:

{
  "personas": [],
  "answer": "28 de marzo de 2025",
  "raw": {...}
}

🔹 POST /rag

Descripción

Endpoint principal usado por el frontend.
Procesa la consulta del usuario, obtiene los datos del microservicio de personas y devuelve solo la lista mapeada, lista para ser consumida por React.

Body esperado

{
  "consulta": "texto de la consulta"
}

Respuesta

Lista de personas mapeadas:

[
  {
    "id": 1,
    "nombre": "Juan Pérez",
    "edad": 30
  }
]

Si no hay personas:

[]

Errores

500 error interno si falla el RAG o el microservicio.

🔹 POST /rag_full

Descripción

Endpoint completo de depuración (solo para pruebas).
Devuelve:

Personas obtenidas
Respuesta final del LLM
Respuesta cruda del proveedor (HuggingFace Router)

Sirve para verificar que el modelo está respondiendo correctamente, que el pipeline está funcionando y que la integración con HuggingFace Router es correcta.

Body esperado

{
  "consulta": "texto de la consulta"
}

Respuesta

{
  "personas": [
    { "id": 1, "nombre": "Juan Pérez" }
  ],
  "answer": "La respuesta procesada del modelo",
  "raw": { ... respuesta original del modelo ... }
}

Errores

500 si algún componente del pipeline falla.

📝 Notas adicionales

/rag debe ser usado por el frontend en producción.
/rag_full es solo para desarrolladores (debug).
Ambos endpoints esperan el mismo modelo QueryBody.

🛠 Requisitos

Docker
Archivo .env ubicado en la raíz del proyecto

📦 Instrucciones de Docker

🔨 1. Construir la imagen

docker build -t servicio-rag .

▶️ 2. Ejecutar el contenedor con variables de entorno

docker run --env-file .env -p 8000:8000 servicio-rag

Esto levantará el servicio en:

👉 http://localhost:8000
👉 http://localhost:8000/docs

🧩 Formato del archivo `.env`

PERSONS_SERVICE_URL=http://host.docker.internal:3002/persons
GEMINI_API_URL=https://router.huggingface.co/v1/chat/completions
GEMINI_API_KEY=hf_XXXXXXXXXXXXXXXXXXXXXXXXXXX
GEMINI_MODEL=openai/gpt-oss-20b:groq

📁 Estructura del Proyecto (resumen)

app/
 ├── api/
 │    ├── routes_rag.py
 ├── rag/
 │    ├── service.py
 │    ├── llm_client.py
 │    ├── persons_client.py
 │    ├── config.py
 │    └── utils.py
 ├── main.py
Dockerfile
.env
README.txt

🧪 Prueba rápida

curl http://localhost:8000/check_llm

o vía navegador:

👉 http://localhost:8000/docs

🤝 Soporte

Si deseas agregar nuevas fuentes de datos o cambiar de modelo, puedo ayudarte con la extensión del proyecto.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
app		app
tests		tests
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
requirements.txt		requirements.txt
run.sh		run.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

📝 README – Servicio RAG con HuggingFace Router

📌 Descripción del Proyecto

🚀 Endpoints Principales

GET /check_llm

🔹 POST /rag

Descripción

Body esperado

Respuesta

Errores

🔹 POST /rag_full

Descripción

Body esperado

Respuesta

Errores

📝 Notas adicionales

🛠 Requisitos

📦 Instrucciones de Docker

🔨 1. Construir la imagen

▶️ 2. Ejecutar el contenedor con variables de entorno

🧩 Formato del archivo `.env`

📁 Estructura del Proyecto (resumen)

🧪 Prueba rápida

🤝 Soporte

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

📝 README – Servicio RAG con HuggingFace Router

📌 Descripción del Proyecto

🚀 Endpoints Principales

GET /check_llm

🔹 POST /rag

Descripción

Body esperado

Respuesta

Errores

🔹 POST /rag_full

Descripción

Body esperado

Respuesta

Errores

📝 Notas adicionales

🛠 Requisitos

📦 Instrucciones de Docker

🔨 1. Construir la imagen

▶️ 2. Ejecutar el contenedor con variables de entorno

🧩 Formato del archivo .env

📁 Estructura del Proyecto (resumen)

🧪 Prueba rápida

🤝 Soporte

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

🧩 Formato del archivo `.env`

Packages