feat(worker): implement vectorization logic and resolve linting issues

PyDevDeep · PyDevDeep · commit c99a456ca8e0 · 2026-04-04T13:24:54.000+03:00
diff --git a/backend/workers/tasks/vectorize_post.py b/backend/workers/tasks/vectorize_post.py
@@ -1,23 +1,62 @@
+"""
+File: backend/workers/tasks/vectorize_post.py
+Task: 6.4.1 - RAG Feedback Loop (Continuous Learning via OpenAI)
+"""
+
 import structlog
+from llama_index.core import Document, StorageContext, VectorStoreIndex
+from llama_index.core.settings import Settings
+from llama_index.embeddings.openai import (  # type: ignore[reportMissingTypeStubs]
+    OpenAIEmbedding,
+)
+from llama_index.vector_stores.qdrant import (  # type: ignore[reportMissingTypeStubs]
+    QdrantVectorStore,
+)
+from qdrant_client import AsyncQdrantClient
 
+from backend.config.settings import settings
 from backend.workers.broker import broker
 
 logger = structlog.get_logger()
 
+# Витягуємо токен безпечно (Pydantic SecretStr)
+_raw_key = settings.OPENAI_API_KEY
+openai_key: str = _raw_key.get_secret_value() if hasattr(_raw_key, "get_secret_value") else str(_raw_key)
+
+# Налаштовуємо глобальну модель для векторизації
+embed_model = OpenAIEmbedding(model=settings.OPENAI_MODEL_EMBEDDING, api_key=openai_key)
+Settings.embed_model = embed_model
+
 
 @broker.task(task_name="vectorize_published_post")
 async def vectorize_published_post_task(content: str, platform: str) -> None:
     """
-    Фонова задача для векторизації опублікованого посту.
-    Додає текст до колекції `doctor_style`, щоб покращувати тон майбутніх генерацій.
+    Векторизує опублікований пост через OpenAI та зберігає його у Qdrant.
     """
     logger.info("vectorization_started", platform=platform)
 
     try:
-        # TODO: Інтегруй сюди свій сервіс LlamaIndex.
-        # Тобі потрібно:
-        # 1. Зробити Document(text=content, metadata={"platform": platform})
-        # 2. Передати його у твій VectorStoreIndex, підключений до колекції `doctor_style`.
+        # 1. Підключаємось до Qdrant
+        qdrant_url = getattr(settings, "QDRANT_URL", "http://127.0.0.1:6333")
+        client = AsyncQdrantClient(url=qdrant_url)
+
+        vector_store = QdrantVectorStore(aclient=client, collection_name="doctor_style")
+        storage_context = StorageContext.from_defaults(vector_store=vector_store)
+
+        # 2. Створюємо документ із метаданими
+        doc = Document(
+            text=content,
+            metadata={
+                "platform": platform,
+                "source": "n8n_feedback_loop",
+                "type": "published_post",
+            },
+        )
+
+        # 3. Векторизуємо та зберігаємо у БД
+        VectorStoreIndex.from_documents(
+            [doc], storage_context=storage_context, show_progress=False
+        )
 
         logger.info("vectorization_success", platform=platform)
     except Exception as e: