gkamradt · 82deutschmark · Dec 28, 2025
diff --git a/backend/llm_providers.py b/backend/llm_providers.py
@@ -2,7 +2,97 @@
 import json
 from json.decoder import JSONDecodeError
 from openai import OpenAI
-from typing import Dict, Any, Optional
+from typing import Dict, Any, Optional, List, Tuple
+
+
+def _sanitize_env_value(value: Optional[str]) -> Optional[str]:
+    """
+    Clean up env-provided strings that may include surrounding quotes or whitespace.
+    """
+    if value is None:
+        return None
+    cleaned = value.strip()
+    if len(cleaned) >= 2 and (
+        (cleaned[0] == '"' and cleaned[-1] == '"') or (cleaned[0] == "'" and cleaned[-1] == "'")
+    ):
+        cleaned = cleaned[1:-1].strip()
+    return cleaned
+
+
+def _normalize_openai_model_name(model_name: str) -> str:
+    """
+    Allow configs that use OpenRouter-style namespaces like "openai/gpt-4o"
+    while still calling OpenAI directly with the native model id.
+    """
+    if not model_name:
+        return model_name
+    cleaned = str(model_name).strip()
+    if cleaned.startswith("openai/"):
+        return cleaned[len("openai/"):]
+    return cleaned
+
+
+def _build_responses_input(prompt: str) -> List[Dict[str, Any]]:
+    """
+    Build a Responses API compliant input payload.
+    """
+    return [
+        {
+            "role": "user",
+            "content": [{"type": "input_text", "text": prompt}],
+        }
+    ]
+
+
+def _extract_text_from_responses_output(response: Any, *, provider_label: str) -> Tuple[str, int, int]:
+    """
+    Extract (text, input_tokens, output_tokens) from an OpenAI Responses-like payload.
+    """
+    output = getattr(response, "output", None)
+    if output is None and isinstance(response, dict):
+        output = response.get("output")
+    if not output:
+        raise ValueError(f"{provider_label} response missing output field: {response}")
+
+    text = None
+    for item in output:
+        content = getattr(item, "content", None)
+        if content is None and isinstance(item, dict):
+            content = item.get("content")
+        if not content:
+            continue
+
+        for block in content:
+            block_type = getattr(block, "type", None)
+            if block_type is None and isinstance(block, dict):
+                block_type = block.get("type")
+
+            block_text = getattr(block, "text", None)
+            if block_text is None and isinstance(block, dict):
+                block_text = block.get("text")
+
+            if block_text and (block_type in {None, "output_text", "text"}):
+                text = block_text
+                break
+
+        if text:
+            break
+
+    if text is None:
+        text = getattr(response, "output_text", None)
+
+    if not text:
+        raise ValueError(f"{provider_label} response missing text content: {output}")
+
+    usage = getattr(response, "usage", None)
+    if usage is None and isinstance(response, dict):
+        usage = response.get("usage", {})
+
+    input_tokens = getattr(usage, "input_tokens", 0) if usage else 0
+    output_tokens = getattr(usage, "output_tokens", 0) if usage else 0
+
+    return str(text or "").strip(), int(input_tokens or 0), int(output_tokens or 0)
+
 
 class LLMProviderInterface:
     """
@@ -179,12 +269,136 @@ def health_check(self) -> bool:
             return True
 
 
+class OpenAIProvider(LLMProviderInterface):
+    """
+    Direct OpenAI provider using the Responses API.
+    Uses OPENAI_API_KEY and calls /v1/responses via the official OpenAI SDK.
+    """
+
+    def __init__(self, api_key: str, config: Dict[str, Any]):
+        self.client = OpenAI(api_key=_sanitize_env_value(api_key) or api_key)
+        self.model_name = _normalize_openai_model_name(config["model_name"])
+        self.api_type = config.get("api_type", "responses")
+        self.api_kwargs = self.extract_api_kwargs(config)
+
+    def get_response(self, prompt: str) -> Dict[str, Any]:
+        request_kwargs = dict(self.api_kwargs)
+
+        if self.api_type != "responses":
+            raise ValueError("Direct OpenAI provider only supports api_type='responses'")
+
+        # Set reasoning defaults for reasoning models
+        reasoning = request_kwargs.get("reasoning")
+        if not isinstance(reasoning, dict):
+            reasoning = {}
+        if "effort" not in reasoning:
+            reasoning["effort"] = "medium"
+        if "summary" not in reasoning:
+            reasoning["summary"] = "detailed"
+        request_kwargs["reasoning"] = reasoning
+
+        text_config = request_kwargs.get("text")
+        if not isinstance(text_config, dict):
+            text_config = {}
+        if "verbosity" not in text_config:
+            text_config["verbosity"] = "medium"
+        request_kwargs["text"] = text_config
+
+        if "store" not in request_kwargs:
+            request_kwargs["store"] = False
+
+        response = self.client.responses.create(
+            model=self.model_name,
+            input=_build_responses_input(prompt),
+            **request_kwargs,
+        )
+
+        text, input_tokens, output_tokens = _extract_text_from_responses_output(
+            response, provider_label="OpenAI"
+        )
+
+        return {
+            "text": text,
+            "input_tokens": input_tokens,
+            "output_tokens": output_tokens,
+        }
+
+    def health_check(self) -> bool:
+        try:
+            request_kwargs = dict(self.api_kwargs)
+            request_kwargs["max_output_tokens"] = 1
+            if "store" not in request_kwargs:
+                request_kwargs["store"] = False
+
+            self.client.responses.create(
+                model=self.model_name,
+                input=_build_responses_input("test"),
+                **request_kwargs,
+            )
+            return True
+        except Exception as e:
+            error_str = str(e).lower()
+            if "404" in error_str or "model not found" in error_str or "not found" in error_str:
+                return False
+            print(f"Warning: OpenAI health check failed with non-404 error: {e}")
+            return True
+
+
+def _requires_responses_api(model_name: str) -> bool:
+    """
+    Check if a model REQUIRES the Responses API (cannot use ChatCompletions).
+    GPT-5 series and o-series (o3, o4) models only work with Responses API.
+    """
+    if not model_name:
+        return False
+    lower = model_name.lower()
+    if lower.startswith("openai/"):
+        lower = lower[7:]
+
+    # GPT-5 series
+    if lower.startswith("gpt-5"):
+        return True
+
+    # o-series reasoning models (o3, o4, etc.)
+    if lower.startswith("o3") or lower.startswith("o4"):
+        return True
+
+    return False
+
+
 def create_llm_provider(player_config: Dict[str, Any]) -> LLMProviderInterface:
     """
     Factory function for creating an LLM provider instance.
-    All models now route through OpenRouter.
+
+    Supports:
+    - OpenRouter (default): OPENROUTER_API_KEY
+    - OpenAI direct: OPENAI_API_KEY + /v1/responses
+
+    GPT-5 and o-series models automatically route to OpenAI directly.
     """
-    if not os.getenv("OPENROUTER_API_KEY"):
+    model_name = str(player_config.get("model_name") or "")
+    normalized_model = _normalize_openai_model_name(model_name)
+
+    openai_api_key = _sanitize_env_value(os.getenv("OPENAI_API_KEY"))
+    openrouter_api_key = _sanitize_env_value(os.getenv("OPENROUTER_API_KEY"))
+
+    # GPT-5 and o-series models MUST use OpenAI directly
+    if _requires_responses_api(model_name):
+        if openai_api_key:
+            return OpenAIProvider(api_key=openai_api_key, config=player_config)
+        else:
+            raise ValueError(
+                f"Model {model_name} requires the Responses API and must use OpenAI directly. "
+                f"Set OPENAI_API_KEY in environment variables."
+            )
+
+    # Prefer OpenAI direct for OpenAI models if key is available
+    if model_name.startswith("openai/") or normalized_model.startswith("gpt-"):
+        if openai_api_key:
+            return OpenAIProvider(api_key=openai_api_key, config=player_config)
+
+    # Default to OpenRouter
+    if not openrouter_api_key:
         raise ValueError("OPENROUTER_API_KEY is not set in the environment variables.")
 
-    return OpenRouterProvider(api_key=os.getenv("OPENROUTER_API_KEY"), config=player_config)
+    return OpenRouterProvider(api_key=openrouter_api_key, config=player_config)