fix test_pytest_tools_are_added_to_row

Dylan Huang · Dylan Huang · commit 67b40d7f4638 · 2025-08-29T11:08:32.000-07:00
diff --git a/tests/pytest/test_pytest_mcp_config.py b/tests/pytest/test_pytest_mcp_config.py
@@ -1,3 +1,4 @@
+from typing_extensions import override
 import pytest
 from eval_protocol.dataset_logger.dataset_logger import DatasetLogger
 from eval_protocol.models import EvaluateResult, EvaluationRow, Message
@@ -48,12 +49,16 @@ class TrackingLogger(DatasetLogger):
         """Custom logger that ensures that the final row is in an error state."""
 
         def __init__(self, rollouts: dict[str, EvaluationRow]):
-            self.rollouts = rollouts
+            self.rollouts: dict[str, EvaluationRow] = rollouts
 
+        @override
         def log(self, row: EvaluationRow):
+            if row.execution_metadata.rollout_id is None:
+                raise ValueError("Rollout ID is None")
             self.rollouts[row.execution_metadata.rollout_id] = row
 
-        def read(self):
+        @override
+        def read(self, row_id: str | None = None) -> list[EvaluationRow]:
             return []
 
     input_messages = [
@@ -82,11 +87,13 @@ def read(self):
     def eval_fn(row: EvaluationRow) -> EvaluationRow:
         return row
 
-    await eval_fn(input_messages=input_messages, completion_params=completion_params_list[0])
+    await eval_fn(input_messages=input_messages[0], completion_params=completion_params_list[0])  # pyright: ignore[reportCallIssue]
 
     # ensure that the row has tools that were set during AgentRolloutProcessor
     assert len(rollouts) == 1
     row = list(rollouts.values())[0]
-    assert sorted([tool["function"].name for tool in row.tools]) == sorted(
+    if row.tools is None:
+        raise ValueError("Row has no tools")
+    assert sorted([tool["function"].name for tool in row.tools]) == sorted(  # pyright: ignore[reportAny]
         ["list_servers", "get_channels", "read_messages"]
     )