fix test

Dylan Huang · Dylan Huang · commit 3e4ed7dd603f · 2025-08-21T21:57:47.000-07:00
diff --git a/tests/test_logs_server.py b/tests/test_logs_server.py
@@ -16,7 +16,7 @@
 from eval_protocol.dataset_logger import default_logger
 from eval_protocol.dataset_logger.dataset_logger import LOG_EVENT_TYPE
 from eval_protocol.event_bus import event_bus
-from eval_protocol.models import EvalMetadata, EvaluationRow, InputMetadata, Message
+from eval_protocol.models import EvalMetadata, EvaluationRow, InputMetadata, Message, Status
 from eval_protocol.utils.logs_server import (
     EvaluationWatcher,
     LogsServer,
@@ -201,7 +201,9 @@ def test_should_update_status_running_process(self, mock_process):
         test_row = EvaluationRow(
             messages=[Message(role="user", content="test")],
             input_metadata=InputMetadata(row_id="test-123"),
-            eval_metadata=EvalMetadata(name="test_eval", num_runs=1, aggregation_method="mean", status="running"),
+            eval_metadata=EvalMetadata(
+                name="test_eval", num_runs=1, aggregation_method="mean", status=Status.rollout_running()
+            ),
             pid=12345,
         )
 
@@ -222,7 +224,9 @@ def test_should_update_status_stopped_process(self, mock_process):
         test_row = EvaluationRow(
             messages=[Message(role="user", content="test")],
             input_metadata=InputMetadata(row_id="test-123"),
-            eval_metadata=EvalMetadata(name="test_eval", num_runs=1, aggregation_method="mean", status="running"),
+            eval_metadata=EvalMetadata(
+                name="test_eval", num_runs=1, aggregation_method="mean", status=Status.rollout_running()
+            ),
             pid=12345,
         )
 
@@ -241,7 +245,9 @@ def test_should_update_status_no_such_process(self, mock_process):
         test_row = EvaluationRow(
             messages=[Message(role="user", content="test")],
             input_metadata=InputMetadata(row_id="test-123"),
-            eval_metadata=EvalMetadata(name="test_eval", num_runs=1, aggregation_method="mean", status="running"),
+            eval_metadata=EvalMetadata(
+                name="test_eval", num_runs=1, aggregation_method="mean", status=Status.rollout_running()
+            ),
             pid=999,
         )
 
@@ -256,7 +262,9 @@ def test_should_update_status_not_running(self):
         test_row = EvaluationRow(
             messages=[Message(role="user", content="test")],
             input_metadata=InputMetadata(row_id="test-123"),
-            eval_metadata=EvalMetadata(name="test_eval", num_runs=1, aggregation_method="mean", status="finished"),
+            eval_metadata=EvalMetadata(
+                name="test_eval", num_runs=1, aggregation_method="mean", status=Status.rollout_finished()
+            ),
             pid=12345,
         )
 
@@ -271,7 +279,9 @@ def test_should_update_status_no_pid(self):
         test_row = EvaluationRow(
             messages=[Message(role="user", content="test")],
             input_metadata=InputMetadata(row_id="test-123"),
-            eval_metadata=EvalMetadata(name="test_eval", num_runs=1, aggregation_method="mean", status="running"),
+            eval_metadata=EvalMetadata(
+                name="test_eval", num_runs=1, aggregation_method="mean", status=Status.rollout_running()
+            ),
             pid=None,
         )