defaults for quickstart

xzrderek · xzrderek · commit 1e63fcd9bec4 · 2025-11-01T18:47:33.000-07:00
diff --git a/eval_protocol/cli.py b/eval_protocol/cli.py
@@ -391,25 +391,25 @@ def parse_args(args=None):
     rft_parser.add_argument("--base-model", help="Base model resource id")
     rft_parser.add_argument("--warm-start-from", help="Addon model to warm start from")
     rft_parser.add_argument("--output-model", help="Output model id (defaults from evaluator)")
-    rft_parser.add_argument("--epochs", type=int)
-    rft_parser.add_argument("--batch-size", type=int)
-    rft_parser.add_argument("--learning-rate", type=float)
-    rft_parser.add_argument("--max-context-length", type=int)
-    rft_parser.add_argument("--lora-rank", type=int)
-    rft_parser.add_argument("--accelerator-count", type=int)
+    rft_parser.add_argument("--epochs", type=int, default=8)
+    rft_parser.add_argument("--batch-size", type=int, default=128000)
+    rft_parser.add_argument("--learning-rate", type=float, default=3e-5)
+    rft_parser.add_argument("--max-context-length", type=int, default=65536)
+    rft_parser.add_argument("--lora-rank", type=int, default=16)
+    rft_parser.add_argument("--accelerator-count", type=int, default=1)
     rft_parser.add_argument("--region", help="Fireworks region enum value")
     rft_parser.add_argument("--display-name", help="RFT job display name")
     rft_parser.add_argument("--evaluation-dataset", help="Optional separate eval dataset id")
     rft_parser.add_argument("--eval-auto-carveout", dest="eval_auto_carveout", action="store_true", default=True)
     rft_parser.add_argument("--no-eval-auto-carveout", dest="eval_auto_carveout", action="store_false")
     # Rollout chunking
-    rft_parser.add_argument("--chunk-size", type=int, help="Data chunk size for rollout batching")
+    rft_parser.add_argument("--chunk-size", type=int, default=10, help="Data chunk size for rollout batching")
     # Inference params
     rft_parser.add_argument("--temperature", type=float)
     rft_parser.add_argument("--top-p", type=float)
     rft_parser.add_argument("--top-k", type=int)
-    rft_parser.add_argument("--max-tokens", type=int)
-    rft_parser.add_argument("--n", type=int)
+    rft_parser.add_argument("--max-tokens", type=int, default=32768)
+    rft_parser.add_argument("--n", type=int, default=8)
     rft_parser.add_argument("--inference-extra-body", help="JSON string for extra inference params")
     # Wandb
     rft_parser.add_argument("--wandb-enabled", action="store_true")